Wat is generatieve AI?

Waarom generatieve AI fundamenteel anders is

Traditionele AI classificeert: "Dit is een kat." "Dit is spam." "Deze klant zal churnen." Generatieve AI creëert: nieuwe tekst, nieuwe beelden, nieuwe muziek die nooit eerder bestond.

Het klinkt als magie, maar het mechanisme is verrassend intuïtief: het model heeft zo veel voorbeelden gezien dat het kan "interpoleren" tussen bestaande voorbeelden om iets nieuws te maken. Het genereren van "een foto van een astronaut te paard op de maan" combineert concepten die het model apart kent.

De twee architecturen die de revolutie drijven

Transformers voor tekst

GPT (Generative Pre-trained Transformer) werkt door te voorspellen wat het volgende woord moet zijn, gegeven alle voorgaande woorden. Dit klinkt simpel, maar de schaal maakt het krachtig. GPT-4 heeft naar schatting 13 biljoen tokens (woord-achtige eenheden) gelezen tijdens training.

Het verrassende: Niemand programmeerde grammatica, logica, of kennis. Het model ontdekte deze concepten zelf, puur door patronen te herkennen in tekst. Dit is waarom taalmodellen soms "emergent abilities" tonen - vaardigheden die onderzoekers niet verwachtten.

Diffusion voor beelden

DALL-E, Midjourney, en Stable Diffusion werken via "diffusion": begin met ruis, en leer stap voor stap de ruis te verwijderen tot een coherent beeld ontstaat. Het model leert: "Gegeven deze ruisige versie, wat moet de minder ruisige versie zijn?"

Dit is efficiënter dan pixel voor pixel genereren en leidt tot meer coherente beelden. De "guidance" (je prompt) stuurt het de-ruis proces naar het gewenste resultaat.

Wat de benchmarks niet vertellen

AI-bedrijven adverteren met benchmarks: "95% op MMLU!", "Beats GPT-4 on reasoning!" Wat ze niet vertellen:

Benchmarks worden "gelekt": Als een model direct of indirect benchmark-vragen in z'n trainingsdata heeft gezien, zijn de scores betekenisloos.
Gemiddelden verbergen variatie: Een model kan 95% scoren op algemene kennis maar falen op specifieke domeinen die voor jou cruciaal zijn.
Reële taken ≠ benchmarks: Hoe goed een model meerkeuze-vragen beantwoordt, voorspelt niet hoe goed het je e-mails schrijft.

De economie achter generatieve AI

Trainingskosten zijn astronomisch. GPT-4 kostte naar schatting €100 miljoen+ aan compute. Maar de inference kosten (daadwerkelijk gebruiken) zijn relatief laag: €2-4 per miljoen tokens voor de beste modellen.

Dit creëert een interessante dynamiek: de grote labs (OpenAI, Google, Anthropic) investeren miljarden, en kleinere spelers bouwen bovenop hun APIs. Er is geen weg naar winstgevendheid via model-training voor nieuwkomers - maar er is wel geld te verdienen met applicaties.

Praktische limieten die niemand adverteert

Tekst: Consistency over lange stukken

Vraag een LLM om een roman te schrijven en je krijgt inconsistenties: personages die van naam veranderen, plotlijnen die verdwijnen, toon die wisselt. Het model heeft geen "geheugen" buiten z'n context window - het "vergeet" wat het eerder schreef als het te lang geleden is.

Beelden: Handen, tekst, en specifieke objecten

Vraag om een afbeelding van iemand die een bord vasthoudt met "Hello World" erop en je krijgt chaos. Diffusion modellen worstelen met tekst in beelden, anatomisch correcte handen, en specifieke objecten die exact moeten kloppen. Ze "hallucineren" extra vingers of onleesbare letters.

Audio/Video: Temporal consistency

AI-gegenereerde video's hebben een probleem: objecten "morphen" onnatuurlijk tussen frames. Een gezicht verandert subtiel van vorm, een achtergrond flikkert. Menselijke ogen detecteren dit onbewust als "uncanny".

De echte use cases die werken

Na alle hype, dit is waar generatieve AI daadwerkelijk waarde levert:

Eerste drafts: AI schrijft de eerste versie, mens refineert
Variatie generatie: 20 versies van een advertentietekst, test welke werkt
Code assistentie: Boilerplate genereren, bugs uitleggen, documentatie schrijven
Brainstormen: Ideeën genereren die een mens kan cureren
Vertaling en aanpassing: Content lokaliseren naar andere talen/tonen
Synthese: Grote hoeveelheden tekst samenvatten tot bruikbare insights

De gemene deler: AI als versterker van menselijke capaciteit, niet als vervanging. De beste resultaten komen van mens-AI samenwerking.