De Transformer: Een Uitvinding die Alles Veranderde
In juni 2017 publiceerden acht Google-onderzoekers een artikel van twaalf pagina’s. Ze wisten het nog niet, maar ze hadden net het lont aangestoken van een revolutie die de mensheid zou transformeren.
De Transformer — zo heet hij — verving terugkerende neurale netwerken door een aandachtsmechanisme dat massale parallellisatie van gegevensverwerking mogelijk maakt. In tegenstelling tot eerdere architecturen die woorden één voor één verwerkten, ziet de Transformer de hele zin in één keer. Dat subtiele verschil verandert alles.
Zes jaar later, in januari 2026, domineert het open source ecosysteem de wereldwijde kunstmatige intelligentie. Wat ooit slechts een academisch aanvulling was op proprietaire giganten, is de motor van industriële innovatie geworden. Hoe zijn we hier gekomen?
De Eerste Pioniers (2018-2021)
GPT-2: De Vonk die de Gemeenschap Wakker Schudde
Juni 2018. OpenAI publiceert GPT-2. Het model is eng — zo eng dat OpenAI aarzelt om het openbaar te maken. Hun argument? Het vermogen om coherente tekst te genereren zou desinformatie kunnen voeden.
Slechte berekening. De gemeenschap verdraagt het niet dat speelgoed voor hen verborgen wordt. Wanneer GPT-2 uiteindelijk onder MIT-licentie wordt vrijgegeven, grijpen onderzoekers wereldwijd het aan. Een collectief vormt zich: EleutherAI. Hun missie? Bewijzen dat je modellen met miljarden parameters kunt trainen zonder de middelen van een multinational.
"We wilden bewijzen dat open wetenschap geen miljarden dollars nodig had om vooruit te komen."
Google Slaat Terug met BERT en T5
Ondertussen blijft Google niet stilzitten. BERT (oktober 2018) revolutioneert bidirectioneel taalbegrip. T5 (februari 2020) stelt een unified framework voor waarbij elke taak een tekst-naar-tekst transformatie wordt.
Deze modellen, gepubliceerd onder Apache 2.0, worden de basis van duizenden academische onderzoeksprojecten. Ze bewijzen één essentieel ding: massaal pre-training gevolgd door fine-tuning is de koninklijke weg.
Eerste Successen van de Gemeenschap
In maart 2021 publiceert EleutherAI GPT-Neo met 2,7 miljard parameters. Het is een technisch succes: het model concurreert met GPT-3 van die tijd, volledig getraind op compute-donaties en vrijwilligerswerk.
De boodschap is duidelijk: open source kan het opnemen tegen de giganten.
2022: Open Wetenschap Onder Druk
BigScience en BLOOM: Een Ongekende Benadering
Het jaar 2022 markeert een keerpunt. OpenAI sluit zijn modellen achter betaalde API’s. De gemeenschap reageert anders.
BigScience, gecoördineerd door Hugging Face, brengt 1.000 onderzoekers uit 60 landen samen. Hun doel? Het grootste meertalige open source model ooit bouwen. Het resultaat: BLOOM, 176 miljard parameters, 46 talen, 13 programmeertalen.
Wat BLOOM historisch maakt, is niet de omvang. Het is de totale transparantie: publieke trainingsgegevens, open source code, volledig trainingslogboek. Voor het eerst kunnen we echt begrijpen hoe een LLM is geboren.
Meta Slaat Hard toe met OPT
Bijna gelijktijdig lanceert Meta AI OPT (Open Pre-trained Transformer). Dezelfde grootte als GPT-3, maar met één cruciaal verschil: complete documentatie van het trainingsproces.
Onderzoekers kunnen eindelijk een model van deze schaal bestuderen zonder reverse engineering.
Galactica: Een Premonitie
November 2022. Meta probeert AI te specialiseren met Galactica, gewijd aan wetenschappelijke literatuur. Het model wordt binnen 48 uur teruggetrokken na kritiek op hallucinaties.
Mislukking? Niet helemaal. Galactica legt de basis voor training op gespecialiseerde corpora. Een trend die drie jaar later zou exploderen.
2023: Het Jaar dat Alles Veranderde
24 Februari 2023: Het Llama-effect
Die dag publiceert Meta Llama. Het model is niet bedoeld voor het grote publiek — alleen onderzoek. Maar de gewichten lekken binnen enkele dagen online.
De vonk van een revolutie.
Llama bewijst dat een bescheidener model (7 tot 65 miljard parameters) getraind op meer tokens giganten kan overtreffen. De gemeenschap grijpt het onmiddellijk.
| Model | Datum | Belangrijkste Innovatie | Licentie |
|---|---|---|---|
| Alpaca | Maart 2023 | Low-cost fine-tuning via self-instruct | Niet-commercieel |
| Vicuna | April 2023 | 90% ChatGPT-kwaliteit voor $500 trainingskosten | Niet-commercieel |
| Falcon 40B | Juni 2023 | Eerste open source model dat benchmarks domineert | Apache 2.0 |
| Mistral 7B | Oktober 2023 | Extreme efficiëntie via Sliding Window Attention | Apache 2.0 |
| Mixtral 8x7B | December 2023 | Mixture of Experts (MoE) gedemocratiseerd | Apache 2.0 |
QLoRA: Lokale Democratisering
April 2023. Een techniek verandert alles: QLoRA (Quantized Low-Rank Adaptation).
Resultaat? Fine-tune een model van 65 miljard parameters op één enkele consumer GPU. Kleine bedrijven kunnen nu hun eigen AI creëren zonder massale infrastructuur.
De barrières vallen één voor één.
2024-2025: Technische Pariteit
DeepSeek: China Betreedt het Podium
De zomer van 2024 markeert de aankomst van een belangrijke nieuwe speler: DeepSeek, een Chinees laboratorium gelieerd aan High-Flyer Quant.
Hun meesterzet? Een ultra-efficiënte MoE-architectuur en het MLA (Multi-head Latent Attention) mechanisme dat de behoefte aan KV-cache geheugen met 93% vermindert.
Resultaat in januari 2025: DeepSeek-V3 evenaart GPT-4 voor een fractie van de kosten. De internationale gemeenschap ontdekt dat open source geen volger meer is — het is de leider.
OpenAI Geeft toe aan de Druk
Augustus 2025. OpenAI, na jaren van geslotenheid, publiceert GPT-OSS. Eerste open weights model sinds GPT-2. Geoptimaliseerd voor agentic workflows en lange context.
Waarom deze ommezwaai? De concurrentiedruk van open source was te groot geworden. Wanneer vrije modellen de jouwe evenaren, is sluiten niet meer voldoende.
Meta Reageert met Llama 4
Metas onmiddellijke reactie: Llama 4. Inheems multimodaal, in staat om 10 miljoen context tokens te verwerken.
Stel je voor: een volledige codebase analyseren in één enkele query. Het is nu mogelijk — en gratis.
Januari 2026: Open Source Domineert
Ranglijst van de Beste Modellen
Hier zijn we vandaag:
| Rang | Model | Ontwikkelaar | Kwaliteitsscore | Specialiteit |
|---|---|---|---|---|
| 1 | Kimi K2.5 (Reasoning) | Moonshot AI | 46,77 | Wiskunde, complex redeneren |
| 2 | GLM-4.7 (Thinking) | Zhipu AI | 41,70 | Coderen, Vision-Taal |
| 3 | DeepSeek V3.2 | DeepSeek | 41,20 | Efficiëntie, lage inferentiekosten |
| 4 | GPT-OSS-120B | OpenAI | 40,50 | Tool-gebruik, agentic |
| 5 | Llama 4 (70B) | Meta | 39,80 | Multimodaliteit, ecosysteem |
| 6 | Qwen3-235B | Alibaba | 39,20 | Meertaligheid, RAG |
Het oordeel is brutaal: 5 van de top 6 modellen zijn open source. Alleen GPT-OSS, ironisch genoeg, draagt de naam van een voormalige proprietaire leider.
Innovaties die het Spel Veranderden
MLA en DeepSeek Sparse Attention: Het verwerken van miljoenen context tokens vereiste een verboden KV-cache geheugen. MLA comprimeert deze cache agressief. DSA vermindert de berekeningscomplexiteit door alleen relevante sequentiedelen te verwerken.
BitNet 1.58b: De meest radicale innovatie van 2025. In plaats van gewichten op 16 bits te coderen, gebruikt BitNet ternaire waarden {-1, 0, 1} — ongeveer 1,58 bit per parameter.
Gevolg:
- 70-80% reductie in energieverbruik
- 2,3x tot 6,1x versnelling op standaard CPU’s
- Een model van 100 miljard parameters dat draait op een standaard desktop computer
AI-sovereiniteit is geen droom meer. Het is technische werkelijkheid.
Lokale Inferentie Wordt Standaard
De RTX 5090: Hart van AI Werkstations
Begin 2025 lanceert NVIDIA de RTX 5090. 32 GB GDDR7 geheugen, 1,79 TB/s bandbreedte (+77% vs vorige generatie).
Resultaten op een consumer kaart:
- Llama 4 8B (4-bit): 180 tokens/seconde
- DeepSeek-R1 14B (4-bit): 89 tokens/seconde
- Qwen 2.5 32B (4-bit): 45 tokens/seconde
70B+ modellen draaien nu op lokale multi-GPU configuraties met industriële prestaties.
vLLM vs Ollama
Twee ecosystemen domineren:
- vLLM: Standaard voor productie. PagedAttention engine, geoptimaliseerd KV-cache beheer, meerdere gelijktijdige gebruikers.
- Ollama: Favoriet van ontwikkelaars. Extreme eenvoud, zero configuratie, native macOS/Linux/Windows ondersteuning.
Het Agentische Tijdperk: Van Chat naar Actie
Devstral 2: AI in Dienst van Code
December 2025. Mistral AI lanceert Devstral 2, 123 miljard parameters geoptimaliseerd voor softwareontwikkeling.
SWE-bench Verified score: 72,2%. Gelijk aan Claude Sonnet 4, maar zeven keer zo duur.
Prijs: $0,40 per miljoen tokens. AI-ondersteunde ontwikkeling wordt economisch haalbaar voor MKB’ers en zelfstandigen.
Vibe CLI: AI die Zelf Programmeert
Dezelfde maand lanceert Mistral Vibe CLI. Deze tool orkestreert autonoom complexe wijzigingen in volledige codebases.
De agentische modellen van 2026 kunnen:
- Navigeren in complexe bestandssystemen
- Afhankelijkheden tussen frameworks identificeren
- Testfouten detecteren en zichzelf corrigeren
- Betrouwbaar gestructureerde JSON-uitvoer produceren voor software-integratie
We gaan van “chat AI” naar “actie AI”.
Regulering: Wat Blijft er Over van Open?
OSAID 1.0: De Officiële Definitie
Oktober 2024. De Open Source Initiative publiceert eindelijk een officiële definitie van Open Source AI.
Om als open source te kwalificeren, moet een systeem vier vrijheden garanderen: gebruiken, studeren, wijzigen en delen. Drie essentiële componenten:
- Code: Complete pre-training, filtering en inferentie code
- Parameters: Gewichten, optimizer instellingen, architectuur configuraties
- Gegevens: Gedetailleerde documentatie over herkomst, selectie en verwerking
Resultaat? De meeste huidige “open source” modellen zijn niet conform. Llama 4, Mistral, zelfs GPT-OSS missen totale gegevenstransparantie.
Alleen Pythia (EleutherAI) en OLMo (AI2) verdienen het label “echt open source”.
De EU AI Act Structureert de Markt
Sinds februari 2025 geldt de EU AI Act. Open source modellen profiteren van significante vrijstellingen — op voorwaarde dat ze niet worden geclassificeerd als “systemisch risico”.
Voor modellen die 10^25 FLOPs overschrijden, gelden documentatie- en cyberbeveiligingsverplichtingen, ongeacht de licentie.
2026-2030: Wat Komt Eraan
Trends die Vorm Krijgen
Post-Transformer: Nieuwe architecturen ontstaan om de kwadratische complexiteit van aandacht te verminderen. BitNet is slechts het begin.
Edge AI: Modellen zoals Ministral 3B draaien op smartphones met massieve context. Domotica en persoonlijke robotica zullen exploderen.
Intelligentie Soevereiniteit: Bedrijven willen intelligentie niet meer “huren” via API’s. Ze willen hun eigen digitale breinen bezitten, getraind op hun industriële geheimen.
Multi-Agent Samenwerking: De toekomst ligt in communicatie tussen modellen van verschillende aanbieders. Problemen oplossen door samenwerking in plaats van monolithische brute kracht.
Het Nieuwe SEO Paradigma
De massale integratie van LLM in zoekmachines heeft online zichtbaarheid getransformeerd. We hebben het nu over GEO (Generative Engine Optimization).
In 2026 wordt ongeveer 25% van de traditionele organische traffic gevangen door AI-gegenereerde directe antwoorden. Gebruikers klikken niet meer — ze lezen de synthese.
Voor een merk wordt succes niet meer gemeten aan Google-ranking. Het wordt gemeten aan frequentie en stabiliteit van citaten in de generatieve antwoorden van Gemini 3 of GPT-5.
En Nu?
Het open source ecosysteem van 2026 heeft één ding bewezen: transparantie en samenwerking zijn geen ethische idealen, het zijn superieure concurrentievoordeel.
Door intelligentiemonopolies te doorbreken, heeft open source AI getransformeerd van een exclusieve dienst naar wereldwijde publieke infrastructuur — zo fundamenteel als elektriciteit of internet.
Technische pariteit is bereikt. De volgende grens? Totale systeemautonomie in dienst van de mensheid.
Massieve generalistische modellen worden aangevuld, soms vervangen, door sterrenbeelden van gespecialiseerde, spaarzamere, preciezere, soevereinere modellen.
Open source heeft gewonnen. De rest is slechts geschiedenis.