Ga naar hoofdinhoud
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer AI Soevereiniteit

Open Source Won: Hoe Vrije AI de Wereld Veroverde (2017-2026)

By Yoram Halberstam 35 min read

De Transformer: Een Uitvinding die Alles Veranderde

In juni 2017 publiceerden acht Google-onderzoekers een artikel van twaalf pagina’s. Ze wisten het nog niet, maar ze hadden net het lont aangestoken van een revolutie die de mensheid zou transformeren.

De Transformer — zo heet hij — verving terugkerende neurale netwerken door een aandachtsmechanisme dat massale parallellisatie van gegevensverwerking mogelijk maakt. In tegenstelling tot eerdere architecturen die woorden één voor één verwerkten, ziet de Transformer de hele zin in één keer. Dat subtiele verschil verandert alles.

Zes jaar later, in januari 2026, domineert het open source ecosysteem de wereldwijde kunstmatige intelligentie. Wat ooit slechts een academisch aanvulling was op proprietaire giganten, is de motor van industriële innovatie geworden. Hoe zijn we hier gekomen?

2017
Het jaar van de Transformer
2023
Het Llama-effect
2026
Technische pariteit bereikt

De Eerste Pioniers (2018-2021)

GPT-2: De Vonk die de Gemeenschap Wakker Schudde

Juni 2018. OpenAI publiceert GPT-2. Het model is eng — zo eng dat OpenAI aarzelt om het openbaar te maken. Hun argument? Het vermogen om coherente tekst te genereren zou desinformatie kunnen voeden.

Slechte berekening. De gemeenschap verdraagt het niet dat speelgoed voor hen verborgen wordt. Wanneer GPT-2 uiteindelijk onder MIT-licentie wordt vrijgegeven, grijpen onderzoekers wereldwijd het aan. Een collectief vormt zich: EleutherAI. Hun missie? Bewijzen dat je modellen met miljarden parameters kunt trainen zonder de middelen van een multinational.

"We wilden bewijzen dat open wetenschap geen miljarden dollars nodig had om vooruit te komen."

— Connor Leahy, oprichter van EleutherAI

Google Slaat Terug met BERT en T5

Ondertussen blijft Google niet stilzitten. BERT (oktober 2018) revolutioneert bidirectioneel taalbegrip. T5 (februari 2020) stelt een unified framework voor waarbij elke taak een tekst-naar-tekst transformatie wordt.

Deze modellen, gepubliceerd onder Apache 2.0, worden de basis van duizenden academische onderzoeksprojecten. Ze bewijzen één essentieel ding: massaal pre-training gevolgd door fine-tuning is de koninklijke weg.

Eerste Successen van de Gemeenschap

In maart 2021 publiceert EleutherAI GPT-Neo met 2,7 miljard parameters. Het is een technisch succes: het model concurreert met GPT-3 van die tijd, volledig getraind op compute-donaties en vrijwilligerswerk.

De boodschap is duidelijk: open source kan het opnemen tegen de giganten.

2022: Open Wetenschap Onder Druk

BigScience en BLOOM: Een Ongekende Benadering

Het jaar 2022 markeert een keerpunt. OpenAI sluit zijn modellen achter betaalde API’s. De gemeenschap reageert anders.

BigScience, gecoördineerd door Hugging Face, brengt 1.000 onderzoekers uit 60 landen samen. Hun doel? Het grootste meertalige open source model ooit bouwen. Het resultaat: BLOOM, 176 miljard parameters, 46 talen, 13 programmeertalen.

Wat BLOOM historisch maakt, is niet de omvang. Het is de totale transparantie: publieke trainingsgegevens, open source code, volledig trainingslogboek. Voor het eerst kunnen we echt begrijpen hoe een LLM is geboren.

Meta Slaat Hard toe met OPT

Bijna gelijktijdig lanceert Meta AI OPT (Open Pre-trained Transformer). Dezelfde grootte als GPT-3, maar met één cruciaal verschil: complete documentatie van het trainingsproces.

Onderzoekers kunnen eindelijk een model van deze schaal bestuderen zonder reverse engineering.

Galactica: Een Premonitie

November 2022. Meta probeert AI te specialiseren met Galactica, gewijd aan wetenschappelijke literatuur. Het model wordt binnen 48 uur teruggetrokken na kritiek op hallucinaties.

Mislukking? Niet helemaal. Galactica legt de basis voor training op gespecialiseerde corpora. Een trend die drie jaar later zou exploderen.

2023: Het Jaar dat Alles Veranderde

24 Februari 2023: Het Llama-effect

Die dag publiceert Meta Llama. Het model is niet bedoeld voor het grote publiek — alleen onderzoek. Maar de gewichten lekken binnen enkele dagen online.

De vonk van een revolutie.

Llama bewijst dat een bescheidener model (7 tot 65 miljard parameters) getraind op meer tokens giganten kan overtreffen. De gemeenschap grijpt het onmiddellijk.

Model Datum Belangrijkste Innovatie Licentie
Alpaca Maart 2023 Low-cost fine-tuning via self-instruct Niet-commercieel
Vicuna April 2023 90% ChatGPT-kwaliteit voor $500 trainingskosten Niet-commercieel
Falcon 40B Juni 2023 Eerste open source model dat benchmarks domineert Apache 2.0
Mistral 7B Oktober 2023 Extreme efficiëntie via Sliding Window Attention Apache 2.0
Mixtral 8x7B December 2023 Mixture of Experts (MoE) gedemocratiseerd Apache 2.0

QLoRA: Lokale Democratisering

April 2023. Een techniek verandert alles: QLoRA (Quantized Low-Rank Adaptation).

Resultaat? Fine-tune een model van 65 miljard parameters op één enkele consumer GPU. Kleine bedrijven kunnen nu hun eigen AI creëren zonder massale infrastructuur.

De barrières vallen één voor één.

2024-2025: Technische Pariteit

DeepSeek: China Betreedt het Podium

De zomer van 2024 markeert de aankomst van een belangrijke nieuwe speler: DeepSeek, een Chinees laboratorium gelieerd aan High-Flyer Quant.

Hun meesterzet? Een ultra-efficiënte MoE-architectuur en het MLA (Multi-head Latent Attention) mechanisme dat de behoefte aan KV-cache geheugen met 93% vermindert.

Resultaat in januari 2025: DeepSeek-V3 evenaart GPT-4 voor een fractie van de kosten. De internationale gemeenschap ontdekt dat open source geen volger meer is — het is de leider.

OpenAI Geeft toe aan de Druk

Augustus 2025. OpenAI, na jaren van geslotenheid, publiceert GPT-OSS. Eerste open weights model sinds GPT-2. Geoptimaliseerd voor agentic workflows en lange context.

Waarom deze ommezwaai? De concurrentiedruk van open source was te groot geworden. Wanneer vrije modellen de jouwe evenaren, is sluiten niet meer voldoende.

Meta Reageert met Llama 4

Metas onmiddellijke reactie: Llama 4. Inheems multimodaal, in staat om 10 miljoen context tokens te verwerken.

Stel je voor: een volledige codebase analyseren in één enkele query. Het is nu mogelijk — en gratis.

Januari 2026: Open Source Domineert

Ranglijst van de Beste Modellen

Hier zijn we vandaag:

Rang Model Ontwikkelaar Kwaliteitsscore Specialiteit
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Wiskunde, complex redeneren
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Coderen, Vision-Taal
3 DeepSeek V3.2 DeepSeek 41,20 Efficiëntie, lage inferentiekosten
4 GPT-OSS-120B OpenAI 40,50 Tool-gebruik, agentic
5 Llama 4 (70B) Meta 39,80 Multimodaliteit, ecosysteem
6 Qwen3-235B Alibaba 39,20 Meertaligheid, RAG

Het oordeel is brutaal: 5 van de top 6 modellen zijn open source. Alleen GPT-OSS, ironisch genoeg, draagt de naam van een voormalige proprietaire leider.

Innovaties die het Spel Veranderden

MLA en DeepSeek Sparse Attention: Het verwerken van miljoenen context tokens vereiste een verboden KV-cache geheugen. MLA comprimeert deze cache agressief. DSA vermindert de berekeningscomplexiteit door alleen relevante sequentiedelen te verwerken.

BitNet 1.58b: De meest radicale innovatie van 2025. In plaats van gewichten op 16 bits te coderen, gebruikt BitNet ternaire waarden {-1, 0, 1} — ongeveer 1,58 bit per parameter.

Gevolg:

  • 70-80% reductie in energieverbruik
  • 2,3x tot 6,1x versnelling op standaard CPU’s
  • Een model van 100 miljard parameters dat draait op een standaard desktop computer

AI-sovereiniteit is geen droom meer. Het is technische werkelijkheid.

Lokale Inferentie Wordt Standaard

De RTX 5090: Hart van AI Werkstations

Begin 2025 lanceert NVIDIA de RTX 5090. 32 GB GDDR7 geheugen, 1,79 TB/s bandbreedte (+77% vs vorige generatie).

Resultaten op een consumer kaart:

  • Llama 4 8B (4-bit): 180 tokens/seconde
  • DeepSeek-R1 14B (4-bit): 89 tokens/seconde
  • Qwen 2.5 32B (4-bit): 45 tokens/seconde

70B+ modellen draaien nu op lokale multi-GPU configuraties met industriële prestaties.

vLLM vs Ollama

Twee ecosystemen domineren:

  • vLLM: Standaard voor productie. PagedAttention engine, geoptimaliseerd KV-cache beheer, meerdere gelijktijdige gebruikers.
  • Ollama: Favoriet van ontwikkelaars. Extreme eenvoud, zero configuratie, native macOS/Linux/Windows ondersteuning.

Het Agentische Tijdperk: Van Chat naar Actie

Devstral 2: AI in Dienst van Code

December 2025. Mistral AI lanceert Devstral 2, 123 miljard parameters geoptimaliseerd voor softwareontwikkeling.

SWE-bench Verified score: 72,2%. Gelijk aan Claude Sonnet 4, maar zeven keer zo duur.

Prijs: $0,40 per miljoen tokens. AI-ondersteunde ontwikkeling wordt economisch haalbaar voor MKB’ers en zelfstandigen.

Vibe CLI: AI die Zelf Programmeert

Dezelfde maand lanceert Mistral Vibe CLI. Deze tool orkestreert autonoom complexe wijzigingen in volledige codebases.

De agentische modellen van 2026 kunnen:

  • Navigeren in complexe bestandssystemen
  • Afhankelijkheden tussen frameworks identificeren
  • Testfouten detecteren en zichzelf corrigeren
  • Betrouwbaar gestructureerde JSON-uitvoer produceren voor software-integratie

We gaan van “chat AI” naar “actie AI”.

Regulering: Wat Blijft er Over van Open?

OSAID 1.0: De Officiële Definitie

Oktober 2024. De Open Source Initiative publiceert eindelijk een officiële definitie van Open Source AI.

Om als open source te kwalificeren, moet een systeem vier vrijheden garanderen: gebruiken, studeren, wijzigen en delen. Drie essentiële componenten:

  1. Code: Complete pre-training, filtering en inferentie code
  2. Parameters: Gewichten, optimizer instellingen, architectuur configuraties
  3. Gegevens: Gedetailleerde documentatie over herkomst, selectie en verwerking

Resultaat? De meeste huidige “open source” modellen zijn niet conform. Llama 4, Mistral, zelfs GPT-OSS missen totale gegevenstransparantie.

Alleen Pythia (EleutherAI) en OLMo (AI2) verdienen het label “echt open source”.

De EU AI Act Structureert de Markt

Sinds februari 2025 geldt de EU AI Act. Open source modellen profiteren van significante vrijstellingen — op voorwaarde dat ze niet worden geclassificeerd als “systemisch risico”.

Voor modellen die 10^25 FLOPs overschrijden, gelden documentatie- en cyberbeveiligingsverplichtingen, ongeacht de licentie.

2026-2030: Wat Komt Eraan

Post-Transformer: Nieuwe architecturen ontstaan om de kwadratische complexiteit van aandacht te verminderen. BitNet is slechts het begin.

Edge AI: Modellen zoals Ministral 3B draaien op smartphones met massieve context. Domotica en persoonlijke robotica zullen exploderen.

Intelligentie Soevereiniteit: Bedrijven willen intelligentie niet meer “huren” via API’s. Ze willen hun eigen digitale breinen bezitten, getraind op hun industriële geheimen.

Multi-Agent Samenwerking: De toekomst ligt in communicatie tussen modellen van verschillende aanbieders. Problemen oplossen door samenwerking in plaats van monolithische brute kracht.

Het Nieuwe SEO Paradigma

De massale integratie van LLM in zoekmachines heeft online zichtbaarheid getransformeerd. We hebben het nu over GEO (Generative Engine Optimization).

In 2026 wordt ongeveer 25% van de traditionele organische traffic gevangen door AI-gegenereerde directe antwoorden. Gebruikers klikken niet meer — ze lezen de synthese.

Voor een merk wordt succes niet meer gemeten aan Google-ranking. Het wordt gemeten aan frequentie en stabiliteit van citaten in de generatieve antwoorden van Gemini 3 of GPT-5.

En Nu?

Het open source ecosysteem van 2026 heeft één ding bewezen: transparantie en samenwerking zijn geen ethische idealen, het zijn superieure concurrentievoordeel.

Door intelligentiemonopolies te doorbreken, heeft open source AI getransformeerd van een exclusieve dienst naar wereldwijde publieke infrastructuur — zo fundamenteel als elektriciteit of internet.

Technische pariteit is bereikt. De volgende grens? Totale systeemautonomie in dienst van de mensheid.

Massieve generalistische modellen worden aangevuld, soms vervangen, door sterrenbeelden van gespecialiseerde, spaarzamere, preciezere, soevereinere modellen.

Open source heeft gewonnen. De rest is slechts geschiedenis.

Inhoudsopgave