Ga naar hoofdinhoud
Back to Insights
Nvidia AI GPU chips datacenter CUDA

De Opkomst van Nvidia: Hoe Een Bedrijf de Regels van Computing Herschreef

By Mordehai Attia 25 min read

Het Moment Dat Alles Veranderde

In 2022 draaide de techwereld op zijn kop. ChatGPT werd gelanceerd. Opeens had elk bedrijf AI nodig — en AI had één ding nodig: Nvidia GPU’s. Wat begon als een supply crisis werd de grootste machtsverschuiving in computing sinds de opkomst van Intel drie decennia geleden.

Nvidia verkocht geen chips. Ze werden de hoeders van het AI-tijdperk. Begin 2026 bereikte hun marktkapitalisatie $4,7 biljoen — meer dan de hele Duitse economie.

$4,7T
Kapitalisatie (begin 2026)
86%
Datacenter marktaandeel
208B
Transistors (Blackwell)

Dit is het verhaal van hoe een gaming grafische kaarten bedrijf de krachtigste kracht in technologie werd — en waarom hun dominantie misschien al op zijn hoogtepunt is.

«De Silicon War wordt niet gevochten op slagvelden. Hij wordt gewonnen in 3-nanometer fabrieken.»

— Sectoranalyse, 2026

Deel I: De Grote GPU Droogte (2022-2024)

Waarom de H100 Het Meest Gewilde Goed ter Wereld Werd

November 2022 veranderde alles. Toen OpenAI ChatGPT lanceerde, lanceerden ze niet alleen een product — ze ontketenden een wereldwijde jacht op rekenkracht.

Nvidia’s H100 “Hopper” GPU, specifiek ontworpen voor AI-training, ging van enterprise technologie tot overnight onmisbaar. Bedrijven kochten geen hardware om te groeien — ze vochten om te overleven. Zonder H100’s kon je geen state-of-the-art AI-modellen trainen. Punt.

Nov 2022

ChatGPT Launch

Wereldwijde vraag naar AI-computing explodeert

Mid 2023

H100 supply crisis

Levertijden 6-12 maanden; grijze markten ontstaan

2024

Supply herstelt

Maar vraag blijft stijgen met elk nieuw model

De Flessenhal Die Niemand Zag Aankomen

Hier is wat de meesten over het hoofd zagen: het tekort ging niet over Nvidia’s chipontwerp. Het ging over TSMC’s CoWoS packaging — de geavanceerde technologie die GPU dies verbindt met high-bandwidth memory.

Alleen drie bedrijven maken HBM3-geheugen: SK Hynix, Samsung en Micron. Ze draaiden op 100% capaciteit. Levertijden liepen op tot een jaar. De H100 is geen chip — het is een complex pakket dat maar een handvol faciliteiten ter wereld kunnen assembleren.

«We concurreren niet op prijs. We concurreren over wie GPU's kon krijgen tegen elke prijs.»

— AI startup oprichter, 2023

De CoreWeave Zet

Terwijl hyperscalers vochtten, speelde Nvidia een ander spel. Ze wedden op CoreWeave — een crypto mining startup die een GPU cloud provider werd — met prioritaire H100-toewijzing en directe investering.

Het resultaat? CoreWeave bouwde massieve infrastructuur sneller dan AWS of Google. Tegen 2024 werd Microsoft — niet snel genoeg kunnende deployen voor OpenAI — CoreWeave’s grootste klant, goed voor 62% van hun omzet.

Nvidia verkocht geen chips. Ze herschreven het competitieve landschap.

Wat Een Uur GPU Kost

Wil je de waanzin meten? Kijk naar de uurhuurprijs van een H100:

Periode H100 Prijs/Uur Markt
Eind 2023 $8–$10 Ernstig tekort; grijze markten bloeien
Begin 2024 $6–$8 Massale shipments beginnen
Mid 2025 $3.50–$4.50 AWS verlaagt prijzen 44%
Eind 2025 $1.50–$2.50 Prijs oorlog; commodity computing

Deel II: Het CUDA Fort Onder Beleg

Nvidia’s hardware dominantie werd gebouwd op software — specifiek CUDA, gelanceerd in 2006. Bijna 20 jaar lang was het een onneembaar slot. Toen verschenen de scheuren.

Waarom Ontwikkelaars Vastzaten

CUDA is niet alleen een programmeertaal. Het is een ecosysteem van geoptimaliseerde wiskundige bibliotheken (cuBLAS, cuDNN) die miljarden aan engineering investering vertegenwoordigen. Weglopen betekende acceptatie van performance penalties, bugs en community isolatie.

In 2025 toonde Stack Overflow 50× meer CUDA-vragen dan AMD’s ROCm. Die kloof vertelt het verhaal.

AMD’s Comeback

AMD’s MI300X, gelanceerd met hernieuwde ROCm-investering, veranderde de wiskunde. Vanaf ROCm 6.2 (2024-2025):

  • Performance gap vernauwde: Van 40-50% CUDA-voordeel naar 10-30% gemiddeld
  • Geheugen voordeel: MI300X’s 192GB verslaat H100’s 80GB in memory-bound taken
  • Framework support: Day-0 PyTorch integratie; FlashAttention en vLLM werkend

Microsoft en Meta begonnen MI300X op schaal te deployen. De boodschap was duidelijk: CUDA had concurrentie.

Wanneer AI AI Programmeert

Januari 2025. Claude Code — een AI-coding assistent — portte een volledige CUDA backend naar AMD’s ROCm in minder dan 30 minuten. Historisch gezien vereiste dit imperfecte tools en zware handmatige optimalisatie.

De implicatie? Als AI optimalisatiecode kan vertalen, erodeert Nvidia’s 20-jarige slot snel.

De Opkomende Abstractielaag

PyTorch 2.x en OpenAI’s Triton compiler laten ontwikkelaars Python schrijven dat compileert voor elk doel — Nvidia, AMD of Google’s TPU. Hardware wordt onzichtbaar.

Dat is de echte dreiging: CUDA begraven onder universele compatibiliteitslagen.

Deel III: Nvidia’s Tegenaanval

Nvidia zag de muren sluiten. Hun reactie? Alles versnellen.

2024

Blackwell Architectuur

208B transistors; chiplet design

2025

Blackwell Deploy

Vloeistofkoeling wordt verplicht

2026

Rubin Architectuur

HBM4, 22 TB/s bandbreedte, agentic AI

Blackwell: Meer Vermogen, Meer Hitte

De B200 verbindt twee dies via 10 TB/s chip-to-chip interconnect, verschijnend als een enkele GPU. Specificaties die “cutting-edge” definiëren:

  • 208 miljard transistors (TSMC 4NP)
  • 192GB HBM3e met 8 TB/s bandbreedte
  • 20 petaflops FP4 via 2nd-gen Transformer Engine
  • 1000-1200W TDP: Vloeistofkoeling verplicht voor dichte clusters

Rubin: De Volgende Sprong

Aangekondigd op CES 2026, richt Rubin zich op “agentic AI” — systemen die autonoom redeneren en handelen.

  • 3nm proces (TSMC N3P)
  • HBM4 geheugen: 22 TB/s bandbreedte, 288GB per GPU
  • Vera CPU: Nieuwe companion processor gebaseerd op Armv9.2

De Rack-Scale Zet

Nvidia veranderde de compute-eenheid. Ze verkopen geen chips of servers meer — ze verkopen hele racks.

De GB200 NVL72 bundelt 72 GPU’s en 36 CPU’s in een rack-scale “supercomputer”. Performance springt 30× voor inferentie vs. H100. Maar het is een compleet stack: netwerk, koeling, bekabeling, compute — alles proprietary.

Koop, en je zit vast.

Deel IV: De Hyperscalers Vechten Terug

Hier is Nvidia’s echte probleem: hun beste klanten worden concurrenten.

Amazon, Google en Microsoft zijn het zat om 75% marges te betalen. De “Grote Ontkoppeling” is hier.

TPU v7
Google — "Ironwood"
2.8× energie-efficiëntie vs. H100
Trainium 3
AWS — UltraServers
50% lagere training kosten
Maia 200
Microsoft — Azure
Op maat voor GPT/OpenAI

Google: De Koning van Efficiëntie

Google speelt al sinds 2015 een ander spel met TPUs. De TPU v7 “Ironwood” (2026) bereikt piekefficiëntie:

  • 4.6 petaflops FP8: Concurrerend met Blackwell
  • 2.8× betere performance per watt dan H100
  • Optische interconnects: Tot 9.216 chips in een “Pod”

Google’s hele AI stack — Search, YouTube, Gemini — draait nu op TPU. Ze betalen geen “Nvidia belasting” meer.

AWS: De Kostenknipper

Trainium 3 richt zich op massamarkt training. Met UltraServers die 144 chips bundelen tot 362 petaflops, belooft AWS 50% lagere trainingkosten dan GPU-instanties.

De Neuron SDK is volwassen geworden. Anthropic traint Claude op Trainium. Het is haalbaar voor state-of-the-art modellen.

Microsoft: Het Trojaanse Paard

Maia 200 (2026) was de verrassing. Op maat gemaakt voor OpenAI’s GPT-modellen, claimt het 3× betere performance dan Trainium 3. Het voedt nu Microsoft 365 Copilot en GPT-inferentie, waardoor Nvidia GPU’s vrijkomen voor training — Microsoft’s CapEx optimaliserend.

Het Chip Landschap 2026

Spec Nvidia B200 Google TPU v7 Trainium 3 Maia 200
Geheugen 192GB HBM3e 192GB HBM3e 144GB HBM3e Custom
Interconnect NVLink (elektrisch) ICI (optisch) NeuronLink Ethernet
Sterkte Veelzijdigheid, ecosysteem Energie-efficiëntie Kosten per token GPT-optimalisatie

Deel V: Het Siliconen Gordijn

De technologische oorlog werd een geopolitiek treffen. De VS, AI identificerend als de definiërende technologie van de 21e eeuw, gebruikten semiconductor exportcontroles als diplomatieke wapens.

Het Sanctiespel

VS ZetNvidia ReactieResultaat
A100/H100 verbiedenChina geblokkeerd
A800/H800 lanceren (gelimiteerd)Verkocht tot verbod
A800/H800 verbiedenH20 lanceren (compliant)Nog steeds beperkt
2026: 25% tarieven + strikte controlesChina-markt effectief gesloten

China’s Plan B: Huawei Ascend

Huawei — ondanks VS-sancties — produceerde massaal Ascend 910B en 910C chips. Beijing dwong Baidu, Tencent en Alibaba te migreren. De software (CANN) loopt achter op CUDA, maar China bouwt zijn eigen stack.

Strategische hamstering: Schattingen suggereren dat China genoeg H100-capaciteit heeft geïnstalleerd om 18-24 maanden mee te gaan.

Soevereine AI: Nvidia’s Nieuwe Verkoopargument

China verliezend, draaide Nvidia. Ze promoten “Sovereign AI” — elk land heeft zijn eigen infrastructuur nodig voor culturele en economische veiligheid.

Frankrijk: Partnerschap met Mistral AI en Bpifrance voor Europa’s grootste AI-campus nabij Parijs, aangedreven door Blackwell-systemen.

Midden-Oosten: Complexe deals met G42 van VAE — onder strikt toezicht van Washington om backdoors naar China te voorkomen.

Deel VI: Het Geldverhaal

Cijfers Die Het Geloven Tarten

2020 → 2026
$145B → $4,7T kapitalisatie
68% → 6%
Intel marktaandeel ineenstorting
75%
Nvidia brutomarge

Kapitalisatie: Van $145B (2020) naar $4,7T (2026). Nvidia werd ‘s werelds waardevolste bedrijf.

Intel’s val: Van 68% datacenter marktaandeel (2021) naar 6% (2025).

Omzetdominantie: In 2026 vangt Nvidia 86% van de datacenter chip inkomsten.

De TCO Reality Check

Hier is het probleem: H100/B200 is overkill voor inferentie. Voor het massale volume van AI-queries bieden Google’s TPU v7 of Trainium 3 2-3× betere energie-efficiëntie.

Daar is Nvidia’s marge kwetsbaar. Training is een snelheidsspel. Inferentie is een kostenspel.

«Nvidia won de trainingsoorlog. Maar de inferentie- en energie-efficiëntie strijd begint pas.»

— Sectoranalyse, 2026

Wat Nu?

Begin 2026: Nvidia lijkt onaantastbaar. Blackwell/Rubin hardware. CUDA software. Sovereign AI deals. Een $4,7 biljoen imperium.

Maar kijk dichter:

  1. AI maakt code commodity: Tools zoals Claude Code breken software lock-in
  2. Klanten worden concurrenten: Hyperscalers bouwen hun eigen chips
  3. Geopolitieke fragmentatie: De wereld splitst in technologieblokken

De Silicon War is niet voorbij. 2020-2026 was de blitzkrieg verovering. 2026-2030 zal de wanhopige verdediging van een monopolie zijn tegen een wereld vastbesloten om het af te breken.

2022

Verovering

H100 & Tekort

2024

Consolidatie

Blackwell Era

2026

Hegemonie

Rubin & Piek?

2027+

Onzekerheid

Verdediging of Decline?

De industrie houdt haar adem in. Want in technologie vallen imperia net zo snel als ze rijzen.

Inhoudsopgave