Zum Hauptinhalt springen
Back to Insights
Nvidia KI GPU Chips Datenzentrum CUDA

Nvidias Aufstieg: Wie ein Unternehmen die Regeln der Computertechnik neu schrieb

By Mordehai Attia 25 min read

Der Moment, der alles veränderte

Im Jahr 2022 drehte sich die Tech-Welt auf den Kopf. ChatGPT wurde gestartet. Plötzlich brauchte jedes Unternehmen KI – und KI brauchte eines: Nvidia-GPUs. Was als Lieferengpass begann, wurde zum größten Machtwechsel in der Computertechnik seit dem Aufstieg von Intel vor drei Jahrzehnten.

Nvidia verkaufte nicht nur Chips. Sie wurden zum Torwächter des KI-Zeitalters. Anfang 2026 erreichte ihre Marktkapitalisierung 4,7 Billionen Dollar – mehr als die gesamte deutsche Wirtschaft.

4,7 Bio.$
Marktkapitalisierung (Anfang 2026)
86%
Marktanteil Datenzentren
208 Mrd.
Transistoren (Blackwell)

Dies ist die Geschichte, wie ein Gaming-Grafikkartenhersteller zur mächtigsten Kraft der Technologiebranche wurde – und warum ihre Dominanz möglicherweise bereits ihren Höhepunkt erreicht hat.

„Der Siliziumkrieg wird nicht auf Schlachtfeldern ausgetragen. Er wird in 3-Nanometer-Fertigungsanlagen gewonnen."

— Branchenanalyse, 2026

Teil I: Die große GPU-Dürre (2022-2024)

Warum der H100 zum begehrtesten Gut der Welt wurde

Der November 2022 veränderte alles. Als OpenAI ChatGPT veröffentlichte, löste es nicht nur ein Produkt aus – es löste einen weltweiten Kampf um Rechenleistung aus.

Nvidias H100 „Hopper”-GPU, speziell für KI-Training entwickelt, wurde über Nacht vom Enterprise-Produkt zum Muss. Unternehmen kauften keine Hardware mehr für Wachstum – sie kämpften ums Überleben. Ohne H100s konnten Sie keine Spitzen-KI-Modelle trainieren. Punkt.

Nov 2022

ChatGPT-Start

Globale Nachfrage nach KI-Rechenleistung explodiert

Mitte 2023

H100-Engpass erreicht Höhepunkt

Lieferzeiten 6-12 Monate; Graumärkte entstehen

2024

Lieferung holt auf

Aber Nachfrage steigt mit jedem neuen Modell

Der Engpass, den niemand kommen sah

Hier ist es, was die meisten übersehen haben: Der Mangel lag nicht an Nvidias Chip-Design. Es ging um TSMCs CoWoS-Packaging – die fortschrittliche Technologie, die GPU-Dies mit High-Bandwidth Memory zusammenfügt.

Nur drei Unternehmen produzieren HBM3-Speicher: SK Hynix, Samsung und Micron. Sie liefen mit 100% Kapazität. Lieferzeiten erstreckten sich auf ein Jahr. Der H100 ist nicht ein Chip – er ist ein komplexes Paket, das nur eine Handvoll Einrichtungen weltweit zusammenbauen kann.

„Wir konkurrierten nicht um den Preis. Wir konkurrierten darum, wer GPUs zu jedem Preis bekommen konnte."

— KI-Startup-Gründer, 2023

Die CoreWeave-Strategie

Während Hyperscaler kämpften, spielte Nvidia ein anderes Spiel. Sie unterstützten CoreWeave – ein Krypto-Mining-Startup, das zum GPU-Cloud-Anbieter wurde – mit priorisierter H100-Zuteilung und direkter Investition.

Das Ergebnis? CoreWeave baute massive Infrastruktur schneller auf als AWS oder Google. Bis 2024 wurde Microsoft – unfähig, schnell genug für OpenAI zu deployen – CoreWeaves größter Kunde, mit 62% ihres Umsatzes.

Nvidia verkaufte nicht nur Chips. Sie formten die Wettbewerbslandschaft neu.

Was eine Stunde GPU-Rechenleistung kostet

Sie wollen den Wahnsinn messen? Beobachten Sie den Stundensatz für einen H100:

Zeitraum H100-Preis/Stunde Markt
Ende 2023 8–10 $ Schwere Knappheit; Graumärkte florieren
Anfang 2024 6–8 $ Massenlieferungen beginnen
Mitte 2025 3,50–4,50 $ AWS senkt Preise um 44%
Ende 2025 1,50–2,50 $ Preiskrieg; Rechenleistung wird Ware

Teil II: Die belagerte CUDA-Festung

Nvidias Hardware-Dominanz baute auf Software auf – speziell CUDA, gestartet 2006. Fast 20 Jahre lang war es ein unüberwindbarer Graben. Dann erschienen die Risse.

Warum Entwickler gefangen waren

CUDA ist nicht nur eine Programmiersprache. Es ist ein Ökosystem optimierter Mathematik-Bibliotheken (cuBLAS, cuDNN), die Milliarden in Engineering-Investitionen repräsentieren. Der Umstieg bedeutete Performance-Einbußen, Bugs und Community-Isolation.

2025 zeigte Stack Overflow 50× mehr CUDA-Fragen als AMDs ROCm. Diese Lücke erzählt die Geschichte.

AMDs Comeback

AMD MI300X, gestartet mit erneuter ROCm-Investition, veränderte die Rechnung. Ab ROCm 6.2 (2024-2025):

  • Leistungslücke verengt sich: Von 40-50% CUDA-Vorsprung auf 10-30%
  • Speichervorteil: MI300X mit 192GB übertrifft H100 bei speicherintensiven Aufgaben
  • Framework-Support: PyTorch Day-0-Integration; FlashAttention und vLLM funktionieren

Microsoft und Meta begannen, MI300X im großen Maßstab einzusetzen. Die Botschaft war klar: CUDA hatte Konkurrenz.

Wenn KI KI programmiert

Januar 2025. Claude Code – ein KI-Coding-Assistent – portierte ein komplettes CUDA-Backend zu AMDs ROCm in unter 30 Minuten. Historisch erforderte dies unvollständige Tools und schwere manuelle Optimierung.

Die Implikation? Wenn KI Optimierungscode übersetzen kann, erodiert Nvidias 20-jähriger Graben schnell.

Die Abstraktionsschicht steigt

PyTorch 2.x und OpenAIs Triton-Compiler ermöglichen es Entwicklern, Python zu schreiben, das auf jede Zielplattform kompiliert – Nvidia, AMD oder Googles TPU. Die Hardware wird unsichtbar.

Das ist die echte Bedrohung: CUDA wird unter universellen Kompatibilitätsschichten begraben.

Teil III: Nvidias Gegenschlag

Nvidia sah die Mauer näher kommen. Ihre Antwort? Alles beschleunigen.

2024

Blackwell-Architektur

208 Mrd. Transistoren; Chiplet-Design

2025

Blackwell-Deployment

Flüssigkühlung wird obligatorisch

2026

Rubin-Architektur

HBM4, 22 TB/s Bandbreite, agentische KI

Blackwell: Mehr Leistung, mehr Hitze

Der B200 verbindet zwei Dies über 10 TB/s Chip-zu-Chip-Interconnect, als einheitliche GPU erscheinend. Spezifikationen, die „Spitzenleistung” definieren:

  • 208 Milliarden Transistoren (TSMC 4NP)
  • 192GB HBM3e mit 8 TB/s Bandbreite
  • 20 Petaflops FP4 über Transformer Engine 2. Generation
  • 1000-1200W TDP: Flüssigkühlung obligatorisch für dichte Cluster

Rubin: Der nächste Sprung

Auf der CES 2026 angekündigt, zielt Rubin auf „agentische KI” – Systeme, die autonom schlussfolgern und handeln.

  • 3nm-Prozess (TSMC N3P)
  • HBM4-Speicher: 22 TB/s Bandbreite, 288GB pro GPU
  • Vera-CPU: Neuer Armv9.2-basierter Begleitprozessor

Die Rack-Scale-Strategie

Nvidia änderte die Einheit des Rechnens. Sie verkaufen keine Chips oder Server mehr – sie verkaufen Racks.

Das GB200 NVL72 packt 72 GPUs und 36 CPUs in ein Rack-scale „Supercomputer”. Die Leistung springt 30× für Inferenz vs. H100. Aber es ist ein kompletter Stack: Netzwerk, Kühlung, Verkabelung, Rechenleistung – alles proprietär.

Einkauf bedeutet Einschuss.

Teil IV: Der Hyperscaler-Gegenschlag

Hier ist Nvidias echtes Problem: Ihre besten Kunden werden zu Konkurrenten.

Amazon, Google und Microsoft sind es leid, 75% Marge zu zahlen. Die „Große Entkopplung” ist da.

TPU v7
Google — „Ironwood"
2,8× Energieeffizienz vs. H100
Trainium 3
AWS — UltraServers
50% niedrigere Trainingskosten
Maia 200
Microsoft — Azure
Maßgeschneidert für GPT/OpenAI

Google: Der Effizienzkönig

Google spielt seit 2015 mit TPUs ein anderes Spiel. Der TPU v7 „Ironwood” (2026) erreicht Spitzeneffizienz:

  • 4,6 Petaflops FP8: Wettbewerbsfähig mit Blackwell
  • 2,8× bessere Performance pro Watt als H100
  • Optische Interconnects: Bis zu 9.216 Chips in einem „Pod”

Googles gesamter KI-Stack – Search, YouTube, Gemini – läuft jetzt auf TPUs. Sie zahlen keine „Nvidia-Steuer” mehr.

AWS: Der Kostensenker

Trainium 3 zielt auf Massenmarkt-Training. Mit UltraServers, die 144 Chips bei 362 Petaflops packen, verspricht AWS 50% niedrigere Trainingskosten als GPU-Instanzen.

Das Neuron SDK ist gereift. Anthropic trainiert Claude auf Trainium. Es ist für Spitzenmodelle nutzbar.

Microsoft: Das trojanische Pferd

Maia 200 (2026) war die Überraschung. Maßgeschneidert für OpenAIs GPT-Modelle, behauptet es 3× bessere Leistung als Trainium 3. Jetzt treibt es Microsoft 365 Copilot und GPT-Inferenz an, befreit Nvidia-GPUs für das Training – und optimiert Microsofts CapEx.

Die Chip-Landschaft 2026

Spezifikation Nvidia B200 Google TPU v7 Trainium 3 Maia 200
Speicher 192GB HBM3e 192GB HBM3e 144GB HBM3e Custom
Interconnect NVLink (elektrisch) ICI (optisch) NeuronLink Ethernet
Stärke Vielseitigkeit, Ökosystem Energieeffizienz Kosten pro Token GPT-Optimierung

Teil V: Der Silizium-Vorhang

Der Technologiekrieg wurde zu einem geopolitischen Patt. Die USA, die KI als bestimmende Technologie des 21. Jahrhunderts identifizierten, nutzten Halbleiter-Exportkontrollen als diplomatische Waffen.

Das Sanktions-Spiel

US-MaßnahmeNvidia-AntwortErgebnis
A100/H100-VerbotChina ausgesperrt
A800/H800-Start (gedrosselt)Verkauf bis Verbot
A800/H800-VerbotH20-Start (konform)Weiter eingeschränkt
2026: 25% Zölle + strenge ExportkontrollenChina-Markt praktisch geschlossen

Chinas Plan B: Huawei Ascend

Huawei – trotz US-Sanktionen – produzierte massenweise Ascend 910B und 910C Chips. Peking zwang Baidu, Tencent und Alibaba zur Migration. Die Software (CANN) hinkt CUDA hinterher, aber China baut seinen eigenen Stack auf.

Strategisches Horten: Schätzungen zufolge hat China genug installierte H100-Kapazität für 18-24 Monate.

Souveräne KI: Nvidias neues Verkaufsargument

China verlierend, drehte Nvidia um. Sie fördern „Souveräne KI” – jedes Land braucht seine eigene Infrastruktur für kulturelle und wirtschaftliche Sicherheit.

Frankreich: Partnerschaft mit Mistral AI und Bpifrance für Europas größten KI-Campus bei Paris, angetrieben von Blackwell-Systemen.

Nahost: Komplexe Deals mit UAEs G42 – unter strenger Washingtoner Aufsicht, um Hintertüren zu China zu verhindern.

Teil VI: Die finanzielle Geschichte

Zahlen, die den Glauben versagen

2020 → 2026
145 Mrd.$ → 4,7 Bio.$ Marktkap.
68% → 6%
Intels Datenzentrum-Anteil-Kollaps
75%
Nvidias Bruttomarge

Kapitalisierung: Von 145 Mrd.$ (2020) auf 4,7 Bio.$ (2026). Nvidia wurde das wertvollste Unternehmen der Welt.

Intels Fall: Von 68% Datenzentrum-Anteil (2021) auf 6% (2025).

Umsatzdominanz: 2026 erfasst Nvidia 86% der Datenzentrum-Chip-Einnahmen.

Die TCO-Realitätsprüfung

Der Haken: H100/B200 ist Overkill für Inferenz. Für das massive Volumen an KI-Abfragen bieten Googles TPU v7 oder Trainium 3 2-3× bessere Energieeffizienz.

Hier ist Nvidias Marge verwundbar. Training ist ein Geschwindigkeitsspiel. Inferenz ist ein Kostenspiel.

„Nvidia gewann den Trainingskrieg. Aber der Inferenz- und Energieeffizienz-Kampf fängt gerade erst an."

— Branchenanalyse, 2026

Was kommt als Nächstes?

Anfang 2026: Nvidia scheint unantastbar. Blackwell/Rubin-Hardware. CUDA-Software. Souveräne KI-Deals. Ein 4,7 Billionen-Dollar-Imperium.

Aber genauer hinsehen:

  1. KI kommodifiziert Code: Tools wie Claude Code brechen Software-Lock-in
  2. Kunden werden Konkurrenten: Hyperscaler bauen eigene Chips
  3. Geopolitische Fragmentierung: Die Welt spaltet sich in Technologie-Blöcke

Der Siliziumkrieg ist nicht vorbei. 2020-2026 war die Blitz-Eroberung. 2026-2030 wird die verzweifelte Verteidigung eines Monopols gegen eine Welt, die es demontieren will.

2022

Eroberung

H100 & Knappheit

2024

Konsolidierung

Blackwell-Ära

2026

Hegemonie

Rubin & Höhepunkt?

2027+

Unsicher

Verteidigung oder Verfall?

Die Branche hält den Atem an. Denn in der Technik fallen Imperien so schnell, wie sie aufsteigen.

Inhaltsverzeichnis