Il Momento Che Ha Cambiato Tutto
Nel 2022, il mondo tech si è capovolto. È stato lanciato ChatGPT. Improvvisamente, ogni azienda aveva bisogno di IA — e l’IA aveva bisogno di una cosa: le GPU di Nvidia. Ciò che iniziò come una crisi di approvvigionamento divenne il più grande cambiamento di potere nel computing dall’ascesa di Intel tre decenni fa.
Nvidia non vendeva solo chip. Divennero i guardiani dell’era dell’IA. Agli inizi del 2026, la loro capitalizzazione di mercato ha raggiunto i $4,7 trilioni — più dell’intera economia tedesca.
Questa è la storia di come un’azienda di schede grafiche per gaming è diventata la forza più potente della tecnologia — e perché il suo dominio potrebbe già aver raggiunto il picco.
«La Guerra del Silicio non si combatte sui campi di battaglia. Si vince nelle fabbriche di processo a 3 nanometri.»
Parte I: La Grande Siccità delle GPU (2022-2024)
Perché l’H100 È Diventato il Bene Più Ricercato al Mondo
Il novembre 2022 ha cambiato tutto. Quando OpenAI lanciò ChatGPT, non lanciò solo un prodotto — scatenò una ricerca globale per potenza computazionale.
La GPU H100 “Hopper” di Nvidia, progettata specificamente per l’addestramento IA, passò da tecnologia aziendale a indispensabile overnight. Le aziende non compravano hardware per crescere — lottavano per sopravvivere. Senza H100, non potevi addestrare modelli IA all’avanguardia. Punto.
Lancio ChatGPT
La domanda globale di computing IA esplode
Crisi di approvvigionamento H100
Tempi di consegna 6-12 mesi; mercati grigi emergono
Approvvigionamento si recupera
Ma la domanda continua a salire con ogni nuovo modello
Il Collo di Bottiglia Che Nessuno Vide Venire
Ecco cosa la maggior parte ha trascurato: la carenza non riguardava il design dei chip di Nvidia. Riguardava il packaging CoWoS di TSMC — la tecnologia avanzata che unisce i die GPU con memoria ad alta larghezza di banda.
Solo tre aziende producono memoria HBM3: SK Hynix, Samsung e Micron. Operarono al 100% di capacità. I tempi di consegna si estesero a un anno. L’H100 non è un chip — è un pacchetto complesso che solo una manciata di strutture al mondo possono assemblare.
«Non competevamo sul prezzo. Competevamo su chi poteva ottenere GPU a qualsiasi prezzo.»
La Mossa di CoreWeave
Mentre gli hyperscaler lottavano, Nvidia giocò un gioco diverso. Scommisero su CoreWeave — uno startup di mining di criptovalute diventato fornitore di cloud GPU — con assegnazione prioritaria di H100 e investimento diretto.
Il risultato? CoreWeave costruì infrastruttura massiva più velocemente di AWS o Google. Entro il 2024, Microsoft — incapace di deployare abbastanza velocemente per OpenAI — divenne il cliente più grande di CoreWeave, rappresentando il 62% dei loro ricavi.
Nvidia non vendeva solo chip. Riformò il panorama competitivo.
Quanto Costa un’Ora di GPU
Vuoi misurare il frenesí? Guarda il prezzo orario di noleggio di un H100:
| Periodo | Prezzo/Ora H100 | Mercato |
|---|---|---|
| Fine 2023 | $8–$10 | Carenza severa; mercati grigi fiorenti |
| Inizio 2024 | $6–$8 | Spedizioni di massa iniziano |
| Metà 2025 | $3.50–$4.50 | AWS riduce prezzi del 44% |
| Fine 2025 | $1.50–$2.50 | Guerra dei prezzi; computing commodity |
Parte II: La Fortezza CUDA Sotto Assedio
Il dominio hardware di Nvidia fu costruito sul software — specificamente CUDA, lanciato nel 2006. Per quasi 20 anni, fu un fossato invalicabile. Poi apparvero le crepe.
Perché Gli Sviluppatori Erano Intrappolati
CUDA non è solo un linguaggio di programmazione. È un ecosistema di librerie matematiche ottimizzate (cuBLAS, cuDNN) che rappresentano miliardi di investimento ingegneristico. Allontanarsene significava accettare penalità di performance, bug e isolamento dalla community.
Nel 2025, Stack Overflow mostrò 50× più domande su CUDA che su ROCm di AMD. Quella disparità racconta la storia.
Il Ritorno di AMD
Il MI300X di AMD, lanciato con rinnovato investimento in ROCm, cambiò i calcoli. Da ROCm 6.2 (2024-2025):
- Divario di performance ristretto: Da 40-50% di vantaggio CUDA a 10-30% medio
- Vantaggio di memoria: I 192GB di MI300X superano gli 80GB di H100 in task memory-bound
- Supporto framework: Integrazione PyTorch Day-0; FlashAttention e vLLM funzionanti
Microsoft e Meta iniziarono a deployare MI300X su larga scala. Il messaggio era chiaro: CUDA aveva competizione.
Quando l’IA Programma l’IA
Gennaio 2025. Claude Code — un assistente di codifica IA — portò un backend CUDA completo a ROCm di AMD in meno di 30 minuti. Storicamente, questo richiedeva strumenti imperfetti e ottimizzazione manuale pesante.
L’implicazione? Se l’IA può tradurre codice di ottimizzazione, il fossato di 20 anni di Nvidia si erode rapidamente.
Lo Strato di Astrazione in Salita
PyTorch 2.x e il compilatore Triton di OpenAI permettono agli sviluppatori di scrivere Python che viene compilato per qualsiasi target — Nvidia, AMD o TPU di Google. L’hardware sta diventando invisibile.
Questa è la vera minaccia: CUDA sepolto sotto strati di compatibilità universale.
Parte III: Il Contrattacco di Nvidia
Nvidia vide i muri avvicinarsi. La loro risposta? Accelerare tutto.
Architettura Blackwell
208 miliardi di transistor; design chiplet
Deploy Blackwell
Raffreddamento a liquido diventa obbligatorio
Architettura Rubin
HBM4, 22 TB/s banda, IA agentica
Blackwell: Più Potenza, Più Calore
Il B200 collega due die tramite interconnect chip-to-chip di 10 TB/s, apparendo come una GPU unificata. Specifiche che definiscono “avanguardia”:
- 208 miliardi di transistor (TSMC 4NP)
- 192GB HBM3e con 8 TB/s di banda
- 20 petaflops FP4 tramite Transformer Engine 2a gen
- 1000-1200W TDP: Raffreddamento a liquido obbligatorio per cluster densi
Rubin: Il Salto Successivo
Annunciato al CES 2026, Rubin punta a “IA agentica” — sistemi che ragionano e agiscono autonomamente.
- Processo 3nm (TSMC N3P)
- Memoria HBM4: 22 TB/s banda, 288GB per GPU
- CPU Vera: Nuovo processore compagno basato su Armv9.2
La Mossa Rack-Scale
Nvidia cambiò l’unità di computing. Non vendono più chip o server — vendono rack interi.
Il GB200 NVL72 impacchetta 72 GPU e 36 CPU in un rack-scale “supercomputer”. Le performance saltano 30× per inferenza vs. H100. Ma è uno stack completo: rete, raffreddamento, cablaggio, computing — tutto proprietario.
Acquisto significa chiusura.
Parte IV: La Ribellione degli Hyperscaler
Ecco il problema reale di Nvidia: i loro migliori clienti stanno diventando competitor.
Amazon, Google e Microsoft sono stanchi di pagare margini del 75%. Il “Grande Disaccoppiamento” è qui.
Google: Il Re dell’Efficienza
Google gioca un gioco diverso dal 2015 con i TPU. Il TPU v7 “Ironwood” (2026) raggiunge efficienza di picco:
- 4.6 petaflops FP8: Competitivo con Blackwell
- 2.8× migliore performance per watt di H100
- Interconnessioni ottiche: Fino a 9.216 chip in un “Pod”
L’intero stack IA di Google — Search, YouTube, Gemini — ora gira su TPU. Non pagano più la “tassa Nvidia”.
AWS: Il Taglia-Costi
Trainium 3 punta all’addestramento di mercato di massa. Con UltraServers che impacchettano 144 chip a 362 petaflops, AWS promette costi di addestramento 50% inferiori rispetto alle istanze GPU.
L’SDK Neuron è maturato. Anthropic addestra Claude su Trainium. È praticabile per modelli all’avanguardia.
Microsoft: Il Cavallo di Troia
Maia 200 (2026) fu la sorpresa. Su misura per i modelli GPT di OpenAI, reclama 3× performance migliori di Trainium 3. Ora alimentando Microsoft 365 Copilot e inferenza GPT, libera le GPU di Nvidia per l’addestramento — ottimizzando il CapEx di Microsoft.
Il Panorama dei Chip 2026
| Spec | Nvidia B200 | Google TPU v7 | Trainium 3 | Maia 200 |
|---|---|---|---|---|
| Memoria | 192GB HBM3e | 192GB HBM3e | 144GB HBM3e | Custom |
| Interconnessione | NVLink (elettrico) | ICI (ottico) | NeuronLink | Ethernet |
| Punto di forza | Versatilità, ecosistema | Efficienza energetica | Costo per token | Ottimizzazione GPT |
Parte V: La Cortina di Silicio
La guerra tecnologica divenne un confronto geopolitico. Gli USA, identificando l’IA come la tecnologia definitoria del XXI secolo, usarono i controlli sulle esportazioni di semiconduttori come armi diplomatiche.
Il Gioco delle Sanzioni
| Mossa USA | Risposta Nvidia | Risultato |
|---|---|---|
| Vietare A100/H100 | — | Cina bloccata |
| — | Lanciare A800/H800 (limitati) | Venduto fino al divieto |
| Vietare A800/H800 | Lanciare H20 (conforme) | Ancora limitato |
| 2026: 25% dazi + controlli rigorosi | — | Mercato Cina effettivamente chiuso |
Il Piano B della Cina: Huawei Ascend
Huawei — nonostante le sanzioni USA — produsse massicciamente chip Ascend 910B e 910C. Beijing costrinse Baidu, Tencent e Alibaba a migrare. Il software (CANN) è indietro rispetto a CUDA, ma la Cina sta costruendo il proprio stack.
Accaparramento strategico: Le stime suggeriscono che la Cina abbia sufficiente capacità installata di H100 per durare 18-24 mesi.
IA Sovrana: Il Nuovo Argomento di Vendita di Nvidia
Perdendo la Cina, Nvidia girò. Promuovono “IA Sovrana” — ogni nazione necessita della propria infrastruttura per sicurezza culturale ed economica.
Francia: Partnership con Mistral AI e Bpifrance per il campus IA più grande d’Europa vicino a Parigi, alimentato da sistemi Blackwell.
Medio Oriente: Accordi complessi con G42 degli EAU — sotto stretta supervisione di Washington per prevenire backdoor verso la Cina.
Parte VI: La Storia del Denaro
Numeri Che Sfidano la Credenza
Capitalizzazione: Da $145B (2020) a $4,7T (2026). Nvidia divenne l’azienda più preziosa al mondo.
Caduta di Intel: Da 68% quota data center (2021) a 6% (2025).
Dominio dei ricavi: Nel 2026, Nvidia cattura l’86% dei ricavi dei chip per data center.
La Verifica di Realtà TCO
Ecco il problema: H100/B200 è eccessivo per l’inferenza. Per il volume massiccio di query IA, il TPU v7 di Google o Trainium 3 offrono 2-3× migliore efficienza energetica.
Qui è vulnerabile il margine di Nvidia. L’addestramento è un gioco di velocità. L’inferenza è un gioco di costi.
«Nvidia ha vinto la guerra dell'addestramento. Ma la battaglia dell'inferenza e dell'efficienza energetica sta appena iniziando.»
E Ora Cosa?
Inizi del 2026: Nvidia sembra intoccabile. Hardware Blackwell/Rubin. Software CUDA. Accordi di IA sovrana. Un impero da $4,7 trilioni.
Ma guarda più da vicino:
- L’IA rende commodity il codice: Strumenti come Claude Code rompono il blocco software
- I clienti diventano competitor: Gli hyperscaler costruiscono i propri chip
- La frammentazione geopolitica: Il mondo si divide in blocchi tecnologici
La Guerra del Silicio non è finita. Il 2020-2026 fu la conquista lampo. Il 2026-2030 sarà la difesa disperata di un monopolio contro un mondo determinato a smantellarlo.
Conquista
H100 & Carenza
Consolidamento
Era Blackwell
Egemonia
Rubin & Picco?
Incertezza
Difesa o Declino?
L’industria trattiene il respiro. Perché nella tecnologia, gli imperi cadono così velocemente come sorgono.