L'ascesa di Nvidia: come un'azienda ha riscritto le regole del computing

Il Momento Che Ha Cambiato Tutto

Nel 2022, il mondo tech si è capovolto. È stato lanciato ChatGPT. Improvvisamente, ogni azienda aveva bisogno di IA — e l’IA aveva bisogno di una cosa: le GPU di Nvidia. Ciò che iniziò come una crisi di approvvigionamento divenne il più grande cambiamento di potere nel computing dall’ascesa di Intel tre decenni fa.

Nvidia non vendeva solo chip. Divennero i guardiani dell’era dell’IA. Agli inizi del 2026, la loro capitalizzazione di mercato ha raggiunto i $4,7 trilioni — più dell’intera economia tedesca.

$4,7T

Capitalizzazione (inizio 2026)

86%

Quota mercato data center

208 Mld

Transistor (Blackwell)

Questa è la storia di come un’azienda di schede grafiche per gaming è diventata la forza più potente della tecnologia — e perché il suo dominio potrebbe già aver raggiunto il picco.

«La Guerra del Silicio non si combatte sui campi di battaglia. Si vince nelle fabbriche di processo a 3 nanometri.»

— Analisi settoriale, 2026

Parte I: La Grande Siccità delle GPU (2022-2024)

Perché l’H100 È Diventato il Bene Più Ricercato al Mondo

Il novembre 2022 ha cambiato tutto. Quando OpenAI lanciò ChatGPT, non lanciò solo un prodotto — scatenò una ricerca globale per potenza computazionale.

La GPU H100 “Hopper” di Nvidia, progettata specificamente per l’addestramento IA, passò da tecnologia aziendale a indispensabile overnight. Le aziende non compravano hardware per crescere — lottavano per sopravvivere. Senza H100, non potevi addestrare modelli IA all’avanguardia. Punto.

Nov 2022

Lancio ChatGPT

La domanda globale di computing IA esplode

Metà 2023

Crisi di approvvigionamento H100

Tempi di consegna 6-12 mesi; mercati grigi emergono

2024

Approvvigionamento si recupera

Ma la domanda continua a salire con ogni nuovo modello

Il Collo di Bottiglia Che Nessuno Vide Venire

Ecco cosa la maggior parte ha trascurato: la carenza non riguardava il design dei chip di Nvidia. Riguardava il packaging CoWoS di TSMC — la tecnologia avanzata che unisce i die GPU con memoria ad alta larghezza di banda.

Solo tre aziende producono memoria HBM3: SK Hynix, Samsung e Micron. Operarono al 100% di capacità. I tempi di consegna si estesero a un anno. L’H100 non è un chip — è un pacchetto complesso che solo una manciata di strutture al mondo possono assemblare.

«Non competevamo sul prezzo. Competevamo su chi poteva ottenere GPU a qualsiasi prezzo.»

— Fondatore startup IA, 2023

La Mossa di CoreWeave

Mentre gli hyperscaler lottavano, Nvidia giocò un gioco diverso. Scommisero su CoreWeave — uno startup di mining di criptovalute diventato fornitore di cloud GPU — con assegnazione prioritaria di H100 e investimento diretto.

Il risultato? CoreWeave costruì infrastruttura massiva più velocemente di AWS o Google. Entro il 2024, Microsoft — incapace di deployare abbastanza velocemente per OpenAI — divenne il cliente più grande di CoreWeave, rappresentando il 62% dei loro ricavi.

Nvidia non vendeva solo chip. Riformò il panorama competitivo.

Quanto Costa un’Ora di GPU

Vuoi misurare il frenesí? Guarda il prezzo orario di noleggio di un H100:

Periodo	Prezzo/Ora H100	Mercato
Fine 2023	$8–$10	Carenza severa; mercati grigi fiorenti
Inizio 2024	$6–$8	Spedizioni di massa iniziano
Metà 2025	$3.50–$4.50	AWS riduce prezzi del 44%
Fine 2025	$1.50–$2.50	Guerra dei prezzi; computing commodity

Parte II: La Fortezza CUDA Sotto Assedio

Il dominio hardware di Nvidia fu costruito sul software — specificamente CUDA, lanciato nel 2006. Per quasi 20 anni, fu un fossato invalicabile. Poi apparvero le crepe.

Perché Gli Sviluppatori Erano Intrappolati

CUDA non è solo un linguaggio di programmazione. È un ecosistema di librerie matematiche ottimizzate (cuBLAS, cuDNN) che rappresentano miliardi di investimento ingegneristico. Allontanarsene significava accettare penalità di performance, bug e isolamento dalla community.

Nel 2025, Stack Overflow mostrò 50× più domande su CUDA che su ROCm di AMD. Quella disparità racconta la storia.

Il Ritorno di AMD

Il MI300X di AMD, lanciato con rinnovato investimento in ROCm, cambiò i calcoli. Da ROCm 6.2 (2024-2025):

Divario di performance ristretto: Da 40-50% di vantaggio CUDA a 10-30% medio
Vantaggio di memoria: I 192GB di MI300X superano gli 80GB di H100 in task memory-bound
Supporto framework: Integrazione PyTorch Day-0; FlashAttention e vLLM funzionanti

Microsoft e Meta iniziarono a deployare MI300X su larga scala. Il messaggio era chiaro: CUDA aveva competizione.

Quando l’IA Programma l’IA

Gennaio 2025. Claude Code — un assistente di codifica IA — portò un backend CUDA completo a ROCm di AMD in meno di 30 minuti. Storicamente, questo richiedeva strumenti imperfetti e ottimizzazione manuale pesante.

L’implicazione? Se l’IA può tradurre codice di ottimizzazione, il fossato di 20 anni di Nvidia si erode rapidamente.

Lo Strato di Astrazione in Salita

PyTorch 2.x e il compilatore Triton di OpenAI permettono agli sviluppatori di scrivere Python che viene compilato per qualsiasi target — Nvidia, AMD o TPU di Google. L’hardware sta diventando invisibile.

Questa è la vera minaccia: CUDA sepolto sotto strati di compatibilità universale.

Parte III: Il Contrattacco di Nvidia

Nvidia vide i muri avvicinarsi. La loro risposta? Accelerare tutto.

2024

Architettura Blackwell

208 miliardi di transistor; design chiplet

2025

Deploy Blackwell

Raffreddamento a liquido diventa obbligatorio

2026

Architettura Rubin

HBM4, 22 TB/s banda, IA agentica

Blackwell: Più Potenza, Più Calore

Il B200 collega due die tramite interconnect chip-to-chip di 10 TB/s, apparendo come una GPU unificata. Specifiche che definiscono “avanguardia”:

208 miliardi di transistor (TSMC 4NP)
192GB HBM3e con 8 TB/s di banda
20 petaflops FP4 tramite Transformer Engine 2a gen
1000-1200W TDP: Raffreddamento a liquido obbligatorio per cluster densi

Rubin: Il Salto Successivo

Annunciato al CES 2026, Rubin punta a “IA agentica” — sistemi che ragionano e agiscono autonomamente.

Processo 3nm (TSMC N3P)
Memoria HBM4: 22 TB/s banda, 288GB per GPU
CPU Vera: Nuovo processore compagno basato su Armv9.2

La Mossa Rack-Scale

Nvidia cambiò l’unità di computing. Non vendono più chip o server — vendono rack interi.

Il GB200 NVL72 impacchetta 72 GPU e 36 CPU in un rack-scale “supercomputer”. Le performance saltano 30× per inferenza vs. H100. Ma è uno stack completo: rete, raffreddamento, cablaggio, computing — tutto proprietario.

Acquisto significa chiusura.

Parte IV: La Ribellione degli Hyperscaler

Ecco il problema reale di Nvidia: i loro migliori clienti stanno diventando competitor.

Amazon, Google e Microsoft sono stanchi di pagare margini del 75%. Il “Grande Disaccoppiamento” è qui.

TPU v7

Google — "Ironwood"

2.8× efficienza energetica vs. H100

Trainium 3

AWS — UltraServers

50% costi di addestramento inferiori

Maia 200

Microsoft — Azure

Su misura per GPT/OpenAI

Google: Il Re dell’Efficienza

Google gioca un gioco diverso dal 2015 con i TPU. Il TPU v7 “Ironwood” (2026) raggiunge efficienza di picco:

4.6 petaflops FP8: Competitivo con Blackwell
2.8× migliore performance per watt di H100
Interconnessioni ottiche: Fino a 9.216 chip in un “Pod”

L’intero stack IA di Google — Search, YouTube, Gemini — ora gira su TPU. Non pagano più la “tassa Nvidia”.

AWS: Il Taglia-Costi

Trainium 3 punta all’addestramento di mercato di massa. Con UltraServers che impacchettano 144 chip a 362 petaflops, AWS promette costi di addestramento 50% inferiori rispetto alle istanze GPU.

L’SDK Neuron è maturato. Anthropic addestra Claude su Trainium. È praticabile per modelli all’avanguardia.

Microsoft: Il Cavallo di Troia

Maia 200 (2026) fu la sorpresa. Su misura per i modelli GPT di OpenAI, reclama 3× performance migliori di Trainium 3. Ora alimentando Microsoft 365 Copilot e inferenza GPT, libera le GPU di Nvidia per l’addestramento — ottimizzando il CapEx di Microsoft.

Il Panorama dei Chip 2026

Spec	Nvidia B200	Google TPU v7	Trainium 3	Maia 200
Memoria	192GB HBM3e	192GB HBM3e	144GB HBM3e	Custom
Interconnessione	NVLink (elettrico)	ICI (ottico)	NeuronLink	Ethernet
Punto di forza	Versatilità, ecosistema	Efficienza energetica	Costo per token	Ottimizzazione GPT

Parte V: La Cortina di Silicio

La guerra tecnologica divenne un confronto geopolitico. Gli USA, identificando l’IA come la tecnologia definitoria del XXI secolo, usarono i controlli sulle esportazioni di semiconduttori come armi diplomatiche.

Il Gioco delle Sanzioni

Mossa USA	Risposta Nvidia	Risultato
Vietare A100/H100	—	Cina bloccata
—	Lanciare A800/H800 (limitati)	Venduto fino al divieto
Vietare A800/H800	Lanciare H20 (conforme)	Ancora limitato
2026: 25% dazi + controlli rigorosi	—	Mercato Cina effettivamente chiuso

Il Piano B della Cina: Huawei Ascend

Huawei — nonostante le sanzioni USA — produsse massicciamente chip Ascend 910B e 910C. Beijing costrinse Baidu, Tencent e Alibaba a migrare. Il software (CANN) è indietro rispetto a CUDA, ma la Cina sta costruendo il proprio stack.

Accaparramento strategico: Le stime suggeriscono che la Cina abbia sufficiente capacità installata di H100 per durare 18-24 mesi.

IA Sovrana: Il Nuovo Argomento di Vendita di Nvidia

Perdendo la Cina, Nvidia girò. Promuovono “IA Sovrana” — ogni nazione necessita della propria infrastruttura per sicurezza culturale ed economica.

Francia: Partnership con Mistral AI e Bpifrance per il campus IA più grande d’Europa vicino a Parigi, alimentato da sistemi Blackwell.

Medio Oriente: Accordi complessi con G42 degli EAU — sotto stretta supervisione di Washington per prevenire backdoor verso la Cina.

Parte VI: La Storia del Denaro

Numeri Che Sfidano la Credenza

2020 → 2026

$145B → $4,7T capitalizzazione

68% → 6%

Collasso quota mercato Intel

75%

Margine lordo Nvidia

Capitalizzazione: Da $145B (2020) a $4,7T (2026). Nvidia divenne l’azienda più preziosa al mondo.

Caduta di Intel: Da 68% quota data center (2021) a 6% (2025).

Dominio dei ricavi: Nel 2026, Nvidia cattura l’86% dei ricavi dei chip per data center.

La Verifica di Realtà TCO

Ecco il problema: H100/B200 è eccessivo per l’inferenza. Per il volume massiccio di query IA, il TPU v7 di Google o Trainium 3 offrono 2-3× migliore efficienza energetica.

Qui è vulnerabile il margine di Nvidia. L’addestramento è un gioco di velocità. L’inferenza è un gioco di costi.

«Nvidia ha vinto la guerra dell'addestramento. Ma la battaglia dell'inferenza e dell'efficienza energetica sta appena iniziando.»

— Analisi settoriale, 2026

E Ora Cosa?

Inizi del 2026: Nvidia sembra intoccabile. Hardware Blackwell/Rubin. Software CUDA. Accordi di IA sovrana. Un impero da $4,7 trilioni.

Ma guarda più da vicino:

L’IA rende commodity il codice: Strumenti come Claude Code rompono il blocco software
I clienti diventano competitor: Gli hyperscaler costruiscono i propri chip
La frammentazione geopolitica: Il mondo si divide in blocchi tecnologici

La Guerra del Silicio non è finita. Il 2020-2026 fu la conquista lampo. Il 2026-2030 sarà la difesa disperata di un monopolio contro un mondo determinato a smantellarlo.

2022

Conquista

H100 & Carenza

2024

Consolidamento

Era Blackwell

2026

Egemonia

Rubin & Picco?

2027+

Incertezza

Difesa o Declino?

L’industria trattiene il respiro. Perché nella tecnologia, gli imperi cadono così velocemente come sorgono.

Il Momento Che Ha Cambiato Tutto

Parte I: La Grande Siccità delle GPU (2022-2024)

Perché l’H100 È Diventato il Bene Più Ricercato al Mondo

Il Collo di Bottiglia Che Nessuno Vide Venire

La Mossa di CoreWeave

Quanto Costa un’Ora di GPU

Parte II: La Fortezza CUDA Sotto Assedio

Perché Gli Sviluppatori Erano Intrappolati

Il Ritorno di AMD

Quando l’IA Programma l’IA

Lo Strato di Astrazione in Salita

Parte III: Il Contrattacco di Nvidia

Blackwell: Più Potenza, Più Calore

Rubin: Il Salto Successivo

La Mossa Rack-Scale

Parte IV: La Ribellione degli Hyperscaler

Google: Il Re dell’Efficienza

AWS: Il Taglia-Costi

Microsoft: Il Cavallo di Troia

Il Panorama dei Chip 2026

Parte V: La Cortina di Silicio

Il Gioco delle Sanzioni

Il Piano B della Cina: Huawei Ascend

IA Sovrana: Il Nuovo Argomento di Vendita di Nvidia

Parte VI: La Storia del Denaro

Numeri Che Sfidano la Credenza

La Verifica di Realtà TCO

E Ora Cosa?

Sommario