Vai al contenuto principale
Back to Insights
Nvidia IA GPU chip data center CUDA

L'ascesa di Nvidia: come un'azienda ha riscritto le regole del computing

By Mordehai Attia 25 min read

Il Momento Che Ha Cambiato Tutto

Nel 2022, il mondo tech si è capovolto. È stato lanciato ChatGPT. Improvvisamente, ogni azienda aveva bisogno di IA — e l’IA aveva bisogno di una cosa: le GPU di Nvidia. Ciò che iniziò come una crisi di approvvigionamento divenne il più grande cambiamento di potere nel computing dall’ascesa di Intel tre decenni fa.

Nvidia non vendeva solo chip. Divennero i guardiani dell’era dell’IA. Agli inizi del 2026, la loro capitalizzazione di mercato ha raggiunto i $4,7 trilioni — più dell’intera economia tedesca.

$4,7T
Capitalizzazione (inizio 2026)
86%
Quota mercato data center
208 Mld
Transistor (Blackwell)

Questa è la storia di come un’azienda di schede grafiche per gaming è diventata la forza più potente della tecnologia — e perché il suo dominio potrebbe già aver raggiunto il picco.

«La Guerra del Silicio non si combatte sui campi di battaglia. Si vince nelle fabbriche di processo a 3 nanometri.»

— Analisi settoriale, 2026

Parte I: La Grande Siccità delle GPU (2022-2024)

Perché l’H100 È Diventato il Bene Più Ricercato al Mondo

Il novembre 2022 ha cambiato tutto. Quando OpenAI lanciò ChatGPT, non lanciò solo un prodotto — scatenò una ricerca globale per potenza computazionale.

La GPU H100 “Hopper” di Nvidia, progettata specificamente per l’addestramento IA, passò da tecnologia aziendale a indispensabile overnight. Le aziende non compravano hardware per crescere — lottavano per sopravvivere. Senza H100, non potevi addestrare modelli IA all’avanguardia. Punto.

Nov 2022

Lancio ChatGPT

La domanda globale di computing IA esplode

Metà 2023

Crisi di approvvigionamento H100

Tempi di consegna 6-12 mesi; mercati grigi emergono

2024

Approvvigionamento si recupera

Ma la domanda continua a salire con ogni nuovo modello

Il Collo di Bottiglia Che Nessuno Vide Venire

Ecco cosa la maggior parte ha trascurato: la carenza non riguardava il design dei chip di Nvidia. Riguardava il packaging CoWoS di TSMC — la tecnologia avanzata che unisce i die GPU con memoria ad alta larghezza di banda.

Solo tre aziende producono memoria HBM3: SK Hynix, Samsung e Micron. Operarono al 100% di capacità. I tempi di consegna si estesero a un anno. L’H100 non è un chip — è un pacchetto complesso che solo una manciata di strutture al mondo possono assemblare.

«Non competevamo sul prezzo. Competevamo su chi poteva ottenere GPU a qualsiasi prezzo.»

— Fondatore startup IA, 2023

La Mossa di CoreWeave

Mentre gli hyperscaler lottavano, Nvidia giocò un gioco diverso. Scommisero su CoreWeave — uno startup di mining di criptovalute diventato fornitore di cloud GPU — con assegnazione prioritaria di H100 e investimento diretto.

Il risultato? CoreWeave costruì infrastruttura massiva più velocemente di AWS o Google. Entro il 2024, Microsoft — incapace di deployare abbastanza velocemente per OpenAI — divenne il cliente più grande di CoreWeave, rappresentando il 62% dei loro ricavi.

Nvidia non vendeva solo chip. Riformò il panorama competitivo.

Quanto Costa un’Ora di GPU

Vuoi misurare il frenesí? Guarda il prezzo orario di noleggio di un H100:

Periodo Prezzo/Ora H100 Mercato
Fine 2023 $8–$10 Carenza severa; mercati grigi fiorenti
Inizio 2024 $6–$8 Spedizioni di massa iniziano
Metà 2025 $3.50–$4.50 AWS riduce prezzi del 44%
Fine 2025 $1.50–$2.50 Guerra dei prezzi; computing commodity

Parte II: La Fortezza CUDA Sotto Assedio

Il dominio hardware di Nvidia fu costruito sul software — specificamente CUDA, lanciato nel 2006. Per quasi 20 anni, fu un fossato invalicabile. Poi apparvero le crepe.

Perché Gli Sviluppatori Erano Intrappolati

CUDA non è solo un linguaggio di programmazione. È un ecosistema di librerie matematiche ottimizzate (cuBLAS, cuDNN) che rappresentano miliardi di investimento ingegneristico. Allontanarsene significava accettare penalità di performance, bug e isolamento dalla community.

Nel 2025, Stack Overflow mostrò 50× più domande su CUDA che su ROCm di AMD. Quella disparità racconta la storia.

Il Ritorno di AMD

Il MI300X di AMD, lanciato con rinnovato investimento in ROCm, cambiò i calcoli. Da ROCm 6.2 (2024-2025):

  • Divario di performance ristretto: Da 40-50% di vantaggio CUDA a 10-30% medio
  • Vantaggio di memoria: I 192GB di MI300X superano gli 80GB di H100 in task memory-bound
  • Supporto framework: Integrazione PyTorch Day-0; FlashAttention e vLLM funzionanti

Microsoft e Meta iniziarono a deployare MI300X su larga scala. Il messaggio era chiaro: CUDA aveva competizione.

Quando l’IA Programma l’IA

Gennaio 2025. Claude Code — un assistente di codifica IA — portò un backend CUDA completo a ROCm di AMD in meno di 30 minuti. Storicamente, questo richiedeva strumenti imperfetti e ottimizzazione manuale pesante.

L’implicazione? Se l’IA può tradurre codice di ottimizzazione, il fossato di 20 anni di Nvidia si erode rapidamente.

Lo Strato di Astrazione in Salita

PyTorch 2.x e il compilatore Triton di OpenAI permettono agli sviluppatori di scrivere Python che viene compilato per qualsiasi target — Nvidia, AMD o TPU di Google. L’hardware sta diventando invisibile.

Questa è la vera minaccia: CUDA sepolto sotto strati di compatibilità universale.

Parte III: Il Contrattacco di Nvidia

Nvidia vide i muri avvicinarsi. La loro risposta? Accelerare tutto.

2024

Architettura Blackwell

208 miliardi di transistor; design chiplet

2025

Deploy Blackwell

Raffreddamento a liquido diventa obbligatorio

2026

Architettura Rubin

HBM4, 22 TB/s banda, IA agentica

Blackwell: Più Potenza, Più Calore

Il B200 collega due die tramite interconnect chip-to-chip di 10 TB/s, apparendo come una GPU unificata. Specifiche che definiscono “avanguardia”:

  • 208 miliardi di transistor (TSMC 4NP)
  • 192GB HBM3e con 8 TB/s di banda
  • 20 petaflops FP4 tramite Transformer Engine 2a gen
  • 1000-1200W TDP: Raffreddamento a liquido obbligatorio per cluster densi

Rubin: Il Salto Successivo

Annunciato al CES 2026, Rubin punta a “IA agentica” — sistemi che ragionano e agiscono autonomamente.

  • Processo 3nm (TSMC N3P)
  • Memoria HBM4: 22 TB/s banda, 288GB per GPU
  • CPU Vera: Nuovo processore compagno basato su Armv9.2

La Mossa Rack-Scale

Nvidia cambiò l’unità di computing. Non vendono più chip o server — vendono rack interi.

Il GB200 NVL72 impacchetta 72 GPU e 36 CPU in un rack-scale “supercomputer”. Le performance saltano 30× per inferenza vs. H100. Ma è uno stack completo: rete, raffreddamento, cablaggio, computing — tutto proprietario.

Acquisto significa chiusura.

Parte IV: La Ribellione degli Hyperscaler

Ecco il problema reale di Nvidia: i loro migliori clienti stanno diventando competitor.

Amazon, Google e Microsoft sono stanchi di pagare margini del 75%. Il “Grande Disaccoppiamento” è qui.

TPU v7
Google — "Ironwood"
2.8× efficienza energetica vs. H100
Trainium 3
AWS — UltraServers
50% costi di addestramento inferiori
Maia 200
Microsoft — Azure
Su misura per GPT/OpenAI

Google: Il Re dell’Efficienza

Google gioca un gioco diverso dal 2015 con i TPU. Il TPU v7 “Ironwood” (2026) raggiunge efficienza di picco:

  • 4.6 petaflops FP8: Competitivo con Blackwell
  • 2.8× migliore performance per watt di H100
  • Interconnessioni ottiche: Fino a 9.216 chip in un “Pod”

L’intero stack IA di Google — Search, YouTube, Gemini — ora gira su TPU. Non pagano più la “tassa Nvidia”.

AWS: Il Taglia-Costi

Trainium 3 punta all’addestramento di mercato di massa. Con UltraServers che impacchettano 144 chip a 362 petaflops, AWS promette costi di addestramento 50% inferiori rispetto alle istanze GPU.

L’SDK Neuron è maturato. Anthropic addestra Claude su Trainium. È praticabile per modelli all’avanguardia.

Microsoft: Il Cavallo di Troia

Maia 200 (2026) fu la sorpresa. Su misura per i modelli GPT di OpenAI, reclama 3× performance migliori di Trainium 3. Ora alimentando Microsoft 365 Copilot e inferenza GPT, libera le GPU di Nvidia per l’addestramento — ottimizzando il CapEx di Microsoft.

Il Panorama dei Chip 2026

Spec Nvidia B200 Google TPU v7 Trainium 3 Maia 200
Memoria 192GB HBM3e 192GB HBM3e 144GB HBM3e Custom
Interconnessione NVLink (elettrico) ICI (ottico) NeuronLink Ethernet
Punto di forza Versatilità, ecosistema Efficienza energetica Costo per token Ottimizzazione GPT

Parte V: La Cortina di Silicio

La guerra tecnologica divenne un confronto geopolitico. Gli USA, identificando l’IA come la tecnologia definitoria del XXI secolo, usarono i controlli sulle esportazioni di semiconduttori come armi diplomatiche.

Il Gioco delle Sanzioni

Mossa USARisposta NvidiaRisultato
Vietare A100/H100Cina bloccata
Lanciare A800/H800 (limitati)Venduto fino al divieto
Vietare A800/H800Lanciare H20 (conforme)Ancora limitato
2026: 25% dazi + controlli rigorosiMercato Cina effettivamente chiuso

Il Piano B della Cina: Huawei Ascend

Huawei — nonostante le sanzioni USA — produsse massicciamente chip Ascend 910B e 910C. Beijing costrinse Baidu, Tencent e Alibaba a migrare. Il software (CANN) è indietro rispetto a CUDA, ma la Cina sta costruendo il proprio stack.

Accaparramento strategico: Le stime suggeriscono che la Cina abbia sufficiente capacità installata di H100 per durare 18-24 mesi.

IA Sovrana: Il Nuovo Argomento di Vendita di Nvidia

Perdendo la Cina, Nvidia girò. Promuovono “IA Sovrana” — ogni nazione necessita della propria infrastruttura per sicurezza culturale ed economica.

Francia: Partnership con Mistral AI e Bpifrance per il campus IA più grande d’Europa vicino a Parigi, alimentato da sistemi Blackwell.

Medio Oriente: Accordi complessi con G42 degli EAU — sotto stretta supervisione di Washington per prevenire backdoor verso la Cina.

Parte VI: La Storia del Denaro

Numeri Che Sfidano la Credenza

2020 → 2026
$145B → $4,7T capitalizzazione
68% → 6%
Collasso quota mercato Intel
75%
Margine lordo Nvidia

Capitalizzazione: Da $145B (2020) a $4,7T (2026). Nvidia divenne l’azienda più preziosa al mondo.

Caduta di Intel: Da 68% quota data center (2021) a 6% (2025).

Dominio dei ricavi: Nel 2026, Nvidia cattura l’86% dei ricavi dei chip per data center.

La Verifica di Realtà TCO

Ecco il problema: H100/B200 è eccessivo per l’inferenza. Per il volume massiccio di query IA, il TPU v7 di Google o Trainium 3 offrono 2-3× migliore efficienza energetica.

Qui è vulnerabile il margine di Nvidia. L’addestramento è un gioco di velocità. L’inferenza è un gioco di costi.

«Nvidia ha vinto la guerra dell'addestramento. Ma la battaglia dell'inferenza e dell'efficienza energetica sta appena iniziando.»

— Analisi settoriale, 2026

E Ora Cosa?

Inizi del 2026: Nvidia sembra intoccabile. Hardware Blackwell/Rubin. Software CUDA. Accordi di IA sovrana. Un impero da $4,7 trilioni.

Ma guarda più da vicino:

  1. L’IA rende commodity il codice: Strumenti come Claude Code rompono il blocco software
  2. I clienti diventano competitor: Gli hyperscaler costruiscono i propri chip
  3. La frammentazione geopolitica: Il mondo si divide in blocchi tecnologici

La Guerra del Silicio non è finita. Il 2020-2026 fu la conquista lampo. Il 2026-2030 sarà la difesa disperata di un monopolio contro un mondo determinato a smantellarlo.

2022

Conquista

H100 & Carenza

2024

Consolidamento

Era Blackwell

2026

Egemonia

Rubin & Picco?

2027+

Incertezza

Difesa o Declino?

L’industria trattiene il respiro. Perché nella tecnologia, gli imperi cadono così velocemente come sorgono.

Sommario