Ir para o conteúdo principal
Back to Insights
Nvidia IA GPU chips data center CUDA

A Ascensão da Nvidia: Como Uma Empresa Reescreveu as Regras da Computação

By Mordehai Attia 25 min read

O Momento Que Mudou Tudo

Em 2022, o mundo tech virou de cabeça para baixo. O ChatGPT foi lançado. De repente, toda empresa precisava de IA — e a IA precisava de uma coisa: GPUs da Nvidia. O que começou como uma crise de fornecimento tornou-se a maior mudança de poder na computação desde a ascensão da Intel há três décadas.

A Nvidia não vendia apenas chips. Tornaram-se os guardiões da era da IA. No início de 2026, sua capitalização de mercado atingiu $4,7 trilhões — mais do que toda a economia alemã.

$4,7T
Capitalização (início 2026)
86%
Quota mercado data center
208B
Transístores (Blackwell)

Esta é a história de como uma empresa de placas gráficas para gaming tornou-se a força mais poderosa da tecnologia — e por que seu domínio pode já estar atingindo o pico.

«A Guerra do Silício não é travada em campos de batalha. É ganha em fábricas de processo de 3 nanômetros.»

— Análise setorial, 2026

Parte I: A Grande Seca de GPU (2022-2024)

Por Que o H100 Tornou-se o Bem Mais Cobiçado do Mundo

Novembro de 2022 mudou tudo. Quando a OpenAI lançou o ChatGPT, não lançou apenas um produto — desencadeou uma busca global por poder computacional.

A GPU H100 “Hopper” da Nvidia, projetada especificamente para treino de IA, passou de tecnologia empresarial a indispensável da noite para o dia. As empresas não compravam hardware para crescer — lutavam para sobreviver. Sem H100s, não podias treinar modelos de IA de ponta. Ponto final.

Nov 2022

Lançamento ChatGPT

Demanda global por computação IA explode

Meio 2023

Crise de fornecimento H100

Prazos de entrega 6-12 meses; mercados cinzentos emergem

2024

Fornecimento recupera

Mas demanda continua a subir com cada novo modelo

O Gargalo Que Ninguém Viu Chegar

Aqui está o que a maioria ignorou: a escassez não era sobre o design de chips da Nvidia. Era sobre o empacotamento CoWoS da TSMC — a tecnologia avançada que une dies de GPU com memória de alta largura de banda.

Apenas três empresas fabricam memória HBM3: SK Hynix, Samsung e Micron. Operaram a 100% de capacidade. Os prazos de entrega estenderam-se a um ano. O H100 não é um chip — é um pacote complexo que apenas um punhado de instalações no mundo podem montar.

«Não estávamos competindo em preço. Estávamos competindo sobre quem podia obter GPUs a qualquer preço.»

— Fundador de startup de IA, 2023

A Jogada da CoreWeave

Enquanto os hyperscalers lutavam, a Nvidia jogou um jogo diferente. Apostaram na CoreWeave — uma startup de mineração de criptomoedas transformada em fornecedora de cloud GPU — com alocação prioritária de H100 e investimento direto.

O resultado? A CoreWeave construiu infraestrutura massiva mais rápido do que AWS ou Google. Até 2024, a Microsoft — incapaz de fazer deploy rápido o suficiente para a OpenAI — tornou-se o maior cliente da CoreWeave, representando 62% da sua receita.

A Nvidia não vendia apenas chips. Reformularam o panorama competitivo.

Quanto Custa Uma Hora de GPU

Queres medir o frenesim? Observa o preço horário de aluguer de um H100:

Período Preço/Hora H100 Mercado
Final 2023 $8–$10 Escassez severa; mercados cinzentos florescem
Início 2024 $6–$8 Envios em massa começam
Meio 2025 $3.50–$4.50 AWS reduz preços 44%
Final 2025 $1.50–$2.50 Guerra de preços; computação commodity

Parte II: A Fortaleza CUDA Sob Cerco

O domínio de hardware da Nvidia foi construído sobre software — especificamente CUDA, lançado em 2006. Por quase 20 anos, foi um fosso intransponível. Depois apareceram as fissuras.

Por Que Os Programadores Estavam Presos

O CUDA não é apenas uma linguagem de programação. É um ecossistema de bibliotecas matemáticas otimizadas (cuBLAS, cuDNN) que representam milhares de milhões em investimento de engenharia. Afastar-se significava aceitar penalizações de desempenho, bugs e isolamento da comunidade.

Em 2025, o Stack Overflow mostrou 50× mais perguntas sobre CUDA do que sobre ROCm da AMD. Essa disparidade conta a história.

O Regresso da AMD

O MI300X da AMD, lançado com investimento renovado em ROCm, mudou as contas. A partir de ROCm 6.2 (2024-2025):

  • Brecha de desempenho estreitou-se: De 40-50% de vantagem CUDA a 10-30% médio
  • Vantagem de memória: Os 192GB de MI300X superam os 80GB de H100 em tarefas memory-bound
  • Suporte de frameworks: Integração PyTorch Day-0; FlashAttention e vLLM a funcionar

A Microsoft e a Meta começaram a fazer deploy de MI300X em escala. A mensagem era clara: CUDA tinha concorrência.

Quando a IA Programa a IA

Janeiro de 2025. O Claude Code — um assistente de codificação de IA — portou um backend CUDA completo para ROCm da AMD em menos de 30 minutos. Historicamente, isto requeria ferramentas imperfeitas e otimização manual pesada.

A implicação? Se a IA pode traduzir código de otimização, o fosso de 20 anos da Nvidia erode rapidamente.

A Camada de Abstração em Ascensão

O PyTorch 2.x e o compilador Triton da OpenAI permitem aos programadores escrever Python que é compilado para qualquer alvo — Nvidia, AMD ou TPU do Google. O hardware está a tornar-se invisível.

Esta é a verdadeira ameaça: CUDA a ser enterrado sob camadas universais de compatibilidade.

Parte III: O Contra-ataque da Nvidia

A Nvidia viu os muros aproximarem-se. A sua resposta? Acelerar tudo.

2024

Arquitetura Blackwell

208 mil milhões de transístores; design chiplet

2025

Deploy Blackwell

Arrefecimento líquido torna-se obrigatório

2026

Arquitetura Rubin

HBM4, 22 TB/s largura de banda, IA agentica

Blackwell: Mais Potência, Mais Calor

O B200 conecta dois dies via interconnect chip-to-chip de 10 TB/s, aparecendo como uma GPU unificada. Especificações que definem “vanguarda”:

  • 208 mil milhões de transístores (TSMC 4NP)
  • 192GB HBM3e com 8 TB/s de largura de banda
  • 20 petaflops FP4 via Transformer Engine 2ª gen
  • 1000-1200W TDP: Arrefecimento líquido obrigatório para clusters densos

Rubin: O Próximo Salto

Anunciado na CES 2026, o Rubin visa “IA agentica” — sistemas que raciocinam e agem autonomamente.

  • Processo 3nm (TSMC N3P)
  • Memória HBM4: 22 TB/s largura de banda, 288GB por GPU
  • CPU Vera: Novo processador companheiro baseado em Armv9.2

A Jogada Rack-Scale

A Nvidia mudou a unidade de computação. Já não vendem chips ou servidores — vendem racks inteiros.

O GB200 NVL72 empacota 72 GPUs e 36 CPUs num rack-scale “supercomputador”. O desempenho salta 30× para inferência vs. H100. Mas é um stack completo: rede, arrefecimento, cablagem, computação — tudo proprietário.

Compra, e estás fechado.

Parte IV: Os Hyperscalers Contra-atacam

Aqui está o problema real da Nvidia: os seus melhores clientes estão a tornar-se concorrentes.

A Amazon, Google e Microsoft estão fartos de pagar margens de 75%. O “Grande Desacoplamento” está aqui.

TPU v7
Google — "Ironwood"
2.8× eficiência energética vs. H100
Trainium 3
AWS — UltraServers
50% menores custos de treino
Maia 200
Microsoft — Azure
Feito à medida para GPT/OpenAI

Google: O Rei da Eficiência

O Google joga um jogo diferente desde 2015 com TPUs. O TPU v7 “Ironwood” (2026) atinge eficiência de pico:

  • 4.6 petaflops FP8: Competitivo com Blackwell
  • 2.8× melhor desempenho por watt do que H100
  • Interligações óticas: Até 9.216 chips num “Pod”

Toda a pilha de IA do Google — Search, YouTube, Gemini — agora corre em TPU. Não pagam o “imposto Nvidia”.

AWS: O Cortador de Custos

O Trainium 3 visa o treino de mercado de massa. Com UltraServers empacotando 144 chips a 362 petaflops, a AWS promete custos de treino 50% inferiores às instâncias GPU.

O SDK Neuron amadureceu. A Anthropic treina Claude em Trainium. É viável para modelos de ponta.

Microsoft: O Cavalo de Troia

O Maia 200 (2026) foi a surpresa. Feito à medida para modelos GPT da OpenAI, reclama 3× melhor desempenho do que Trainium 3. Agora a alimentar o Microsoft 365 Copilot e inferência GPT, liberta GPUs da Nvidia para treino — otimizando o CapEx da Microsoft.

O Panorama de Chips 2026

Especificação Nvidia B200 Google TPU v7 Trainium 3 Maia 200
Memória 192GB HBM3e 192GB HBM3e 144GB HBM3e Custom
Interligação NVLink (elétrico) ICI (ótico) NeuronLink Ethernet
Ponto forte Versatilidade, ecossistema Eficiência energética Custo por token Otimização GPT

Parte V: A Cortina de Silício

A guerra tecnológica tornou-se um confronto geopolítico. Os EUA, identificando a IA como a tecnologia definidora do século XXI, usaram controles de exportação de semicondutores como armas diplomáticas.

O Jogo das Sanções

Movimento EUAResposta NvidiaResultado
Banir A100/H100China bloqueada
Lançar A800/H800 (limitados)Vendeu até proibição
Banir A800/H800Lançar H20 (conforme)Ainda restrito
2026: 25% tarifas + controlos rigorososMercado China efetivamente fechado

Plano B da China: Huawei Ascend

A Huawei — apesar das sanções dos EUA — produziu massivamente chips Ascend 910B e 910C. Beijing forçou Baidu, Tencent e Alibaba a migrarem. O software (CANN) fica atrás do CUDA, mas a China está a construir a sua própria pilha.

Acumulação estratégica: Estimativas sugerem que a China tem capacidade instalada de H100 suficiente para durar 18-24 meses.

IA Soberana: O Novo Argumento de Venda da Nvidia

Perdendo a China, a Nvidia girou. Promovem “IA Soberana” — cada nação necessita da sua própria infraestrutura para segurança cultural e económica.

França: Parceria com Mistral AI e Bpifrance para o maior campus de IA da Europa perto de Paris, alimentado por sistemas Blackwell.

Médio Oriente: Acordos complexos com G42 dos EAU — sob estrita supervisão de Washington para prevenir backdoors para a China.

Parte VI: A História do Dinheiro

Números Que Desafiam a Crença

2020 → 2026
$145B → $4,7T capitalização
68% → 6%
Colapso quota mercado Intel
75%
Margem bruta Nvidia

Capitalização: De $145B (2020) a $4,7T (2026). A Nvidia tornou-se a empresa mais valiosa do mundo.

Queda da Intel: De 68% quota data center (2021) a 6% (2025).

Domínio de receitas: Em 2026, a Nvidia captura 86% das receitas de chips para data center.

A Verificação de Realidade TCO

Aqui está o problema: H100/B200 é exagerado para inferência. Para o volume massivo de consultas de IA, o TPU v7 do Google ou Trainium 3 oferecem 2-3× melhor eficiência energética.

Aí é que a margem da Nvidia é vulnerável. O treino é um jogo de velocidade. A inferência é um jogo de custos.

«A Nvidia ganhou a guerra do treino. Mas a batalha da inferência e da eficiência energética está apenas a começar.»

— Análise setorial, 2026

E Agora?

Início de 2026: A Nvidia parece intocável. Hardware Blackwell/Rubin. Software CUDA. Acordos de IA soberana. Um império de $4,7 trilhões.

Mas olha mais de perto:

  1. A IA torna commodity o código: Ferramentas como Claude Code quebram o bloqueio de software
  2. Os clientes tornam-se concorrentes: Os hyperscalers constroem os seus próprios chips
  3. A fragmentação geopolítica: O mundo divide-se em blocos tecnológicos

A Guerra do Silício não acabou. 2020-2026 foi a conquista relâmpago. 2026-2030 será a defesa desesperada de um monopólio contra um mundo determinado a desmantelá-lo.

2022

Conquista

H100 & Escassez

2024

Consolidação

Era Blackwell

2026

Hegemonia

Rubin & Pico?

2027+

Incerteza

Defesa ou Declínio?

A indústria contém a respiração. Porque na tecnologia, impérios caem tão rápido quanto surgem.

Índice