Oito Coisas que Aprendi com The NVIDIA Way

Cadência, CUDA, e o que acontece quando o fundador sair

11 May, 2026 2123 palavras 10 minutos Book Reviews

/posts/nvidia-way-lessons/images/hero-1.png

Conteúdos

Ler The NVIDIA Way é uma viagem ao passado. No final dos anos 1990, eu acompanhava os lançamentos de placas gráficas com a atenção que a maioria das pessoas reserva para os resultados desportivos. 3dfx, S3, Matrox, ATI. Marcas que há muito desapareceram, foram absorvidas, ou se tornaram irrelevantes. Placas que na altura pareciam lendárias: a Voodoo, a Voodoo2, a Banshee. As guerras eram reais, os riscos pareciam enormes, e o salto entre gerações era suficientemente grande para que uma atualização transformasse genuinamente o que o computador conseguia fazer.

A maioria dessas empresas já não existe. A NVIDIA ronda agora os 5,35 biliões de dólares de capitalização bolsista.

O livro de Tae Kim explica porquê, e tem muito pouco a ver com ter hardware melhor. O que transformou a NVIDIA no que é hoje foi a forma como escolheram operar. Os primeiros chips da NVIDIA foram fabricados pela SGS-Thomson perto de Grenoble, em França, uma nota de rodapé curiosa. Mas as lições que importam foram construídas em Santa Clara. A leitura do livro deixou-me com oito delas a que continuo a voltar.

1. Lança. E depois lança o seguinte.

No final dos anos 1990, a 3dfx tinha hardware melhor do que a NVIDIA. Os seus chips eram tecnicamente superiores. Mesmo assim, perderam.

Ross Smith, diretor de marketing da 3dfx, resumiu a autópsia anos mais tarde: “Queríamos a perfeição em cada produto que lançávamos.” A Voodoo3 era suposta ser uma solução temporária enquanto a Napalm e a Rampage estavam em desenvolvimento. Escorregou para abril de 1999. A Napalm e a Rampage escorregaram ainda mais.

Jensen tinha reorganizado a engenharia da NVIDIA em três equipas paralelas: uma a desenhar a nova arquitetura, duas a desenvolver derivadas mais rápidas da anterior. Um novo chip de seis em seis meses, alinhado com os ciclos de renovação dos OEM. “A concorrência estará sempre a apontar atrás do pato.” A 3dfx apontava para onde a NVIDIA estava. A NVIDIA já estava a construir o que viria a seguir.

A lição não é “não ligar à qualidade.” É que o perfeccionismo à custa da cadência é uma forma lenta de perder. O mercado não espera pela versão definitiva.

Placa gráfica 3dfx Voodoo2 — A 3dfx Voodoo2, tecnicamente superior às ofertas contemporâneas da NVIDIA, mas a empresa não conseguiu igualar a cadência de lançamento semestral da NVIDIA. *Photo: Darkone / CC BY-SA 2.5*

2. O software faz parte do chip.

A maioria das empresas de semicondutores trata hardware e software como fases sequenciais. O chip é lançado, e só então a equipa de drivers começa a trabalhar. A NVIDIA inverteu isto.

Quando um chip saía da linha de produção, os drivers já tinham sido testados em todas as aplicações relevantes e verificados quanto à compatibilidade retroativa com gerações anteriores. Suporte no primeiro dia, zero fricção de integração para os OEM, e programadores que podiam contar com o ecossistema a funcionar desde o início.

O efeito cumulativo foi significativo: mesmo que um concorrente oferecesse um chip marginalmente melhor, não havia incentivo para mudar quando uma peça NVIDIA mais rápida chegaria em seis meses, sem o trabalho de instalar novos drivers. A vantagem não estava apenas no silício. Estava na camada que tornava o silício utilizável.

3. O mercado diz-lhe o que construir, se o ouvir.

Em 2002, Mark Harris era um estudante de doutoramento na Universidade da Carolina do Norte a tentar simular nuvens atmosféricas. Reparou que investigadores estavam a obter acelerações enormes ao executar simulações em placas NVIDIA GeForce 3, essencialmente a hackear hardware gráfico para fazer computação geral. Cunhou o termo GPGPU, criou um website, e a comunidade cresceu.

A NVIDIA não criou o GPGPU. Foram os académicos, ao forçar placas desenhadas para jogos a fazer simulações físicas. Jensen e Bill Dally já pensavam em computação paralela. Quando viram o que estava a acontecer fora da empresa, ouviram, e acabaram por contratar a pessoa que tinha inventado o acrónimo, que descobriu que já era jargão interno.

Essa escuta tornou-se o CUDA em 2006: um modelo de programação que transformou a GPU num processador paralelo de uso geral, acessível a qualquer programador sem ter de reformular o seu código como um problema gráfico. O CUDA baixou a barreira de “hack” para “ferramenta.” A investigação adotou-o, depois a aprendizagem automática adotou-o, e quando o boom do deep learning chegou no início dos anos 2010 e explodiu na era da IA de hoje, a infraestrutura já estava montada. Treinar um modelo de linguagem de grande escala requer exatamente o tipo de computação massivamente paralela em vírgula flutuante para o qual as GPU já eram o melhor hardware do mundo, porque a NVIDIA tinha passado uma década a construir a pilha de software para acompanhar o silício.

O boom da IA não aconteceu à NVIDIA. A NVIDIA construiu os alicerces anos antes de alguém saber para que seriam usados. Grande parte dessa trajetória remonta a uma tese de doutoramento sobre nuvens, não a um roadmap interno. Quando os utilizadores dobram um produto para um uso para o qual não foi desenhado, é o mercado a falar. Vale a pena descobrir quem está a fazer o hacking e o que está a publicar.

Fotografia do die do GPU NVIDIA TU104 — Fotografia do die do NVIDIA TU104 (arquitetura Turing, GeForce RTX 2080). O mesmo silício que impulsionou os jogos tornou-se, via CUDA, a base para o treino de IA em grande escala. *Photo: Fritzchens Fritz / CC0*

4. “É a nossa arquitetura.”

Durante o desenvolvimento de uma geração de chips, Curtis Priem, cofundador e arquiteto principal dos primeiros chips da NVIDIA, encontrou uma falha na arquitetura. Corrigiu-a, retirou a documentação do servidor partilhado e substituiu-a pela versão atualizada. Sem aviso. Era assim que sempre tinha operado.

A equipa de software entrou em colapso. Jensen interveio. Na acesa discussão que se seguiu, Priem insistiu que podia fazer o que quisesse porque tinha desenhado a arquitetura pessoalmente. “Era a minha arquitetura,” repetia.

A resposta de Jensen: “Não, é a nossa arquitetura. Não foste tu que a fizeste. Fomos nós. Esses ficheiros não te pertencem.”

Obrigou Priem a restaurar a documentação original e a concluir o trabalho de software com os ficheiros antigos. A correção arquitetural seguiu o processo normal no ano seguinte.

O sinal cultural aqui é preciso: no momento em que uma equipa depende de um trabalho, esse trabalho torna-se propriedade coletiva, independentemente de quem o construiu, incluindo fundadores. Priem notou mais tarde que Jensen descrevia os resultados de viagens de negócios importantes usando “nós”, nunca “eu”. “O que é esse ’nós’? Eu não sei nada de negociar contratos com fabs. Mas Jensen tinha razão. Fizemo-lo todos juntos.”

5. Dá o teu costelão ao bluecoat.

Durante uma crise na produção de chips, a NVIDIA contratou centenas de testadores externos, chamados internamente de “bluecoats”, para verificar lotes de componentes suspeitos. O trabalho era ingrato: turnos, testes repetitivos, sem equity. E também comiam os snacks gratuitos do escritório.

Os engenheiros da NVIDIA queixavam-se. A resposta de Jensen foi um email para toda a empresa com o assunto: “Dá o teu costelão ao bluecoat.” Se os testadores quisessem o prato principal do teu almoço, entrega-o.

Jensen, que tinha pago os estudos a limpar casas de banho e a servir mesas no Denny’s, não tolerava a hierarquia implícita que coloca o trabalho operacional abaixo do trabalho de engenharia. Os bluecoats faziam um trabalho que importava mais para a sobrevivência da empresa do que o incómodo de ficar sem comida gratuita. Disse-o diretamente, para toda a empresa.

A gratidão não é uma disposição. É um comportamento. Entregas o costelão.

6. A estratégia é ação. O sucesso é suspeito.

Após um trimestre excecional, um em que a NVIDIA tinha, como Jensen disse, “arrombado as portas”, Jensen levantou-se diante da equipa na revisão trimestral e abriu com: “Olho ao espelho todas as manhãs e digo: não vales nada.”

O momento importa. Não disse isto após um trimestre difícil. Disse-o após o melhor, precisamente o momento em que a complacência se torna o verdadeiro risco. Não era autoflagelação gratuita; era um dispositivo cultural deliberado. O sucesso não é motivo para deixar de questionar se o que se está a fazer é suficientemente bom. Não te orgulhes demasiado do passado. É a mesma postura que tornou a cadência semestral sustentável ao longo de décadas, não apenas durante alguns ciclos.

A mesma lógica anti-complacência aparece na forma como a NVIDIA planeia. Não existe um plano a cinco anos. Jensen é explícito: “A estratégia é ação. Não temos um sistema de planeamento periódico. A razão é que o mundo é uma coisa viva, que respira. Planeamos continuamente. Não há plano a cinco anos.”

Sem um plano fixo, o que mantém o alinhamento é a própria missão: não a hierarquia acima de si, não o documento do retiro do ano passado. Tomam-se decisões para o bem do cliente, não para servir o executivo acima. Isto resolve o aparente paradoxo de equipas autónomas a operar sem caos: a missão é a referência partilhada, e a estratégia é o que cada equipa faz hoje perante o estado real do mercado.

7. Qual é a velocidade da luz para isto?

Uma expressão repete-se ao longo do livro, em contextos diferentes e em fases distintas da empresa: velocidade da luz. Jensen usava-a como pergunta. Qual é a velocidade da luz para este processo? Ou seja: se removêssemos todas as fontes de fricção, atraso e trabalho desnecessário, qual seria o tempo mínimo teórico que isto poderia demorar? E depois: a que distância estamos disso?

É um modelo mental exigente. A maioria das equipas otimiza em relação ao seu próprio desempenho histórico ou em relação à concorrência. Jensen otimizava em relação à física. A diferença entre onde se está e a velocidade da luz é o desperdício ainda por eliminar. A questão não aceita “suficientemente bom” como resposta, porque a velocidade da luz é sempre a mesma.

É possível ouvi-la a correr por baixo de todas as lições desta lista. Seis meses por chip: qual é a velocidade da luz para um ciclo de chip? Drivers prontos no primeiro dia: qual é a velocidade da luz para a preparação do software? Planeamento contínuo: qual é a velocidade da luz para uma decisão estratégica? Cada lição acima é, de certa forma, a resposta da NVIDIA a essa pergunta num domínio específico.

8. A pergunta que o livro não responde completamente

Jensen Huang, cofundador e CEO da NVIDIA — Jensen Huang num evento público em Taiwan, novembro de 2023. *Photo: Taiwan Presidential Office / CC BY 2.0*

Ao ler sobre Jensen, a comparação com Steve Jobs é difícil de evitar. Ambos são CEO-fundadores que não se limitaram a gerir as suas empresas, mas a defini-las: o seu gosto, o seu ritmo, a sua cultura. Os produtos e o modelo operacional são inseparáveis da pessoa. A Apple sem Jobs tropeçou gravemente, depois recuperou o equilíbrio quando ele regressou. Após a morte de Jobs, a Apple conseguiu uma transição notavelmente bem-sucedida com Tim Cook, mas levou anos, e a questão de saber se a era mais inovadora da Apple terminou com Jobs continua em aberto.

Pode argumentar-se que a NVIDIA hoje depende mais de Jensen do que a Apple dependia de Jobs no seu auge. Cada lição neste artigo (a cadência, a pergunta da “velocidade da luz”, o espelho do “não vales nada”, o email do costelão, a propriedade coletiva, a recusa de planos a cinco anos) passa pessoalmente por Jensen. Ele não é apenas o CEO. É, num sentido real, o sistema operativo. A cultura é ele.

A Apple tinha a vantagem de linhas de produtos de hardware e de um ecossistema capaz de manter o impulso durante anos sem um visionário ao leme. A posição da NVIDIA na infraestrutura de IA exige apostas contínuas na fronteira, uma paranoia sustentada em relação à complacência, e o tipo de discernimento que transformou um hack GPGPU em CUDA numa plataforma de biliões de dólares. Esse discernimento tem sido de Jensen.

O livro foi escrito enquanto Jensen está ainda muito ao leme. É, talvez inevitavelmente, uma celebração. A questão mais difícil, o que acontece à cultura, à cadência, à paranoia, quando ele não estiver cá, é uma que Tae Kim ainda não precisa de responder. Mas é a que ficou a pairar na minha cabeça.

O padrão subjacente

A história da NVIDIA é frequentemente contada como uma história sobre GPU, IA e timing. Não está errada. Mas ao ler o livro de Kim, o que ressalta com mais clareza é a disciplina operacional por baixo: cadência em vez de perfeição, software como parte do produto, escutar o mercado em vez de lhe ditar, propriedade coletiva, gratidão como ação, autocrítica sustentada, e estratégia como um ato contínuo em vez de um documento periódico.

Notas de leitura de The NVIDIA Way: Jensen Huang and the Making of a Tech Giant (Tae Kim, 2024).