OpenAI, a empresa por trás do ChatGPT, está expandindo seus esforços para garantir poder computacional confiável e econômico para seus modelos de IA. Ao desenvolver silício personalizado, a OpenAI visa reduzir a dependência de fornecedores externos como a NVIDIA, cujas GPUs dominam o mercado de chips de IA. De acordo com Reuters A OpenAI fez parceria com a Broadcom e garantiu capacidade de fabricação com a Taiwan Semiconductor Manufacturing Company (TSMC), ao mesmo tempo que incorporou chips AMD em sua configuração do Microsoft Azure.
OpenAI para construir chips de IA personalizados com Broadcom e TSMC
A jornada da OpenAI para desenvolver seus próprios chips de IA começou com a montagem de uma equipe de cerca de 20 pessoas, incluindo engenheiros de ponta que trabalharam anteriormente nas unidades de processamento de tensores (TPUs) do Google. Essa equipe interna de chips, liderada por engenheiros experientes como Thomas Norrie e Richard Ho, está trabalhando em estreita colaboração com a Broadcom para projetar e produzir silício personalizado que se concentrará em cargas de trabalho de inferência. Espera-se que os chips sejam fabricados pela TSMC, a maior fundição de semicondutores do mundo, a partir de 2026.
O objetivo por trás do desenvolvimento interno de silício é duplo: garantir um fornecimento estável de chips de alto desempenho e gerenciar custos crescentes associados às cargas de trabalho de IA. Embora a demanda por chips de treinamento seja atualmente maior, os especialistas do setor prevêem que a necessidade de chips de inferência ultrapassará os chips de treinamento à medida que mais aplicações de IA atingirem o estágio de implantação. A experiência da Broadcom em ajudar a ajustar projetos de chips para produção em massa e em fornecer componentes que otimizam a movimentação de dados a torna uma parceira ideal para este ambicioso projeto.
A OpenAI já havia considerado construir suas próprias fundições de chips, mas decidiu abandonar esses planos devido aos imensos custos e tempo necessários. Em vez disso, a OpenAI está se concentrando no design de chips personalizados enquanto confia na TSMC para fabricação.
Incorporando chips AMD para diversificação
Juntamente com a parceria com a Broadcom, a OpenAI também está incorporando o novo MI300X se integra à configuração do Microsoft Azure. A AMD lançou esses chips no ano passado como parte de sua estratégia de expansão de data center, com o objetivo de capturar parte da participação de mercado atualmente detida pela NVIDIA. A inclusão de chips AMD permitirá à OpenAI diversificar o seu fornecimento de chips, reduzindo a sua dependência de um único fornecedor e ajudando a gerir os custos de forma mais eficaz.
Os chips MI300X da AMD fazem parte de seu esforço para competir com a NVIDIA, que atualmente detém mais de 80% do mercado de hardware de IA. Os chips MI300X são projetados para suportar cargas de trabalho de IA, especialmente em inferência e treinamento de modelos. Ao adicionar chips AMD à sua infraestrutura, a OpenAI espera aliviar algumas das restrições de fornecimento que enfrentou com as GPUs NVIDIA, que têm tido alta demanda e estão sujeitas à escassez.
Este movimento estratégico é também uma resposta ao aumento dos custos computacionais, que se tornaram um grande desafio para a OpenAI. A empresa tem lidado com altas despesas com hardware, eletricidade e serviços em nuvem, levando a perdas projetadas de US$ 5 bilhões este ano. Reduzir a sua dependência de um único fornecedor como a NVIDIA, que tem aumentado os seus preços, poderia ajudar a OpenAI a gerir melhor estes custos e a continuar a desenvolver os seus modelos de IA sem atrasos ou interrupções significativas.
A estrada à frente
Apesar do ambicioso plano para desenvolver chips personalizados, existem desafios significativos pela frente para a OpenAI. Construir uma solução interna de silício leva tempo e dinheiro, e não se espera que os primeiros chips personalizados estejam em produção antes de 2026. Este cronograma coloca a OpenAI atrás de alguns de seus maiores concorrentes, como Google, Microsoft e Amazon, que já fizeram progressos substanciais no desenvolvimento de seu próprio hardware de IA personalizado.
A parceria com Broadcom e TSMC representa um importante avanço, mas também destaca as dificuldades enfrentadas pelas empresas que tentam entrar no mercado de chips. A fabricação de chips de IA de alto desempenho requer experiência substancial, instalações de produção avançadas e investimentos consideráveis. A TSMC, como parceira de fabricação, desempenhará um papel fundamental na determinação do sucesso deste empreendimento. O cronograma para a produção de chips ainda pode mudar, dependendo de fatores como complexidade do projeto e capacidade de fabricação.
Outro desafio reside na aquisição de talentos. A OpenAI é cautelosa em relação à aquisição de talentos da NVIDIA, pois deseja manter um bom relacionamento com a fabricante de chips, especialmente porque ainda depende fortemente da NVIDIA para seus modelos de IA da geração atual. Espera-se que os chips Blackwell da NVIDIA sejam cruciais para os próximos projetos de IA, e manter um relacionamento positivo é essencial para o acesso contínuo da OpenAI a essas GPUs de ponta.
Por que a OpenAI precisa de silício personalizado
O principal motivador da iniciativa de chips personalizados da OpenAI é o custo. O treinamento e a implantação de grandes modelos de IA, como o GPT-4, exigem enorme poder computacional, o que se traduz em altos gastos com infraestrutura. Os custos anuais de computação da OpenAI são projetados para serem uma de suas maiores despesas, com a empresa esperando uma perda de US$ 5 bilhões este ano, apesar de gerar US$ 3,7 bilhões em receitas. Ao desenvolver seus próprios chips, a OpenAI espera controlar esses custos, proporcionando-lhe uma vantagem competitiva no concorrido mercado de IA.
O silício personalizado também oferece benefícios de desempenho. Ao adaptar chips especificamente para as necessidades de inferência de IA, a OpenAI pode otimizar o desempenho, melhorar a eficiência e reduzir a latência. Isso é particularmente importante para fornecer respostas de alta qualidade e em tempo real em produtos como o ChatGPT. Embora as GPUs da NVIDIA sejam altamente capazes, o hardware personalizado pode fornecer uma otimização mais direcionada, potencialmente levando a ganhos significativos em desempenho e eficiência de custos.
A abordagem de combinar soluções de chips internos e externos fornece à OpenAI maior flexibilidade na forma como dimensiona sua infraestrutura. Ao trabalhar com a Broadcom em designs personalizados e ao mesmo tempo incorporar GPUs AMD e NVIDIA, a OpenAI está se posicionando para enfrentar melhor os desafios da alta demanda e das limitações da cadeia de suprimentos. Esta abordagem diversificada ajudará a empresa a adaptar-se às condições de mercado em constante mudança e a garantir que dispõe dos recursos computacionais necessários para continuar a ultrapassar os limites da IA.
Crédito da imagem em destaque: Andrew Neel/Unsplash