A Deepseek, uma importante empresa de IA chinesa, enfrentou atrasos inesperados ao lançar seu modelo R2 devido a dificuldades técnicas persistentes encontradas com os chips ascend da Huawei. As autoridades chinesas incentivaram a Deepseek a utilizar processadores domésticos sobre os sistemas H20 da NVIDIA.
Apesar da assistência no local dos engenheiros da Huawei, a Deepseek não conseguiu concluir uma corrida de treinamento bem-sucedida usando chips ascend. Consequentemente, a empresa contou com hardware da NVIDIA para processos de treinamento e implantando chips ascend para tarefas de inferência. Essa abordagem de dupla hardware ressalta os desafios na transição totalmente para a infraestrutura doméstica de IA para operações complexas.
O lançamento do modelo R2, inicialmente programado para maio de 2025, foi adiado. Esse atraso surgiu dos obstáculos técnicos não resolvidos associados aos chips Ascend e requisitos estendidos de rotulagem de dados para o conjunto de dados de treinamento atualizado. O fundador da Deepseek, Liang Wenfeng, supostamente articulou a insatisfação com o progresso do desenvolvimento do modelo, indicando a necessidade de tempo adicional para garantir que o modelo possa manter a posição competitiva de Deepseek.
Os concorrentes aproveitaram os contratempos de desenvolvimento da Deepseek. O QWEN3 do Alibaba, por exemplo, integrou os algoritmos de treinamento central semelhantes aos do Deepseek, enquanto aumentam simultaneamente a eficiência e a flexibilidade em seus próprios sistemas. Esse desenvolvimento destaca a rápida evolução nos ecossistemas de IA e o potencial de rivais capitalizarem as dificuldades encontradas por startups individuais.
A iniciativa estratégica mais ampla de Pequim para a auto-suficiência de IA intensificou a pressão sobre as empresas domésticas para adotar hardware produzido localmente. Esse impulso visa reduzir a dependência da tecnologia estrangeira, principalmente de empresas como a Nvidia. No entanto, a implementação dessa estratégia revelou disparidades existentes em estabilidade, conectividade entre chips e maturidade do software ao comparar os chips da Huawei com os produtos estabelecidos da NVIDIA.
A NVIDIA enfatizou a importância estratégica de manter o acesso aos desenvolvedores chineses, observando que as restrições à adoção de tecnologia podem afetar adversamente os interesses de segurança econômica e nacional. As empresas de IA chinesas estão navegando em um cenário complexo, equilibrando as diretrizes governamentais para usar o hardware doméstico com as realidades práticas de desenvolver e implantar grandes modelos de idiomas, que geralmente requerem recursos avançados e confiáveis de processamento.
Apesar desses desafios, o modelo R2 da Deepseek ainda pode ver um lançamento nas próximas semanas. O eventual desempenho do modelo provavelmente passará por escrutínio, principalmente quando avaliado contra rivais que foram treinados usando hardware mais maduro e estabelecido. Essa situação exemplifica a tensão contínua entre os objetivos políticos nacionais, as capacidades técnicas disponíveis e as demandas práticas da implantação da IA do mundo real.





