O unicórnio chinês de IA DeepSeek está mantendo a indústria em dúvida sobre o lançamento de seus modelos de próxima geração, V4 e R2. Apesar da intensa especulação sobre um possível lançamento durante o próximo Ano Novo Lunar, a empresa se recusou a comentar sobre datas específicas.
Em vez de, a empresa está deixando sua pesquisa falar. Nas últimas semanas, DeepSeek publicou vários artigos técnicos descrevendo novos métodos para contornar as atuais limitações de hardware. Com as sanções dos EUA restringindo o acesso da China às GPUs Nvidia avançadas, A pesquisa mais recente da DeepSeek concentra-se na eficiência algorítmica.
Na terça-feira, a empresa apresentou “Engrama,” uma técnica de memória condicional projetada para resolver a escassez de memória de alta largura de banda da GPU – um gargalo crítico no dimensionamento da IA. Isso segue um artigo de coautoria do CEO Liang Wenfeng sobre “hiperconexões com restrições múltiplas” (mHC), uma estrutura destinada a treinar sistemas massivos de forma mais econômica.
Os analistas acreditam que estas inovações são movimentos estratégicos para manter a dinâmica, apesar dos ventos contrários geopolíticos. “A DeepSeek só quer provar que a inovação na infraestrutura de IA impulsionaria a eficiência,“disse Zhang Ruiwang, um arquiteto de sistemas de informação baseado em Pequim.
Embora a data de lançamento dos sucessores dos modelos V3 e R1 permaneça um mistério, a empresa confirmou que sua equipe principal permanece intacta. Um artigo atualizado sobre o modelo R1 observou que todos os 18 cientistas principais originais ainda estão na empresa, desafiando as altas taxas de rotatividade da indústria chinesa.





