A Deepseek deve acelerar o lançamento de seu novo modelo de IA, R2, após o sucesso de seu modelo anterior, R1, que recentemente levou a uma venda de US $ 1 trilhão nos mercados de ações globais devido ao seu desempenho competitivo contra os colegas ocidentais.
Deepseek acelera o lançamento do modelo R2 AI após o sucesso do R1
A startup de Hangzhou originalmente pretendia lançar R2 no início de maio, mas agora está pressionando por um lançamento acelerado, de acordo com três fontes familiarizadas com a empresa. O novo modelo deve aprimorar os recursos de codificação e apoiar o raciocínio em vários idiomas além do inglês. Deepseek não comentou sobre esses desenvolvimentos.
O R1, desenvolvido usando chips NVIDIA menos poderoso, permanece competitivo com os modelos criados pelas principais empresas de tecnologia dos EUA que investiram centenas de bilhões em tecnologias de IA. Vijayasimha Alilughatta, COO de Zensar, afirmou que o lançamento do R2 poderia impactar significativamente a indústria da IA, desafiando o domínio dos líderes de mercado existentes.
Fundador e ethos operacional
Liang Wenfeng, fundador da Deepseek e um bilionário de seu fundo de hedge quantitativo, mantém um perfil baixo desde julho de 2024. Ex-funcionários descrevem a Deepseek como operando mais como um laboratório de pesquisa do que um negócio convencional, caracterizado por um estilo de gerenciamento plano que contrasta com a estrutura hierárquica comum no setor técnico da China.
Liang, que iniciou sua carreira em imagens inteligentes e mais tarde administrou uma equipe de pesquisa, foi elogiada por contratar engenheiros de algoritmos de topo e promover um ambiente colaborativo. Os funcionários observaram que muitos trabalhavam oito horas, sentindo-se capacitados para contribuir com os principais projetos. Liang enfatiza a qualidade sobre o extenso desenvolvimento de aplicativos, tendo comentado para evitar gastos pesados em favor de refinar os modelos de IA.
A compensação na Deepseek e no High-Flyer é supostamente generosa; Os cientistas de dados seniores da High-Flyer podem ganhar até 1,5 milhão de yuans anualmente, significativamente mais altos que os concorrentes. O próprio High-Flyer é reconhecido como um dos principais fundos da China, gerenciando dezenas de bilhões de yuan, apesar das pressões regulatórias sobre o setor.
Deepseek balançou o mercado uma vez e aqui está por que isso pode acontecer novamente
A borda competitiva de Deepseek decorre dos investimentos significativos da High-Flyer em pesquisa e poder de computação. A empresa alocou 70% de sua receita em relação à pesquisa de IA, construindo dois aglomerados de IA de supercomputação, incluindo um composto por 10.000 chips Nvidia A100 durante 2020 e 2021. O governo chinês inicialmente levantou preocupações sobre a aquisição de chips maciça, mas finalmente permitiu que as operações prosseguissem, que posteriormente se beneficiaram da US2.
Com uma concorrência limitada por esses recursos, a Deepseek atraiu os principais pesquisadores. A aplicação de técnicas econômicas, como a mistura de especialistas (MOE) e a atenção latente de vários pontos múltiplos (MLA), permitiu à empresa reduzir os custos de computação enquanto permanecesse competitivo. Estima -se que os preços de Deepseek sejam de 20 a 40 vezes mais baratos que modelos semelhantes do OpenAI, de acordo com os analistas de Bernstein.
Desde a introdução do R1, os gigantes da tecnologia ocidental ajustaram suas estratégias, refletidas nos cortes de preços do OpenAI e a introdução de níveis de acesso com desconto pelo Google. Os testes de benchmark da UST observaram que o R1 geralmente exigia três vezes os tokens para raciocínio em comparação com os modelos reduzidos do OpenAI.
Apoio do governo
Deepseek ganhou favor com o governo chinês, como evidenciado por Liang, participando de uma reunião de alto nível com o primeiro-ministro Li Qiang como representante do setor de IA. Os governos locais e várias empresas estatais começaram a integrar os modelos de Deepseek, indicando um forte endosso da liderança chinesa, que visa demonstrar superioridade sobre a tecnologia dos EUA.
Esse aumento ocorre no momento em que os modelos de Deepseek enfrentam a remoção de lojas de aplicativos em alguns países, incluindo Coréia do Sul e Itália, devido a preocupações com a privacidade. Os especialistas alertam que, se o DeepSeek se tornar o modelo de IA preferido para as entidades estatais chinesas, os reguladores ocidentais podem responder com restrições elevadas às exportações e colaborações de tecnologia de IA.
Liang reconheceu os desafios representados pelo embargo aos chips avançados de IA, enfatizando o financiamento não tem sido a questão principal da Deepseek.
Crédito da imagem em destaque: Matheus Bertelli/Pexels