O Google abriu sua última suíte de modelo de IA, Gemini 2.0, ao público, marcando um passo significativo em seu esforço em direção a agentes avançados de IA. A suíte inclui Gemini 2.0 Pro Experimental, projetada para tarefas de codificação e complexas, e o Thinking Flash de Gemini 2.0, agora disponível no aplicativo Gemini.
A família Gemini 2.0 agora está aberta a todos
O Gemini 2.0 Pro Experimental é descrito como o modelo mais capaz do Google ainda, destacando -se em codificar e lidar com avisos intrincados. Possui uma janela de contexto de 2 milhões de tokens, permitindo processar aproximadamente 1,5 milhão de palavras ao mesmo tempo. O modelo pode chamar ferramentas como o Google Search e executar código em nome dos usuários. Inicialmente provocada no Changelog do aplicativo Gemini na semana passada, agora está acessível através das plataformas de desenvolvimento de AI do Google, da Vertex AI e do Google AI Studio, bem como de assinantes avançados de Gemini no aplicativo Gemini.
O flash Gemini 2.0, introduzido em dezembro, agora está geralmente disponível. Anunciado como um “modelo de cavalo de trabalho”, é otimizado para tarefas de alto volume e de alta frequência e custos desenvolvedores de 10 centavos por milhão de tokens para entradas de texto, imagem e vídeo. Além disso, o Google lançou o Gemini 2.0 Flash-Lite, seu modelo mais econômico, que corresponde ao desempenho de seu antecessor, Gemini 1.5 Flash, pelo mesmo preço e velocidade. O flash-lite custa 0,75 centavos de dólar por milhão de tokens.
Concentre -se nos agentes da IA
O liberar Alinhe -se com a estratégia mais ampla do Google de avançar a IA Agentic – modelos capazes de executar tarefas complexas e multireadas autonomamente. Em uma postagem no blog de dezembro, o Google enfatizou seu foco no desenvolvimento de modelos que “entendam mais sobre o mundo ao seu redor, pensem em vários passos à frente e agem em seu nome”. O Gemini 2.0 apresenta novos recursos multimodais, incluindo imagem nativa e saída de áudio, além de uso de ferramentas, aproximando o Google à sua visão de um assistente universal.
Esse impulso coloca o Google em concorrência direta com outros gigantes da tecnologia e startups como Meta, Amazon, Microsoft, OpenAI e Antrópica, todos investindo fortemente Ai agêntico. Os agentes da AI da Anthrópica, por exemplo, podem navegar por computadores de maneira semelhante aos seres humanos, concluindo tarefas com dezenas ou centenas de etapas. O Openai lançou recentemente operador, um agente capaz de automatizar tarefas como planejamento de férias e pedidos de supermercado, enquanto pesquisas profundas compilam relatórios complexos para os usuários.
O Google também lançou sua própria ferramenta de pesquisa profunda em dezembro, que funciona como assistente de pesquisa explorando tópicos e compilando relatórios detalhados. O CEO Sundar Pichai enfatizou a importância da execução sobre ser o primeiro, afirmando em uma reunião de estratégia de dezembro: “Eu acho que é o que é 2025”.
Competição com Deepseek
Os lançamentos do Google vêm em meio à crescente atenção à Deepseek, a startup de IA chinesa cujos modelos rivalizam ou superam os das principais empresas americanas. Modelo R1 de Deepseek ganhou tração significativa devido à sua acessibilidade e desempenho. Para combater isso, o Google está tornando o modelo Gemini 2.0 Flash Thinking Model mais acessível através do aplicativo Gemini, potencialmente visando chamar maior atenção para suas ofertas.