Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Google libera Gemini 2.5 Modelo de uso do computador para criar agentes de interface do usuário

byEmre Çıtak
8 Outubro 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

O Google lançou o Modelo de Uso de Computador Gemini 2.5, um novo modelo especializado disponível na visualização através da API Gemini. Ele é construído no Gemini 2.5 Pro e permite que os desenvolvedores construam agentes de IA que possam controlar sites e aplicativos móveis clicando, digitando e rolando, assim como um humano faria. Embora os modelos de IA geralmente possam interagir com o software através de APIs estruturadas, muitas tarefas digitais, como preencher formulários ou navegar nas páginas da Web complexas, ainda exigem interação direta com uma interface gráfica do usuário (GUI). Este modelo foi projetado para automatizar essas tarefas, permitindo que os agentes operem atrás dos logins e manipulem elementos interativos, como suspensos e filtros.

Como funciona o modelo de uso do computador Gemini 2.5

Os recursos do modelo são acessados ​​por meio de uma nova ferramenta `Computer_Use` na API Gemini e operam em um loop contínuo.

  1. O desenvolvedor fornece ao agente uma solicitação de usuário, uma captura de tela da interface atual do usuário e um histórico de ações recentes.
  2. O modelo analisa essas entradas e gera uma ação sugerida, como uma chamada de função para clicar em um elemento ou digitar texto em um campo.
  3. O código do lado do cliente executa a ação.
  4. Uma nova captura de tela da GUI atualizada é enviada de volta ao modelo e o loop se repete até que a tarefa seja concluída ou terminada.

O modelo é otimizado principalmente para navegadores da Web, mas também mostra um forte desempenho nas tarefas de controle da interface do usuário móvel. Ainda não está otimizado para controlar um sistema operacional de desktop. https://www.youtube.com/watch?v=_LU-FCPUIFM

Desempenho em benchmarks

De acordo com o Google, o modelo de uso do computador Gemini 2.5 demonstra um forte desempenho em vários benchmarks de controle da Web e móveis. Nos testes conduzidos pela empresa de navegador de automação do navegador, o modelo forneceu alta precisão nas tarefas de controle do navegador, mantendo uma latência mais baixa do que os modelos concorrentes.

Recursos de segurança e controles de desenvolvedor

Reconhecendo os riscos associados a agentes de IA que podem controlar os computadores, o Google construiu recursos de segurança diretamente no modelo e forneceu controles adicionais para os desenvolvedores.

  • Treinamento de segurança interno: O modelo é treinado para abordar riscos, como uso indevido intencional pelos usuários, comportamento inesperado do modelo e ataques de injeção imediata.
  • Serviço de segurança por etapa: Um serviço de segurança externo avalia cada ação que o modelo propõe antes de ser executado.
  • Instruções do sistema: Os desenvolvedores podem especificar que o agente deve recusar ou solicitar a confirmação do usuário antes de tomar ações de alto risco, como fazer uma compra, ignorar um captcha ou controlar um dispositivo médico.

Casos de uso precoce e feedback

O modelo já foi implantado internamente no Google para testes de interface do usuário e alimenta alguns recursos do agente no modo IA na pesquisa. Os usuários de acesso antecipado o testam para assistentes pessoais e automação de fluxo de trabalho.

  • O assistente proativo Poke.com observou que o modelo costumava ser 50% mais rápido que outras soluções.
  • A empresa de agente da IA Autotab relataram que o modelo aumentou o desempenho em até 18% em suas avaliações mais difíceis para analisar de forma confiável o contexto.
  • Equipe de plataforma de pagamentos do Google Implementou o modelo para corrigir testes frágeis da interface do usuário, reabilitando com sucesso mais de 60% das execuções de teste que anteriormente teriam falhado.

Como usar o modelo de uso do computador Gemini 2.5

O modelo de uso do computador Gemini 2.5 está disponível hoje em visualização pública através da API Gemini no Google AI Studio e Vertex AI. Os desenvolvedores podem começar a construir usando a documentação fornecida e podem testar o modelo em um ambiente de demonstração hospedado pela BrowserBase.


Crédito da imagem em destaque

Tags: AiApresentouGoogleUso do computador Gemini 2.5

Related Posts

Samsung Bixby ganha poderes de pesquisa Perplexity AI em nova atualização

Samsung Bixby ganha poderes de pesquisa Perplexity AI em nova atualização

29 Dezembro 2025
O Qwen Code v0.5.0 do Alibaba transforma o terminal em um ecossistema de desenvolvimento completo

O Qwen Code v0.5.0 do Alibaba transforma o terminal em um ecossistema de desenvolvimento completo

26 Dezembro 2025
ChatGPT evolui para um pacote de escritório com novos blocos de formatação

ChatGPT evolui para um pacote de escritório com novos blocos de formatação

26 Dezembro 2025
O Google NotebookLM apresenta "Modo Palestra" para aprendizado de IA em 30 minutos

O Google NotebookLM apresenta "Modo Palestra" para aprendizado de IA em 30 minutos

26 Dezembro 2025
Amazon adiciona Angi, Expedia, Square e Yelp ao Alexa+

Amazon adiciona Angi, Expedia, Square e Yelp ao Alexa+

26 Dezembro 2025
Robotaxis Waymo pode obter assistente no carro Gemini AI

Robotaxis Waymo pode obter assistente no carro Gemini AI

25 Dezembro 2025

Recent Posts

  • Meta compra Manus, empresa de IA em rápido crescimento, em negócio de 2 bilhões de dólares
  • Gallery TV junta-se à linha de estilo de vida da LG com serviço de arte exclusivo
  • Por que o acordo Groq da Nvidia é tão importante para o futuro da IA
  • Altos custos de DDR5 levam ASUS a aumentar a produção de placas DDR4
  • A reprodução do anel de zoom do Xiaomi 17 Ultra é normal

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.