Google detalhado sua abordagem de segurança para recursos de agente no navegador Chrome, que pode executar ações em nome dos usuários. A empresa já havia visualizado esses recursos em setembro e uma implementação mais ampla ocorrerá nos próximos meses. A empresa implementou modelos de observação e mecanismos de consentimento do usuário para gerenciar essas ações de agente. Esta estratégia aborda potenciais riscos de segurança, que podem incluir perda de dados ou implicações financeiras associadas a tais recursos. O Google emprega vários modelos para monitorar as ações dos agentes. Desenvolveu um User Alignment Critic, desenvolvido pela Gemini, que avalia itens de ação gerados por um modelo de planejador para uma tarefa específica. Se o modelo crítico considerar as tarefas propostas desalinhadas com o objetivo do usuário, ele instrui o modelo planejador a revisar sua estratégia. O modelo crítico acessa apenas os metadados da ação proposta, não o conteúdo real da web. Para evitar que agentes acessem sites não autorizados ou não confiáveis, o Google utiliza Agent Origin Sets. Esses conjuntos restringem os modelos a origens designadas somente leitura e graváveis. As origens somente leitura permitem que o Gemini consuma conteúdo, como listas de produtos em um site de compras, ao mesmo tempo que exclui elementos irrelevantes, como banners. Da mesma forma, o agente só pode interagir com iframes específicos em uma página.
Imagem: Google“Esta delimitação impõe que apenas dados de um conjunto limitado de origens estejam disponíveis para o agente, e esses dados só podem ser repassados para origens graváveis”, disse a empresa em um blog. “Isso limita o vetor de ameaça de vazamentos de dados entre origens. Isso também dá ao navegador a capacidade de impor parte dessa separação, como nem mesmo enviar ao modelo dados que estão fora do conjunto legível.” O Google também monitora a navegação nas páginas usando outro modelo de observador, que examina URLs. Este mecanismo visa impedir a navegação para URLs prejudiciais gerados por modelos. Para tarefas confidenciais, o Google exige permissão do usuário. Quando um agente tenta acessar sites que contêm informações bancárias ou médicas, ele primeiro solicita o consentimento do usuário. Para sites que exigem login, o Chrome solicita permissão do usuário para utilizar o gerenciador de senhas, garantindo que o modelo do agente não acesse os dados da senha. A empresa também buscará a aprovação do usuário antes de ações como realizar uma compra ou enviar uma mensagem. Além disso, o Google possui um classificador de injeção imediata para evitar ações indesejadas e testa continuamente suas capacidades de agente contra ataques desenvolvidos por pesquisadores. Outros desenvolvedores de navegadores de IA também se concentraram na segurança; A Perplexity lançou um novo modelo de detecção de conteúdo de código aberto no início deste mês para combater ataques de injeção imediata contra agentes.





