O mais recente empreendimento do Google, codinome “Projeto Jarvis”, foi criado para aproveitar a IA para automatizar tarefas baseadas na web no navegador Chrome.
De acordo com A informaçãoeste projeto baseado em IA, com estreia prevista para dezembro, é impulsionado por Gêmeos 2.0 do Google modelo e representa uma ferramenta voltada para o consumidor que visa simplificar as interações online. Inspirado no assistente fictício JARVIS da Marvel, Jarvis executará tarefas digitais de várias etapas de forma autônoma, abrangendo tudo, desde compras online até reservas de viagens.
Gemini 2.0 impulsiona o Projeto Jarvis
Gemini 2.0, a mais recente iteração do modelo avançado de IA do Google, serve de base para o Projeto Jarvis. Revelado em E/S do Google 2024o Gemini foi projetado com melhorias no raciocínio, planejamento e memória, todos visando auxiliar os usuários na conclusão de tarefas complexas e de várias etapas de forma autônoma.
Como explicou o CEO do Google, Sundar Pichai, durante o I/O, o objetivo é criar “sistemas inteligentes que mostrem raciocínio, planejamento e memória, [and are] capaz de pensar vários passos à frente” enquanto permanece totalmente supervisionado pelo usuário. Com esses recursos, a Gemini pretende fornecer um “exemplo emblemático”de como os futuros agentes de IA podem aumentar a produtividade e reduzir as contribuições dos usuários.

O que distingue Jarvis é a sua capacidade de operar dentro do Cromo navegador, captura de tela para orientar suas interações com formulários e botões online. De acordo com The Information, Jarvis faz capturas de tela frequentes da janela do Chrome de um usuário para interpretar cada interface, permitindo “clicar” em botões, digitar em campos ou até mesmo comparar itens entre sites.
O método baseado em captura de tela também permite que Jarvis entender formas complexas e layouts que variam amplamente entre diferentes sites. No entanto, esse recurso significa que Jarvis opera de forma relativamente lenta, demorando alguns segundos para analisar cada captura de tela antes de prosseguir para a próxima etapa. Embora ainda não esteja otimizada para velocidade, esta tecnologia demonstra a estratégia do Google de usar recursos baseados em nuvem para suportar tarefas complexas de IA que, de outra forma, exigiriam poder de processamento no dispositivo.
E quanto aos aplicativos?
O Projeto Jarvis promete mudar a forma como os usuários interagem com as plataformas digitais, com ênfase na automatização de tarefas rotineiras baseadas na web, como compra de produtos, reserva de voos ou coleta de pesquisas.
Esse recurso pode atrair um público amplo, desde profissionais ocupados até usuários comuns que buscam agilizar tarefas. O relatório da Information destaca que Jarvis permitirá que os usuários concluam extensos processos baseados na web com o mínimo de entradapermitindo-lhes delegar atividades demoradas à IA. Ao fazer isso, o Google pretende posicionar o Jarvis como uma ferramenta voltada para o consumidor e focada na produtividade, assim como Visão copiloto da Microsoft ou da Apple Inteligência da Apple.
Quando os usuários podem acessar o Google Jarvis?
Os relatórios sugerem que uma prévia do Projeto Jarvis pode estrear em dezembroembora os detalhes possam mudar. A empresa provavelmente lançará a ferramenta inicialmente para um público limitado para identificar e resolver quaisquer bugs ou limitações antes de uma implementação mais ampla.
O Google usou uma abordagem semelhante para lançamentos de produtos anteriores, como seu Bardo IAdando aos primeiros usuários a oportunidade de oferecer feedback e contribuir com refinamentos antes de uma disponibilidade mais ampla. Esta fase de testes pode moldar a forma como o Google otimiza o Jarvis para um desempenho mais rápido e contínuo, ao mesmo tempo que garante que os protocolos de segurança atendam às expectativas do usuário.

Aí vem as preocupações
Como assistente de IA com controle significativo sobre a experiência do usuário na web, Jarvis levanta novas questões de privacidade e segurança. Como Jarvis depende da interpretação de capturas de tela de informações potencialmente confidenciais, medidas de segurança robustas serão essenciais para garantir que os dados do usuário permaneçam protegidos. O plano do Google inclui testes intensos dessas salvaguardas antes que Jarvis veja um lançamento mais amplo, mas os riscos potenciais associados a um nível tão alto de acesso ao sistema estão gerando debate entre defensores da privacidade e desenvolvedores.
Ao conceder a ferramentas de IA como Jarvis controle direto sobre os dispositivos dos usuários, o Google deve implementar salvaguardas para evitar vulnerabilidades e acesso não autorizado. Embora o Projeto Jarvis ainda esteja em desenvolvimento, ele promete ser um divisor de águas na produtividade orientada por IA, permitindo aos usuários delegar tarefas complexas e de várias etapas no navegador Chrome. Ao combinar o poder do Gemini 2.0 com os recursos web do Chrome, o Google está criando uma IA que poderá redefinir a forma como abordamos as tarefas digitais, desde compras até pesquisas.
À medida que o Google finaliza o Jarvis para uso do consumidor, seu sucesso poderá abrir caminho para experiências de IA mais avançadas e autônomas, mudando a forma como interagimos com os navegadores e, potencialmente, com a tecnologia em geral.
Créditos da imagem: Emre Çıtak/Ideograma IA