A OpenAI poderá lançar em breve uma ferramenta de IA capaz de assumir o controle dos PCs dos usuários e executar ações em seu nome, conhecida como ferramenta Operador. O engenheiro de software Tibor Blaho, conhecido por vazar com precisão os próximos produtos de IA, reivindicações ter encontrado evidências que apoiam este desenvolvimento.
OpenAI planeja lançamento em janeiro para operador de ferramenta de IA
A OpenAI está supostamente visando um Lançamento do Operador em janeiro. As descobertas recentes de Blaho incluem opções ocultas no cliente ChatGPT da OpenAI para macOS que permitem aos usuários definir atalhos para “Toggle Operator” e “Force Quit Operator”. Além disso, Blaho observa que a OpenAI adicionou referências ao Operador em seu site, embora essas referências ainda não sejam visíveis publicamente.
OpenAI lançará operador de agente autônomo de IA em janeiro
Segundo Blaho, o site também contém tabelas inéditas comparando o desempenho do Operador com outros sistemas de IA que utilizam computadores. Se os números forem precisos, indicam que o Operador não é totalmente confiável, dependendo da tarefa. Por exemplo, num benchmark no OSWorld, que simula um ambiente de computador real, o “OpenAI Computer Use Agent (CUA)” obteve uma pontuação de 38,1%, melhor que o modelo da Anthropic, mas significativamente abaixo da pontuação de 72,4% alcançada pelos humanos. O OpenAI CUA supera os agentes humanos no teste WebVoyager, que avalia as habilidades de navegação na web de uma IA, mas tem desempenho inferior em outro benchmark, o WebArena.
O Operador parece ter dificuldades com tarefas normalmente fáceis para os humanos. Nos testes que exigiam que o Operador se inscrevesse em um provedor de nuvem e lançasse uma máquina virtual, obteve sucesso em 60% das vezes. Enquanto isso, conseguiu criar uma carteira Bitcoin apenas 10% das vezes, de acordo com o vazamento benchmarks.
A OpenAI está entrando no espaço dos agentes de IA em um momento em que concorrentes como a Anthropic e o Google também estão avançando nessa área. A empresa de análise Markets and Markets projeta que o mercado para agentes de IA poderá atingir 47,1 mil milhões de dólares até 2030. Embora os agentes de IA permaneçam numa fase primitiva de desenvolvimento, alguns especialistas expressam preocupações sobre a sua segurança, especialmente se a tecnologia melhorar rapidamente.
Um gráfico vazado indica que a Operadora tem um bom desempenho em certas avaliações de segurança, especialmente na resistência a tentativas de envolvimento em atividades ilícitas e na busca de dados pessoais confidenciais. Alegadamente, os testes de segurança contribuíram para o longo ciclo de desenvolvimento do Operador. Cofundador da OpenAI, Wojciech Zaremba criticado O recente lançamento do agente da Anthropic por falta de medidas de segurança, indicando uma reação potencial se a OpenAI acelerasse um lançamento semelhante.
As críticas foram dirigidas à OpenAI por pesquisadores de IA e ex-funcionários por supostamente priorizar a rápida produção de tecnologia em vez de medidas de segurança.
Crédito da imagem: Tibor Blaho