Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Ai luta com a estratégia: o estudo mostra que os LLMs revelam muito em jogos de dedução social

byKerem Gülen
3 Fevereiro 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Modelos de idiomas grandes (LLMs) como GPT-4, Gemini 1.5 e Claude 3.5 fizeram avanços no raciocínio, diálogo e até negociação. Mas, quando colocados em um ambiente estratégico que exige sigilo e engano, esses agentes de IA mostram uma fraqueza significativa: eles não podem manter um segredo.

Um novo estudar Dos pesquisadores Mustafa O. Karabag e Ufuk Topcu na Universidade do Texas em Austin Put LLMs à prova usando O camaleãoum jogo de tabuleiro de identidade oculta, onde os jogadores devem revelar estrategicamente, ocultar e inferir informações. Os resultados sugerem que, embora a IA possa identificar o engano, ela luta para reter informações críticas, tornando-as inadequadas para cenários adversários em que a discrição é fundamental.

Ai toca O camaleão jogo – e falha na estratégia

Em O camaleãoum grupo de jogadores recebe uma palavra secreta, exceto um – o camaleão – que deve deduzir o segredo com base nas respostas do grupo. Os jogadores que não são do Chameleon devem equilibrar o suficiente para se reconhecer, mantendo o camaleão no escuro. O jogo exige uma abordagem ajustada ao compartilhamento de informações: demais, e o Chameleon adivinha a palavra; Muito pouco, e o grupo falha em identificar o camaleão.

Quando os agentes da IA ​​assumiram os papéis, seus instintos estratégicos se desfez. Enquanto os LLMs como o GPT-4O foram capazes de identificar corretamente o camaleão 61% das vezes, sua capacidade de manter a palavra secreta oculta era sombria. O estudo constatou que o AIS de Chameleon poderia inferir a palavra secreta com uma surpreendente taxa de sucesso de 87% – amada que o esperado.


Agora, a IA pode clicar, rolar e digitar para você – mas isso é uma coisa boa?


Modelos teóricos confirmam o problema de compartilhamento excessivo de IA

Para entender essas falhas, os pesquisadores desenvolveram modelos matemáticos, prevendo estratégias ideais para ocultar e revelar informações. Teoricamente, os jogadores que não são do Chameleon devem ganhar cerca de 23% das vezes, mesmo que ignorassem completamente a palavra secreta. Em vez disso, os não-campeões da IA ​​conquistaram apenas 6% dos jogos, sugerindo que estavam vazando muita informação.

“Os agentes da IA ​​instintivamente revelam demais”, conclui o estudo. Quando os LLMs tiveram a chance de criar suas próprias estratégias, eles tendiam à divulgação excessiva, facilitando a dedução do camaleão. Isso se alinha com as descobertas de outros jogos de dedução social, como Spyfallonde os jogadores de IA demonstraram confiar demais em palavras -chave, indicando sem querer os oponentes.

Por que a IA não consegue manter segredos

Os pesquisadores levantam a hipótese de que o treinamento fundamental da IA ​​o torna inadequado para o sigilo. Os LLMs são projetados para maximizar a coerência e a utilidade, o que geralmente significa concluir padrões, em vez de reter estrategicamente informações. Essa tendência associativa entra em conflito diretamente com a necessidade de obscurecer os principais detalhes nas interações adversárias.

Para confirmar isso, os pesquisadores executaram testes adicionais usando contagens de resultados da pesquisa na web para rastrear quanta informação os jogadores de IA foram inadvertidamente reveladores. Mesmo depois de apenas uma resposta de um LLM não-Chameleon, o Chameleon AI já conseguiu adivinhar a palavra secreta com uma probabilidade de 40%-apresentando que as respostas da IA ​​carregavam muito mais informações do que o pretendido.

Quando muita informação se torna um passivo para a IA

Se os LLMs lutam com a discrição estratégica em ambientes controlados, como eles lidarão com cenários do mundo real, onde a ocultação da informação é crítica? As aplicações em segurança cibernética, diplomacia ou inteligência de negócios competitivas podem exigir que os sistemas de IA operem com nuances muito maiores.

Para abordar isso, os desenvolvedores de IA podem precisar treinar modelos com um foco mais forte na ambiguidade estratégica, reduzindo seu instinto de divulgar demais. Técnicas como aprendizado de reforço adversário ou treinamento explícito de engano podem ajudar a equilibrar a capacidade da IA ​​de inferir informações sem distribuir imediatamente o jogo.

Por enquanto, porém, a IA continua sendo um pobre jogador de poker. Embora possa ser ótimo em detectar o engano, sua incapacidade de manter segredos significa que ainda não está pronto para o mundo do raciocínio estratégico de alto risco.


Crédito da imagem em destaque: Kerem Gülen/Midjourney

Tags: AiApresentou

Related Posts

Samsung Bixby ganha poderes de pesquisa Perplexity AI em nova atualização

Samsung Bixby ganha poderes de pesquisa Perplexity AI em nova atualização

29 Dezembro 2025
O Qwen Code v0.5.0 do Alibaba transforma o terminal em um ecossistema de desenvolvimento completo

O Qwen Code v0.5.0 do Alibaba transforma o terminal em um ecossistema de desenvolvimento completo

26 Dezembro 2025
ChatGPT evolui para um pacote de escritório com novos blocos de formatação

ChatGPT evolui para um pacote de escritório com novos blocos de formatação

26 Dezembro 2025
O Google NotebookLM apresenta "Modo Palestra" para aprendizado de IA em 30 minutos

O Google NotebookLM apresenta "Modo Palestra" para aprendizado de IA em 30 minutos

26 Dezembro 2025
Amazon adiciona Angi, Expedia, Square e Yelp ao Alexa+

Amazon adiciona Angi, Expedia, Square e Yelp ao Alexa+

26 Dezembro 2025
Robotaxis Waymo pode obter assistente no carro Gemini AI

Robotaxis Waymo pode obter assistente no carro Gemini AI

25 Dezembro 2025

Recent Posts

  • Xbox e PlayStation podem atrasar o lançamento de 2028 à medida que os custos dos componentes disparam
  • SoftBank adquire DigitalBridge por US$ 4 bilhões em dinheiro
  • CachyOS desafia Ubuntu em novos benchmarks de servidor
  • Stoxx 600 bate recorde: os mercados europeus atingem um recorde enquanto as mineradoras se recuperam
  • Analista prevê estabilidade do Bitcoin em relação ao crescimento para o primeiro trimestre de 2026

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.