Openai GPT-4.5 superado Os seres humanos em um recente teste de Turing da UC San Diego, mostrando com que facilidade as pessoas podem confundir a IA com conversas reais, participando de bate-papos lado a lado.
O teste de Turing tem medido há muito tempo se uma máquina pode passar como humano através da interação baseada em texto. Nesta versão atualizada, quase 300 participantes do laboratório de idiomas e cognição da UC San Diego conversavam com um humano e uma IA antes de decidir qual era qual.
GPT-4.5, equipado com uma personalidade experiente em cultura pop, convenceu os participantes de que era humano 73 % das vezes-bem acima da referência de 50 % historicamente usada para definir um passe. Os seres humanos reais não enganaram os participantes com tanta frequência.
Outros sistemas incluíram a Llama 3 da Meta, o GPT-4O do Openai e Eliza, um dos primeiros chatbots. Sem uma persona definida, a taxa de sucesso do GPT-4.5 caiu para 36 % e o GPT-4O obteve apenas 21 %.
Os pesquisadores observam que passar no teste de Turing não significa que uma IA realmente entenda a linguagem como uma pessoa. Ainda assim, os resultados destacam o quão convincentemente esses modelos podem imitar a conversa humana, especialmente quando recebeu papéis específicos. Atualmente, as descobertas são publicadas em um servidor pré-impressão, com uma versão revisada por pares pendente.