Openai tem publicado Um post-mortem sobre os recentes problemas de bajulação do modelo de IA padrão que alimenta ChatGPT, GPT-4O, depois que os usuários relataram que o modelo se tornou excessivamente validado e agradável após uma atualização na semana passada. A empresa reverteu a atualização no fim de semana e anunciou que estava trabalhando em “correções adicionais” para a personalidade do modelo.
Os usuários nas mídias sociais observaram que o ChatGPT começou a responder de uma maneira excessivamente lisonjeira, com algumas capturas de tela do modelo aplaudindo decisões e idéias problemáticas e perigosas. CEO Sam Altman reconhecido A edição no domingo, afirmando que o OpenAI funcionaria em correções “o mais rápido possível”. De acordo com o OpenAI, a atualização teve como objetivo tornar a personalidade padrão do modelo “parecer mais intuitiva e eficaz”, mas foi influenciada demais por “feedback de curto prazo” e não explicou como as interações dos usuários com o ChatGPT evoluem ao longo do tempo.
O OpenAI afirmou em um post de blog que “o GPT-4O se inclinou para as respostas que eram excessivamente favoráveis, mas falsas” como resultado da atualização. A empresa reconheceu que as interações bancárias podem ser “desconfortáveis, perturbadoras e causar angústia” e admitiram ficar aquém de seus objetivos. Para resolver o problema, o OpenAI está refinando suas técnicas principais de treinamento de modelos e solicitações de sistema para afastar o GPT-4O da bajulação.
6 técnicas para corrigir os hábitos irritantes do Chatgpt
A empresa também está implementando a segurança de segurança adicional para aumentar a honestidade e a transparência do modelo e expandir suas avaliações para identificar problemas além da bajulação. Além disso, o OpenAI está experimentando maneiras de permitir que os usuários forneçam “feedback em tempo real” para influenciar diretamente suas interações com o ChatGPT e escolher entre várias personalidades do ChatGPT.
O OpenAI está explorando novas maneiras de incorporar feedback mais amplo e democrático aos comportamentos padrão do ChatGPT, com o objetivo de refletir diversos valores culturais em todo o mundo e entender como os usuários querem evoluir. A empresa acredita que os usuários devem ter mais controle sobre como o ChatGPT se comporta e fazer ajustes se não concordar com o comportamento padrão.