A xAI, de propriedade de Elon Musk, começou a lançar o Grok 4.1, uma atualização para o modelo Grok 4. A versão melhora a qualidade e a velocidade, com acesso gratuito para todos os usuários para melhorar o desempenho do modelo de linguagem grande. xAI lançou duas versões do novo modelo: Grok 4.1 e Grok 4.1 Thinking. Ambos incorporam melhorias incrementais em relação às iterações anteriores. Os usuários gratuitos podem acessar esses modelos imediatamente, enquanto os clientes pagantes se beneficiam de limites de uso reduzidos. xAI afirma que o Grok 4.1 reduz as taxas de alucinação por um fator de três em comparação com os modelos anteriores. Este avanço posiciona o lançamento entre as ofertas mais fortes da xAI até o momento. As alucinações, em que os modelos geram informações imprecisas, representam um desafio fundamental no desenvolvimento de modelos de linguagem de grande porte, e essa redução decorre de melhorias direcionadas no treinamento. O desempenho em relação a concorrentes como o GPT 5.1, lançado recentemente com ganhos em desempenho e inteligência emocional, permanece não confirmado através de comparações diretas. As atualizações do GPT 5.1 se concentram em refinar a precisão das respostas e a compreensão contextual nas interações. O Text Arena da LMArena fornece dados de desempenho iniciais no Grok 4.1. Esta ferramenta de código aberto permite comparações lado a lado, cegas e aleatórias de grandes modelos de linguagem. Os usuários enviam solicitações e a plataforma combina as respostas anonimamente para classificar modelos com base nas preferências humanas. Os primeiros benchmarks do Text Arena colocam Grok 4.1 (pensando) em primeiro lugar na tabela de classificação do Arena Expert com uma pontuação de 1510. Grok 4.1 está classificado em 19º lugar com uma pontuação de 1437. Esses resultados mostram ambos os modelos alcançando novas posições no ambiente competitivo do Text Arena. A plataforma de benchmark observou: “Esta é uma melhoria de mais de 40 pontos desde Grok 4 Fast, que chegou à Arena apenas dois meses antes”. O Grok 4 entrou rapidamente na tabela de classificação em setembro de 2025, estabelecendo uma linha de base que o Grok 4.1 agora excede substancialmente. https://twitter.com/arena/status/1990530978943787291





