QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados

Alibaba lançado Qwen3, uma família de modelos de IA que a empresa reivindica e às vezes supera os melhores modelos do Google e do OpenAI, na segunda -feira. Os modelos variam em tamanho de 0,6 bilhão de parâmetros a 235 bilhões de parâmetros e estão disponíveis para download sob uma licença “aberta” da plataforma AI Dev Abraçando o rosto e Github.

Os modelos QWEN3 são descritos como “híbridos” porque podem reservar um tempo para “raciocinar” por meio de problemas complexos ou responder a solicitações mais simples rapidamente. Essa capacidade de raciocínio permite que os modelos se chiquem de maneira eficaz, semelhante ao modelo O3 do OpenAI, mas com maior latência. De acordo com a equipe de Qwen, eles “têm” modos de pensamento e sem pensamento integrados, oferecendo aos usuários a flexibilidade para controlar o orçamento de pensamento “.

Alguns modelos QWEN3 adotam uma mistura de arquitetura de especialistas (MOE), que pode ser mais eficiente computacionalmente para responder consultas. Moe divide as tarefas em subtarefas e as delega em modelos menores e especializados “especializados”. Os modelos suportam 119 idiomas e foram treinados em um conjunto de dados de quase 36 trilhões de tokens, incluindo livros didáticos, pares de perguntas e respostas, trechos de código e dados gerados pela AI.

QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados — Benchmarks compartilhados por Alibaba

Alibaba As alegações de que os recursos da QWEN3 melhoraram bastante em comparação com seu antecessor, QWEN2. O maior modelo QWEN3, QWEN-3-235B-A22B, tem um desempenho competitivo em avaliações de referência, vencendo o O3-Mini do OpenAI e o Gemini 2.5 Pro no Codeforces do Google, uma plataforma para concursos de programação. Ele também supera a O3-mini na versão mais recente do AIME, um desafio de referência matemática e BFCL, um teste para avaliar a capacidade de um modelo de raciocinar sobre problemas.

QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados_02 — Benchmarks compartilhados por Alibaba

Embora o QWEN-3-235B-A22B não esteja disponível ao público, o maior modelo público QWEN3, QWEN3-32B, ainda é competitivo com vários modelos de IA proprietários e abertos. O QWEN3-32B supera o modelo O1 do OpenAI em vários testes, incluindo o benchmark de codificação LivecodeBench. O Alibaba diz que o QWEN3 se destaca nos recursos de chamada de ferramentas, seguindo instruções e copiando formatos de dados específicos.

Tuhin Srivastava, co-fundador e CEO da AI Cloud Host Baseten, observou que a QWEN3 é outro exemplo de modelos abertos que acompanham o ritmo com sistemas de código fechado como o OpenAI. Ele acrescentou que modelos como o QWEN3 provavelmente serão usados no mercado interno, apesar das restrições dos EUA nas vendas de chips para a China.

O QWEN3 está disponível para download e através de provedores de nuvem, incluindo fogos de artifício e hiperbólicos.

Crédito da imagem em destaque