Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados

byKerem Gülen
29 Abril 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Alibaba lançado Qwen3, uma família de modelos de IA que a empresa reivindica e às vezes supera os melhores modelos do Google e do OpenAI, na segunda -feira. Os modelos variam em tamanho de 0,6 bilhão de parâmetros a 235 bilhões de parâmetros e estão disponíveis para download sob uma licença “aberta” da plataforma AI Dev Abraçando o rosto e Github.

Os modelos QWEN3 são descritos como “híbridos” porque podem reservar um tempo para “raciocinar” por meio de problemas complexos ou responder a solicitações mais simples rapidamente. Essa capacidade de raciocínio permite que os modelos se chiquem de maneira eficaz, semelhante ao modelo O3 do OpenAI, mas com maior latência. De acordo com a equipe de Qwen, eles “têm” modos de pensamento e sem pensamento integrados, oferecendo aos usuários a flexibilidade para controlar o orçamento de pensamento “.

Alguns modelos QWEN3 adotam uma mistura de arquitetura de especialistas (MOE), que pode ser mais eficiente computacionalmente para responder consultas. Moe divide as tarefas em subtarefas e as delega em modelos menores e especializados “especializados”. Os modelos suportam 119 idiomas e foram treinados em um conjunto de dados de quase 36 trilhões de tokens, incluindo livros didáticos, pares de perguntas e respostas, trechos de código e dados gerados pela AI.

QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados
Benchmarks compartilhados por Alibaba

Alibaba As alegações de que os recursos da QWEN3 melhoraram bastante em comparação com seu antecessor, QWEN2. O maior modelo QWEN3, QWEN-3-235B-A22B, tem um desempenho competitivo em avaliações de referência, vencendo o O3-Mini do OpenAI e o Gemini 2.5 Pro no Codeforces do Google, uma plataforma para concursos de programação. Ele também supera a O3-mini na versão mais recente do AIME, um desafio de referência matemática e BFCL, um teste para avaliar a capacidade de um modelo de raciocinar sobre problemas.

QWEN3 mostra que modelos abertos ainda podem rivalizar com gigantes fechados_02
Benchmarks compartilhados por Alibaba

Embora o QWEN-3-235B-A22B não esteja disponível ao público, o maior modelo público QWEN3, QWEN3-32B, ainda é competitivo com vários modelos de IA proprietários e abertos. O QWEN3-32B supera o modelo O1 do OpenAI em vários testes, incluindo o benchmark de codificação LivecodeBench. O Alibaba diz que o QWEN3 se destaca nos recursos de chamada de ferramentas, seguindo instruções e copiando formatos de dados específicos.

Tuhin Srivastava, co-fundador e CEO da AI Cloud Host Baseten, observou que a QWEN3 é outro exemplo de modelos abertos que acompanham o ritmo com sistemas de código fechado como o OpenAI. Ele acrescentou que modelos como o QWEN3 provavelmente serão usados ​​no mercado interno, apesar das restrições dos EUA nas vendas de chips para a China.

O QWEN3 está disponível para download e através de provedores de nuvem, incluindo fogos de artifício e hiperbólicos.


Crédito da imagem em destaque

Tags: AlibabaQwen

Related Posts

Substack vai para a sala com lançamento de aplicativo beta de TV

Substack vai para a sala com lançamento de aplicativo beta de TV

23 Janeiro 2026
JBL lança amplificadores BandBox alimentados por IA

JBL lança amplificadores BandBox alimentados por IA

23 Janeiro 2026
Google lança opt-in "Inteligência Pessoal" para usuários AI Pro e Ultra

Google lança opt-in "Inteligência Pessoal" para usuários AI Pro e Ultra

23 Janeiro 2026
Spotify lança listas de reprodução solicitadas com tecnologia de IA

Spotify lança listas de reprodução solicitadas com tecnologia de IA

22 Janeiro 2026
Snap lança rastreamento granular do tempo de tela na atualização do Family Center

Snap lança rastreamento granular do tempo de tela na atualização do Family Center

22 Janeiro 2026
O Google Fotos redesenha o compartilhamento com carrossel imersivo em tela cheia

O Google Fotos redesenha o compartilhamento com carrossel imersivo em tela cheia

22 Janeiro 2026

Recent Posts

  • Barret Zoph liderará o pivô comercial agressivo da OpenAI
  • Substack vai para a sala com lançamento de aplicativo beta de TV
  • LiveKit obtém avaliação de US$ 1 bilhão como mecanismo por trás do modo de voz do ChatGPT
  • Vimeo inicia demissões de funcionários após aquisição da Bending Spoons
  • AWS e Prime Video atingem enquanto Amazon prepara nova onda de demissões

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.