Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Conheça o DBRX, um novo LLM de código aberto pode fazer você parar de usar o ChatGPT

byEray Eliaçık
28 Março 2024
in Sem categoria
Share on FacebookShare on Twitter

Databricks apresenta DBRX, um modelo inovador de linguagem de código aberto preparado para revolucionar a compreensão da linguagem. Construído em uma arquitetura avançada, o DBRX mostra um progresso notável em tarefas como codificação e resolução de problemas matemáticos. Superando alguns modelos, você acha que eles são os melhores do mercado de LLM!

Mas o que diferencia o DBRX dos demais? Vamos nos aprofundar em seu processo de desenvolvimento e explorar os recursos interessantes que ele oferece.

O que é DBRX?

DBRX é um modelo de linguagem grande (LLM) de código aberto desenvolvido pela Databricks, com o objetivo de oferecer uma alternativa competitiva no cenário em rápida evolução da inteligência artificial. Construído sobre uma arquitetura refinada de mistura de especialistas (MoE), o DBRX demonstra avanços notáveis ​​na compreensão da linguagem, particularmente em tarefas de programação e raciocínio matemático. Notavelmente, ele supera alguns modelos estabelecidos como o GPT-3.5 e compete razoavelmente com modelos fechados como o Gemini 1.0 Pro.

Modelo DBRX
Instruir
GPT-3.5 GPT-4 Claude 3 Haiku Soneto de Cláudio 3 Cláudio 3 Opus Gêmeos 1.0 Pró Gêmeos 1.5 Pró Mistral Médio Mistral Grande
Banco MT (inflexão corrigida, n=5) 8,39±0,08 – – 8,41±0,04 8,54±0,09 9,03±0,06 8,23±0,08 – 8,05±0,12 8,90±0,06
MMLU 5 tiros 73,7% 70,0% 86,4% 75,2% 79,0% 86,8% 71,8% 81,9% 75,3% 81,2%
HellaSwag 10 tiros 89,0% 85,5% 95,3% 85,9% 89,0% 95,4% 84,7% 92,5% 88,0% 89,2%
HumanEval 0 tiro
passar@1
(Programação)
70,1%

temperatura=0, N=1

48,1% 67,0% 75,9% 73,0% 84,9% 67,7% 71,9% 38,4% 45,1%
GSM8k CoT maj@1 72,8% (5 tiros) 57,1% (5 tiros) 92,0% (5 tiros) 88,9% 92,3% 95,0% 86,5%

(maj1@32)

91,7% (11 disparos) 66,7% (5 tiros) 81,0% (5 tiros)
WinoGrande 5 tiros 81,8% 81,6% 87,5% – – – – – 88,0% 86,7%

O DBRX foi desenvolvido através de um processo intensivo que durou três meses, baseado em meses de pesquisa e experimentação anteriores. O treinamento foi realizado em uma infraestrutura poderosa composta por 3.072 NVIDIA H100está conectado por Infiniband de 3,2 Tbps. Aproveitando o conjunto de ferramentas do Databricks, incluindo o Unity Catalog para governança de dados, Lilac AI para exploração de dados, notebooks Apache Spark e Databricks para processamento de dados e bibliotecas de treinamento otimizadas, como MegaBlocks e LLM Foundry, o DBRX foi treinado e ajustado em milhares de GPUs usando o serviço Mosaic AI Training. Os resultados foram registrados usando o MLflow e o feedback humano foi coletado para melhoria da qualidade por meio do Mosaic AI Model Serving e Inference Tables.

Então, o que o DBRX pode fazer? Ele pode fazer muitas coisas, como responder perguntas, escrever códigos, resolver problemas matemáticos e analisar dados. Também pode ajudar na escrita, corrigindo a gramática e sugerindo melhorias. O DBRX pode compreender diferentes idiomas e até analisar sentimentos em texto. É como um assistente inteligente que pode realizar muitas tarefas que envolvem linguagem e dados. Além disso, os usuários podem personalizá-lo para necessidades específicas. O DBRX pode surpreendê-lo com seu desempenho em comparação com outros aplicativos populares. LLMs.

Descubra o DBRX, o modelo de linguagem de código aberto inovador da Databricks, que redefine a IA com habilidades avançadas de codificação e resolução matemática.  Explore agora!
Explorando os recursos versáteis do DBRX (Crédito da imagem)

Acessível a desenvolvedores e empresas, o DBRX fornece o modelo básico e versões aprimoradas sob uma licença aberta, incentivando a exploração colaborativa e a inovação. A sua ênfase na eficiência tanto na formação como na inferência, juntamente com o seu tamanho gerenciável, torna-o uma solução potencialmente rentável para várias aplicações de IA.

Como usar o DBRX

O uso do DBRX é disponibilizado por vários meios fornecidos pelo Databricks:

  • APIs do modelo básico: Ofertas de databricks APIs do modelo básico, que permite aos usuários interagir com o DBRX por meio de uma interface simples. Os usuários podem aproveitar essas APIs para integrar o DBRX em seus aplicativos e fluxos de trabalho.
  • Interface de bate-papo do AI Playground: Para experimentação e testes rápidos, os usuários podem acessar o DBRX através do Parque de IA interface de bate-papo. Essa interface fornece um ambiente amigável para interagir com o modelo e explorar seus recursos.

No geral, ao aproveitar as ferramentas e recursos fornecidos pelo Databricks, os usuários podem incorporar facilmente o DBRX em seus fluxos de trabalho e aproveitar seus recursos para uma ampla gama de aplicações em processamento de linguagem natural e IA.

Para informações mais detalhadas, clique aqui.


Crédito da imagem em destaque: Blocos de dados

Related Posts

O impacto dos tecidos inteligentes no desempenho das roupas táticas

O impacto dos tecidos inteligentes no desempenho das roupas táticas

15 Maio 2025
Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão

Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão

15 Maio 2025
AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

15 Maio 2025
Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

15 Maio 2025
Trump força a Apple a repensar sua estratégia de iPhone da Índia

Trump força a Apple a repensar sua estratégia de iPhone da Índia

15 Maio 2025
A IA do YouTube agora sabe quando você está prestes a comprar

A IA do YouTube agora sabe quando você está prestes a comprar

15 Maio 2025

Recent Posts

  • O impacto dos tecidos inteligentes no desempenho das roupas táticas
  • Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão
  • AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção
  • Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade
  • Trump força a Apple a repensar sua estratégia de iPhone da Índia

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.