Nvidia apresenta modelos NVLM 1.0 de código aberto

A Nvidia entrou oficialmente no ringue com um poderoso modelo de IA de código aberto, NVLM 1.0, desafiando gigantes da indústria como OpenAI e Google.

A nova família NVLM 1.0 de grandes modelos de linguagem multimodal da empresa promete oferecer recursos de ponta em tarefas visuais e baseadas em texto.

Liderando o grupo está o NVLM-D-72B de 72 bilhões de parâmetros, um modelo projetado para funcionar no mais alto nível, causando um impacto enorme nas tarefas de linguagem de visão e, ao mesmo tempo, melhorando os resultados tradicionais baseados em texto.

O que torna o NVLM 1.0 especial?

A liberação de NVLM 1.0 marca uma mudança notável no ecossistema de IA, que os modelos proprietários dominaram amplamente. A decisão da Nvidia de disponibilizar publicamente esses pesos de modelo – e eventualmente liberar o código de treinamento – oferece aos pesquisadores e desenvolvedores acesso a ferramentas que rivalizam com outras como GPT-4. Este é um movimento raro numa indústria onde a maioria dos modelos avançados permanece trancada a sete chaves, rigidamente controlada por gigantes da tecnologia.

Como a Nvidia afirmou em seu artigo de pesquisa, “O NVLM 1.0 alcança resultados de última geração em tarefas de linguagem de visão, rivalizando com modelos proprietários e de acesso aberto.”

O que isso significa para os desenvolvedores é uma nova fronteira na acessibilidade da IAmuito parecido com o que Meta fez com Lhama 3.2dando a laboratórios menores e pesquisadores independentes a oportunidade de trabalhar com ferramentas de IA de alto nível sem ter que lidar com custos muitas vezes proibitivos ou restrições corporativas.

O lançamento de código aberto de NVLM 1.0 gerou entusiasmo em toda a comunidade de pesquisa de IA. Um pesquisador proeminente destacou a importância do modelo nas redes sociais, afirmando:

Uau, a nvidia acaba de publicar um modelo 72B que está no mesmo nível do lhama 3.1 405B em avaliações matemáticas e de codificação e também tem visão 🤯 pic.twitter.com/c46DeXql7s

-Phil (@phill__1) 1º de outubro de 2024

A potência multimodal NVLM-D-72B

No centro desta revolução de código aberto está o NVLM-D-72B modelo, que se destaca por sua capacidade de lidar perfeitamente com entradas visuais e textuais. Esta capacidade multimodal significa que o modelo pode interpretar imagens, analisar elementos visuais complexos e até resolver problemas matemáticos passo a passo – tudo dentro de uma única estrutura.

Enquanto muitos modelos multimodais lutam para manter o desempenho em tarefas somente de texto após a integração da aprendizagem visual, NVLM-D-72B contraria a tendência.

De acordo com a Nvidia, o modelo melhorou a precisão do texto em uma média de 4,3 pontos em vários benchmarks importantes após o treinamento multimodal. Esse tipo de adaptabilidade posiciona o NVLM-D-72B como uma ferramenta única em um mercado que normalmente força os usuários a escolher entre modelos otimizados para tarefas visuais ou textuais, mas não ambas.

Abrindo novas portas, levantando novas questões

O Projeto NVLM não se trata apenas de acesso aberto. Também introduz projetos arquitetônicos inovadores que combinam diferentes técnicas de processamento multimodal, ampliando os limites do que é possível em IA. A abordagem híbrida da Nvidia poderia muito bem inspirar uma nova direção na pesquisa e desenvolvimento de IA, à medida que equipes de todo o mundo colocassem as mãos nessas ferramentas.

No entanto, como acontece com qualquer salto tecnológico, existem riscos envolvidos. A disponibilização generalizada de modelos de IA tão poderosos levanta preocupações sobre o potencial uso indevido e os desafios éticos que o acompanham. A comunidade de IA terá de equilibrar o impulso para a inovação com a necessidade de desenvolver quadros responsáveis para a utilização destes modelos.

modelos nvidia nvlm 1 0 de código aberto — **NVLM 1.0 alcança desempenho de última geração em tarefas de linguagem de visão, competindo com modelos proprietários e abertos** (Crédito da imagem)

Um momento decisivo na IA

A decisão da Nvidia de código aberto NVLM 1.0 poderia desencadear uma onda de mudanças em todo o mundo da tecnologia. Outros líderes da indústria poderão sentir-se pressionados a seguir o exemplo, mudando potencialmente todo o panorama do desenvolvimento da IA. Se os modelos de última geração se tornarem livremente acessíveis, isso poderá forçar as empresas a repensar a forma como geram valor e mantêm uma vantagem competitiva no mercado.

O impacto a longo prazo da mudança da Nvidia ainda é desconhecido. Nos próximos meses e anos, poderemos assistir a uma era de colaboração sem precedentes em IA, onde investigadores de todos os cantos do mundo trabalharão juntos em plataformas partilhadas. Ou, este desenvolvimento poderia levar a uma análise mais profunda das consequências do lançamento de tecnologia avançada sem controlos rigorosos.

Uma coisa é certa: o lançamento do NVLM 1.0 pela Nvidia é um movimento revolucionário que sinaliza uma mudança no equilíbrio de poder na indústria de IA. Ao tornar um modelo de código aberto de tão alto calibre, a Nvidia está desafiando o status quo, iniciando o que poderia ser um novo capítulo no desenvolvimento de IA.

A questão agora não é se os modelos e o mercado de IA mudarão – mas sim quão dramaticamente e quem será capaz de acompanhar.

Crédito da imagem em destaque: Emre Çıtak/Ideograma IA

Nvidia apresenta modelos NVLM 1.0 de código aberto

Related Posts

Beyond Brince News: dando a jornalistas de transmissão ai em tempo real, verificação de fatos

Perspectiva de preço do Bitcoin: como a IA e a ciência de dados estão reformulando a previsão do mercado de criptografia

O reinado de Chatgpt está ameaçado por esses rivais da IA

OpenAI permite que todos experimentem sua ferramenta de imagem viral

Revolução do código da IA: geradores vs. assistentes – mergulho profundo de um desenvolvedor

A IA alimenta o comércio eletrônico, mas a ampliação apresenta obstáculos complexos

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Nvidia apresenta modelos NVLM 1.0 de código aberto

O que torna o NVLM 1.0 especial?

A potência multimodal NVLM-D-72B

Abrindo novas portas, levantando novas questões

Um momento decisivo na IA

Related Posts

Beyond Brince News: dando a jornalistas de transmissão ai em tempo real, verificação de fatos

Perspectiva de preço do Bitcoin: como a IA e a ciência de dados estão reformulando a previsão do mercado de criptografia

O reinado de Chatgpt está ameaçado por esses rivais da IA

OpenAI permite que todos experimentem sua ferramenta de imagem viral

Revolução do código da IA: geradores vs. assistentes – mergulho profundo de um desenvolvedor

A IA alimenta o comércio eletrônico, mas a ampliação apresenta obstáculos complexos

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us