Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

OpenAI Orion está enfrentando desafios de escala

byKerem Gülen
12 Novembro 2024
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

OpenAI Orion, o modelo de IA de próxima geração da empresa, está atingindo barreiras de desempenho que expõem limitações nas abordagens tradicionais de escalonamento. Fontes familiarizadas com o assunto revelam que a Orion está a proporcionar ganhos de desempenho menores do que os seus antecessores, levando a OpenAI a repensar a sua estratégia de desenvolvimento.

Os primeiros testes revelam melhorias de estabilização

Os testes iniciais dos funcionários indicam que OpenAI Orion alcançou desempenho de nível GPT-4 após completar apenas 20% de seu treinamento. Embora isso possa parecer impressionante, é importante observar que os estágios iniciais do treinamento em IA normalmente produzem as melhorias mais dramáticas. É improvável que os 80% restantes do treinamento produzam avanços significativos, sugerindo que o OpenAI Orion pode não ultrapassar o GPT-4 por uma ampla margem.

“Alguns pesquisadores da empresa acreditam que o Orion não é confiávelmente melhor que seu antecessor no tratamento de certas tarefas”, relatou A informação. “O Orion tem melhor desempenho em tarefas linguísticas, mas pode não superar os modelos anteriores em tarefas como codificação, de acordo com um funcionário da OpenAI.”

OpenAI Orion está enfrentando desafios de escala
Uma pesquisa publicada em junho prevê que as empresas de IA esgotarão os dados públicos de texto gerados por humanos disponíveis entre 2026 e 2032 (Crédito da imagem)

O dilema da escassez de dados

Os desafios da OpenAI com a Orion destacam uma questão fundamental na indústria de IA: a oferta cada vez menor de dados de treinamento de alta qualidade. Uma pesquisa publicada em junho prevê que as empresas de IA esgotarão os dados públicos de texto gerados por humanos disponíveis entre 2026 e 2032. Esta escassez marca um ponto de inflexão crítico para as abordagens tradicionais de desenvolvimento, forçando empresas como a OpenAI a explorar métodos alternativos.

“Nossas descobertas indicam que as tendências atuais de desenvolvimento de LLM não podem ser sustentadas apenas através do escalonamento convencional de dados”, disse a pesquisa. estados de papel. Isto sublinha a necessidade de geração de dados sintéticos, transferência de aprendizagem e utilização de dados não públicos para melhorar o desempenho do modelo.

Estratégia de desenvolvimento dual-track da OpenAI

Para enfrentar estes desafios, a OpenAI está a reestruturar a sua abordagem, separando o desenvolvimento do modelo em duas vertentes distintas. A Série O, codinome Strawberry, concentra-se nas capacidades de raciocínio e representa uma nova direção na arquitetura de modelos. Esses modelos operam com intensidade computacional significativamente maior e são explicitamente projetados para tarefas complexas de resolução de problemas.

Paralelamente, os modelos Orion – ou a série GPT – continuam a evoluir, concentrando-se no processamento geral de linguagem e nas tarefas de comunicação. O diretor de produtos da OpenAI, Kevin Weil, confirmou essa estratégia durante uma AMA, afirmando: “Não é um ou outro, são ambos – melhores modelos básicos e mais cálculo de tempo de inferência/escalamento de morango”.

OpenAI Orion está enfrentando desafios de escala
Para enfrentar estes desafios, a OpenAI está a reestruturar a sua abordagem, separando o desenvolvimento do modelo em duas vertentes distintas (Crédito da imagem)

Dados sintéticos: uma faca de dois gumes

A OpenAI está explorando a geração de dados sintéticos para lidar com a escassez de dados do OpenAI Orion. No entanto, esta solução introduz novas complicações na manutenção da qualidade e confiabilidade do modelo. Modelos de treinamento em conteúdo gerado por IA podem levar a ciclos de feedback que amplificam imperfeições sutis, criando um efeito complexo que é cada vez mais difícil de detectar e corrigir.

Os pesquisadores descobriram que depender fortemente de dados sintéticos pode causar a degradação dos modelos com o tempo. A equipe de Fundações da OpenAI está desenvolvendo novos mecanismos de filtragem para manter a qualidade dos dados, implementando técnicas de validação para distinguir entre conteúdo sintético de alta qualidade e conteúdo potencialmente problemático. Eles também estão explorando abordagens de treinamento híbrido que combinam conteúdo humano e gerado por IA para maximizar os benefícios e minimizar as desvantagens.

OpenAI Orion ainda está em seus estágios iniciais, com um trabalho de desenvolvimento significativo pela frente. O CEO Sam Altman indicou que não estará pronto para implantação neste ano ou no próximo. Este cronograma estendido pode ser vantajoso, permitindo que os pesquisadores abordem as limitações atuais e descubram novos métodos para aprimorar o modelo.

Enfrentando expectativas acrescidas após uma recente ronda de financiamento de 6,6 mil milhões de dólares, a OpenAI pretende superar estes desafios inovando a sua estratégia de desenvolvimento. Ao enfrentar de frente o dilema da escassez de dados, a empresa espera garantir que o OpenAI Orion terá um impacto substancial no seu eventual lançamento.


Crédito da imagem em destaque: Jonathan Kemper/Unsplash

Tags: openAI

Related Posts

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

15 Maio 2025
Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

15 Maio 2025
Trump força a Apple a repensar sua estratégia de iPhone da Índia

Trump força a Apple a repensar sua estratégia de iPhone da Índia

15 Maio 2025
A IA do YouTube agora sabe quando você está prestes a comprar

A IA do YouTube agora sabe quando você está prestes a comprar

15 Maio 2025
O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

15 Maio 2025
Pronto para um chatgpt que realmente o conhece?

Pronto para um chatgpt que realmente o conhece?

14 Maio 2025

Recent Posts

  • O impacto dos tecidos inteligentes no desempenho das roupas táticas
  • Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão
  • AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção
  • Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade
  • Trump força a Apple a repensar sua estratégia de iPhone da Índia

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.