Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Openai pode ter treinado sua IA em livros roubados

byKerem Gülen
3 Abril 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

O OpenAI está enfrentando acusações de treinamento de seus modelos de IA em material protegido por direitos autorais sem permissão, como um novo papel alega que a empresa usou livros de paywall da O’Reilly Media para treinar seu modelo GPT-4O. O projeto de divulgação da IA, uma organização sem fins lucrativos co-fundada por Tim O’Reilly e Ilan Strauss, publicou o artigo.

Os modelos de IA funcionam como mecanismos de previsão, padrões de aprendizado de dados extensos, como livros e filmes, para extrapolar de prompts. Enquanto alguns laboratórios de IA estão usando dados gerados pela IA, à medida que as fontes do mundo real diminuem, o treinamento em dados puramente sintéticos carrega riscos, como impactar o desempenho de um modelo.

A metodologia do artigo, Descompactdetermina se um modelo distingue entre textos de autoria humana e Paráfrases geradas pela IA. Isso sugere se o modelo possui conhecimento prévio de seus dados de treinamento. Os pesquisadores investigaram o GPT-4O, o GPT-3.5 Turbo e outros modelos Openai, usando 13.962 trechos de 34 livros de O’Reilly para estimar a probabilidade de inclusão nos conjuntos de dados de treinamento.

Os resultados indicaram que o GPT-4O reconheceu significativamente mais conteúdo de livros O’Reilly do que modelos mais antigos como o GPT-3.5 Turbo. De acordo com o artigo, GPT-4O Provavelmente reconhece muitos livros não públicos de O’Reilly publicados antes de sua data de corte de treinamento. O’Reilly não possui um contrato de licenciamento com o Openai, de acordo com o jornal.

Os co-autores reconhecem que o método não é à prova de falhas e o OpenAI pode ter coletado trechos das entradas de bate-papo dos usuários. Outra ressalva é que os modelos OpenAI mais recentes, incluindo o GPT-4.5, não foram avaliados.

O OpenAI, defendendo restrições de direitos autorais mais frouxos, buscou dados de treinamento de maior qualidade, contratando jornalistas para ajustar as saídas do modelo. A empresa também possui acordos de licenciamento com editores de notícias e oferece mecanismos de exclusão para proprietários de direitos autorais. O Openai não comentou o jornal.


Crédito da imagem em destaque

Tags: chatgptopenAI

Related Posts

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

15 Maio 2025
Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

15 Maio 2025
Trump força a Apple a repensar sua estratégia de iPhone da Índia

Trump força a Apple a repensar sua estratégia de iPhone da Índia

15 Maio 2025
A IA do YouTube agora sabe quando você está prestes a comprar

A IA do YouTube agora sabe quando você está prestes a comprar

15 Maio 2025
O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

15 Maio 2025
Pronto para um chatgpt que realmente o conhece?

Pronto para um chatgpt que realmente o conhece?

14 Maio 2025

Recent Posts

  • O impacto dos tecidos inteligentes no desempenho das roupas táticas
  • Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão
  • AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção
  • Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade
  • Trump força a Apple a repensar sua estratégia de iPhone da Índia

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.