Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Adobe é processada por usar livros piratas para treinar IA

byEmre Çıtak
19 Dezembro 2025
in Indústria
Home Indústria
Share on FacebookShare on Twitter
Google Preferred Source

Uma proposta de ação coletiva movida pela autora do Oregon, Elizabeth Lyon, acusa a Adobe de treinar seu modelo SlimLM AI em livros piratas, incluindo seus guias, por meio do conjunto de dados SlimPajama-627B derivado da coleção RedPajama contendo Books3. A Adobe buscou um amplo desenvolvimento em inteligência artificial nos últimos anos. A empresa lançou vários serviços de IA a partir de 2023, com Firefly servindo como seu conjunto de geração de mídia alimentado por IA, projetado para criar imagens, vídeos e outros conteúdos de mídia a partir de prompts e entradas de texto.

SlimLM representa uma série de modelos de linguagem pequena que a Adobe otimizou especificamente para tarefas de assistência a documentos em dispositivos móveis. Esses modelos permitem funções como resumir documentos, extrair informações importantes e fornecer ajuda contextual diretamente em aplicativos móveis. Adobe estados que pré-treinou o SlimLM usando o conjunto de dados SlimPajama-627B. Cérebros lançado este conjunto de dados em junho de 2023 como um recurso desduplicado, multicorpora e de código aberto destinado ao treinamento de grandes modelos de linguagem. O conjunto de dados agrega várias fontes de texto após remover duplicatas para melhorar a eficiência do treinamento e o desempenho do modelo. Elizabeth Lyon, especializada em guias para escrita de não ficção, iniciou o processo alegando que a Adobe incorporou versões piratas de vários livros, incluindo suas próprias obras, no processo de treinamento do SlimLM. A ação legal busca o status de ação coletiva para representar outros autores afetados. O processo detalha como o conjunto de dados SlimPajama se originou do conjunto de dados RedPajama, que inclui a coleção Books3 composta por 191.000 livros. Reuters primeiro relatado no arquivamento. A reclamação afirma literalmente: “O conjunto de dados SlimPajama foi criado copiando e manipulando o conjunto de dados RedPajama (incluindo a cópia de Books3).” Ele continua: “Assim, por ser uma cópia derivada do conjunto de dados RedPajama, SlimPajama contém o conjunto de dados Books3, incluindo as obras protegidas por direitos autorais do Requerente e dos membros da Classe.” Lyon argumenta que seus materiais protegidos por direitos autorais apareceram nesses dados de pré-treinamento sem seu consentimento ou compensação. O Books3 surgiu repetidamente em disputas legais no setor de IA, à medida que os desenvolvedores o utilizavam para treinar sistemas generativos de IA. A coleção contém textos digitalizados de vários gêneros e autores, tornando-se um corpus de treinamento abrangente, mas controverso. RedPajama, que incorpora Books3, também foi mencionado em vários processos judiciais.


Crédito da imagem em destaque

Tags: Adobelivros finos3

Related Posts

As regras de desativação da pesquisa de IA do Google estimulam o lançamento do navegador Enviromates

As regras de desativação da pesquisa de IA do Google estimulam o lançamento do navegador Enviromates

3 Junho 2026
Os novos chips Core Ultra da Intel estão supostamente em falta

Os novos chips Core Ultra da Intel estão supostamente em falta

3 Junho 2026
Uau, Meta, obrigado por 30 minutos inteiros fora da coleira de vigilância

Uau, Meta, obrigado por 30 minutos inteiros fora da coleira de vigilância

3 Junho 2026
Parlamento Europeu descarta Google como mecanismo de busca padrão

Parlamento Europeu descarta Google como mecanismo de busca padrão

3 Junho 2026
Polônia toma medidas para proibir telefones para estudantes menores de 16 anos nas escolas

Polônia toma medidas para proibir telefones para estudantes menores de 16 anos nas escolas

3 Junho 2026
Lexar revela plataforma de armazenamento focada em IA na COMPUTEX 2026

Lexar revela plataforma de armazenamento focada em IA na COMPUTEX 2026

2 Junho 2026

Recent Posts

  • As regras de desativação da pesquisa de IA do Google estimulam o lançamento do navegador Enviromates
  • Sony revela God of War: Laufey para PS5
  • Pesquisadores desbloqueiam aprimoramento de 20 vezes em experimentos com laser ultrarrápido
  • Microsoft lança Surface RTX Spark Dev Box para cargas de trabalho de IA
  • Os novos chips Core Ultra da Intel estão supostamente em falta

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.