O Internet Archive perdeu uma batalha jurídica significativa depois que o Tribunal de Apelações dos EUA confirmou uma governando em Hachette v. Internet Archive, afirmando que suas práticas de digitalização e empréstimo de livros violavam a lei de direitos autorais. O caso surgiu da iniciativa da Biblioteca Nacional de Emergência do Archive durante a pandemia, que permitiu o empréstimo digital irrestrito de livros, gerando reação de editoras e autores. O tribunal rejeitou a defesa de uso justo do Archive, embora reconhecesse seu status sem fins lucrativos. Essa decisão fortalece o controle de autores e editoras sobre suas obras. Mas imediatamente me lembra de como as ferramentas de IA treinam e usam dados na Internet, incluindo livros e muito mais. Se o trabalho da organização sem fins lucrativos Internet Archive não é de uso justo, como as ferramentas de IA pagas usam esses dados?
Apesar de numerosos Ações judiciais de direitos autorais de IAdados baseados em texto de meios de comunicação geralmente não resulta em decisões severas contra ferramentas de IA, muitas vezes terminando em parcerias com principais jogadores.
Você pode pensar que é diferente e argumentar que o Internet Archive usa livros diretamente, mas mesmo que as ferramentas de IA dependam de todos os dados que têm para gerar sua redação, você ainda pode obter trechos específicos ou respostas mais detalhadas delas se usar um prompt bem elaborado.
O caso Hachette v. Internet Archive destaca preocupações significativas sobre como os modelos de IA adquirem dados de treinamento, especialmente quando envolvem materiais protegidos por direitos autorais, como livros. Os sistemas de IA geralmente dependem de grandes conjuntos de dados, incluindo textos protegidos por direitos autorais, levantando desafios legais semelhantes em relação ao uso não licenciado. Se os tribunais restringirem a digitalização e o uso de obras protegidas por direitos autorais sem permissão, as empresas de IA podem precisar garantir licenças para os textos usados no treinamento, adicionando complexidade e custos potenciais. Isso pode limitar o acesso a conjuntos de dados diversos e de alta qualidade, afetando, em última análise, o desenvolvimento e a inovação da IA.
Além disso, o caso sublinha as limitações da uso justo defesa no contexto do uso transformador, que é frequentemente central para a justificativa da IA para usar dados de texto em larga escala. Se os tribunais enxergarem de forma restrita o que constitui uso justo, os desenvolvedores de IA podem enfrentar mais restrições sobre como acessam e usam livros protegidos por direitos autorais. Essa tensão entre proteger os direitos dos autores e manter o acesso aberto ao conhecimento pode ter consequências de longo alcance para o futuro das práticas de treinamento de IA e o uso ético de dados.
Precisa se aprofundar mais no caso? Aqui está tudo o que você precisa saber sobre ele.
Hachette v. Internet Archive explicado
Hachette v. Internet Archive é um caso jurídico significativo que se concentra em torno da lei de direitos autorais e dos limites da doutrina do “uso justo” no contexto de bibliotecas digitais. O caso começou em 2020, quando várias grandes editoras — Hachette, HarperCollins, Penguin Random House e Wiley — processaram o Internet Archive, uma organização sem fins lucrativos dedicada à preservação de cópias digitais de sites, livros e outras mídias.
O caso se concentrou na prática do Arquivo de digitalizar livros e emprestá-los on-line.
A história por trás do processo do Internet Archive
O Biblioteca Aberta projeto, executado pelo Internet Archive, foi criado para permitir que as pessoas pegassem livros emprestados digitalmente. Eis como funcionava:
- O Internet Archive comprou cópias físicas de livros.
- Eles digitalizaram esses livros em formato digital.
- As pessoas podiam pegar emprestada uma versão digital, mas apenas uma pessoa por vez podia retirar o livro, assim como acontece quando se pega emprestado um livro físico em uma biblioteca comum.
O Internet Archive achou que isso era legal porque eles só deixavam uma pessoa pegar um livro emprestado por vez. Eles chamaram esse sistema Empréstimo Digital Controlado (CDL). A ideia era fazer com que o empréstimo digital funcionasse da mesma forma que o empréstimo de bibliotecas físicas.
Quando a pandemia da COVID-19 atingiu no início de 2020, muitas bibliotecas tiveram que fechar, dificultando o acesso das pessoas aos livros. Para ajudar, o Internet Archive lançou o Biblioteca Nacional de Emergência (NEL) em março de 2020. Este programa mudou as coisas:
- O NEL permitiu que várias pessoas pegassem emprestado a mesma cópia digital de um livro ao mesmo tempo. Isso removeu a regra de uma pessoa por vez.
- O objetivo era dar acesso a livros a mais pessoas durante a pandemia, especialmente estudantes e pesquisadores que ficaram presos em casa.
Embora o NEL fosse para ser temporário, ele irritou autores e editores. Eles argumentaram que deixar muitas pessoas pegarem emprestado a mesma cópia digital sem permissão era como roubar seu trabalho.
Motim dos editores
Em junho de 2020, as grandes editoras processaram o Internet Archive. Elas alegaram:
- O Internet Archive não tinha permissão para digitalizar seus livros ou emprestá-los digitalmente.
- Ao fazer isso, o Internet Archive estava violando seus direitos autorais, que lhes dão o direito exclusivo de controlar como seus livros são copiados e compartilhados.
- A abordagem da NEL, que permitia que muitas pessoas pegassem cópias digitais emprestadas de uma só vez, era especialmente prejudicial aos seus negócios e era essencialmente pirataria.
Os editores argumentaram que as ações do Internet Archive prejudicaram o mercado para seus livros. Eles disseram que as pessoas estavam obtendo versões digitais gratuitas em vez de comprar e-books ou pegar emprestado de bibliotecas licenciadas.
Defesa do Internet Archive
O Internet Archive defendeu-se alegando que o seu trabalho estava protegido por uso justo. O uso justo permite o uso limitado de material protegido por direitos autorais sem permissão para propósitos como educação, pesquisa e comentários. O Archive fez estes pontos:
- Eles estavam fornecendo um transformador serviço, dando aos leitores acesso a livros físicos em um novo formato digital.
- Eles não estavam lucrando com isso, pois são uma organização sem fins lucrativos cuja missão é preservar o conhecimento e torná-lo acessível.
- O NEL foi uma resposta temporária à pandemia e estava tentando ajudar pessoas que não tinham acesso a livros durante a crise.
Eles também apontaram para o seu Empréstimo Digital Controlado sistema como uma forma de respeitar as leis de direitos autorais. Sob o CDL, apenas uma pessoa poderia pegar um livro emprestado por vez, assim como em uma biblioteca física.
As decisões do tribunal
Decisão do Tribunal Distrital (março de 2023)
Em março de 2023, um tribunal federal ficou do lado dos editores. O juiz John G. Koeltl decidiu que as ações do Internet Archive não eram protegidas pelo uso justo. Ele disse:
- O empréstimo digital do Internet Archive não foi transformador porque eles não estavam adicionando nada de novo aos livros. Eles estavam simplesmente copiando-os em formato digital, o que não era suficiente para qualificar para uso justo.
- O tribunal também concluiu que o empréstimo do Archive prejudicou o mercado de versões impressas e digitais dos livros. Ao oferecer cópias digitais gratuitas, o Internet Archive foi visto como competidor das vendas de e-books das editoras.
- O tribunal concluiu que o Arquivo havia criado trabalhos derivadoso que significa que eles fizeram novas versões dos livros (cópias digitais) sem permissão.
Decisão do Tribunal de Apelações (agosto de 2023)
O Internet Archive apelou da decisão para um tribunal superior, o Tribunal de Apelações dos EUA para o Segundo Circuito, esperando anular a decisão. No entanto, o tribunal de apelações também decidiu a favor dos editores, mas fez um esclarecimento importante:
- O tribunal reconheceu que o Internet Archive é um sem fins lucrativos organização e não comercial. Essa distinção era importante porque o uso comercial pode frequentemente enfraquecer uma defesa de uso justo, mas, neste caso, o tribunal reconheceu que o Archive não era motivado pelo lucro.
- Apesar disso, o tribunal ainda concordou que as ações do Arquivo não eram protegidas pelo uso justo, embora seja uma organização sem fins lucrativos.
Conclusão
O caso Hachette v. Internet Archive mostrou que mesmo organizações sem fins lucrativos como o Internet Archive não podem digitalizar e emprestar livros livremente sem violar as leis de direitos autorais. Essa decisão também pode afetar como as empresas de IA usam materiais protegidos por direitos autorais para treinar seus sistemas. Se as organizações sem fins lucrativos enfrentarem tais restrições, as ferramentas de IA podem precisar obter licenças para os dados que usam. Mesmo que já tenham começou a fazer alguns negócioseu me pergunto, e quanto ao primeiras entradas?
Crédito da imagem em destaque: Eray Eliaçık/Bing