O tema controverso dos processos judiciais de direitos de autor sobre IA está a ganhar força, com muitos a defenderem que já é tempo de as empresas de IA compensarem as vastas quantidades de dados de origem gratuita que reforçaram os seus sistemas geradores.
Numa onda recente de disputas legais, surgiu uma infinidade de ações judiciais buscando remuneração de entidades de IA nos Estados Unidos e na Europa. Os litigantes vão desde autores e artistas individuais até grandes conglomerados de meios de comunicação, todos expressando as suas objecções à apropriação das suas criações pela IA para gerar ramificações abaixo dos padrões.
Uma carta aberta impactante do Guilda dos Autores, com mais de 8.500 assinaturas de escritores proeminentes como Margaret Atwood, Dan Brown e Jodi Picoult, apelou aos criadores de aplicações generativas de IA, incluindo ChatGPT e Bard, para impedirem o uso não autorizado de obras literárias e fornecerem a devida compensação. Estes autores exigem reparação pelos dados “colhidos” para alimentar estes sistemas de IA, comparando-os a um banquete não remunerado.

Os escritores também temem que a IA generativa possa prejudicar a sua arte, inundando o mercado com conteúdo automatizado derivado dos seus trabalhos originais. Esta preocupação foi destacada recentemente quando a Amazon teve de intervir para resolver a questão dos livros gerados por IA que lotavam as suas paradas de best-sellers.
Antes de o Authors Guild apresentar seu apelo, os autores Mona Awad e Paul Tremblay iniciaram processos judiciais contra a OpenAI. Eles alegaram violação de direitos autorais, alegando que os resumos precisos de seus livros feitos pelo ChatGPT implicavam que a IA havia sido treinada em seu material protegido por direitos autorais. Eles não estão sozinhos nesta batalha; a autora e comediante Sarah Silverman também entrou com uma ação judicial contra OpenAI e Meta, acusando-os de replicação não autorizada de sua autobiografia, “The Bedwetter”. No entanto, as complexidades da funcionalidade da IA generativa podem complicar a validade jurídica destas reivindicações.
Não são apenas os indivíduos que estão entrando na disputa jurídica. Num movimento marcante, o The New York Times posicionou-se como o primeiro grande meio de comunicação americano a mover uma ação judicial contra a OpenAI, desafiando o uso de material protegido por direitos autorais no treinamento e desenvolvimento de IA.
Ações judiciais de direitos autorais de IA: a razão por trás
O fenómeno crescente dos processos judiciais de direitos de autor sobre IA é emblemático de uma resistência crescente à utilização desenfreada de conteúdos protegidos por direitos de autor por parte de empresas de IA. Embora plataformas como o ChatGPT tenham sido desenvolvidas usando dados provenientes da Internet, elas o fizeram sem o consentimento explícito dos criadores desses dados. Notavelmente, o treinamento do GPT-3 abrangeu uma infinidade de fontes, incluindo Wikipedia e Reddit. Este processo pode incorporar inadvertidamente segmentos de materiais protegidos por direitos autorais, permitindo que esses modelos de linguagem expansivos resumam de forma concisa os trabalhos protegidos por direitos autorais com um nível de precisão desconcertante.

A questão aumenta quando se considera a natureza enigmática da IA. O dilema da “caixa negra”, onde o funcionamento interno da IA permanece obscuro, agrava os receios de que a IA possa tornar-se um bode expiatório para fugir à responsabilização tanto na tomada de decisões como na geração de conteúdos.
A controvérsia jurídica também surge da preocupação de que, se as empresas de IA continuarem a comercializar estes sistemas opacos, estes modelos de IA poderão emergir como o meio por excelência para atingir um fim. O perigo reside num futuro potencial em que as decisões não sejam confiadas aos sistemas de IA pela sua eficácia ou precisão, mas porque podem contornar as restrições legais e éticas que vinculam as ações humanas.
Fontes e métodos de dados
No desenvolvimento da IA, especialmente com modelos generativos de IA como aqueles que estão no centro de numerosos processos judiciais, o processo de recolha de dados é um aspecto crucial e controverso. Os métodos e fontes dos quais estes sistemas de IA obtêm os seus dados de treino têm implicações legais e éticas significativas, especialmente quando envolvem material protegido por direitos de autor.
Modelos generativos de IA, como GPT-3 ou ChatGPT, são treinados em vastos conjuntos de dados coletados de várias fontes online. Essas fontes geralmente incluem sites públicos como Wikipedia e Reddit, mas também podem abranger repositórios mais controversos, como bibliotecas shadow ou outras plataformas onde materiais protegidos por direitos autorais estão prontamente disponíveis. O treinamento envolve não apenas uma simples coleta de dados, mas também processos complexos para compreender o contexto, o estilo e as nuances do conteúdo.

A zona cinzenta jurídica
A ambiguidade jurídica surge do facto de que, embora os dados sejam acessíveis ao público, os direitos de utilização nem sempre são claros. Por exemplo, o conteúdo de um fórum público não pode proibir explicitamente a sua utilização para treino de IA, mas também não concede permissão. Esta zona cinzenta levou a numerosos processos judiciais de direitos de autor sobre IA, onde os demandantes argumentam que os seus direitos de propriedade intelectual foram violados pela inclusão do seu trabalho em conjuntos de formação em IA sem consentimento ou compensação.
Como a IA está violando os direitos humanos?
As tecnologias de IA, embora revolucionárias, são cada vez mais examinadas em busca de potenciais violações dos direitos humanos, uma preocupação acentuada no contexto dos processos judiciais de direitos de autor sobre IA.
As principais questões incluem:
- A capacidade da IA para recolha e vigilância extensiva de dados pode infringir os direitos individuais de privacidade.
- Os sistemas de IA podem perpetuar distorções presentes nos seus dados de formação, levando a resultados discriminatórios em vários setores, sublinhando as preocupações nos processos judiciais de direitos de autor em curso.
- A moderação de conteúdo orientada pela IA pode suprimir inadvertidamente a liberdade de expressão, uma questão que se cruza com os debates sobre propriedade intelectual em processos judiciais de direitos de autor sobre IA.
- Em ambientes jurídicos, as ferramentas de IA podem influenciar a tomada de decisões, impactando potencialmente a justiça dos julgamentos e processos judiciais.
- A automação impulsionada pela IA coloca desafios aos direitos dos trabalhadores devido à deslocação do emprego e à necessidade de adaptação da força de trabalho.
- O acesso e o impacto desiguais da IA podem exacerbar as desigualdades existentes, uma preocupação que se assemelha ao acesso equitativo e aos direitos de utilização que estão no cerne dos processos judiciais de direitos de autor da IA.
- Os sistemas de IA que manipulam o comportamento do utilizador levantam questões sobre a autonomia e o consentimento individual.
- O controlo da IA sobre a disseminação de informação pode afectar o direito do público de aceder a informação diversificada e imparcial.
O caso dos artistas pelos direitos autorais contra a IA enfrenta uma batalha difícil
Quais são os processos contra a IA?
A arena jurídica está atualmente repleta de ações judiciais de direitos autorais de IA, com vários casos destacando a tensão entre empresas generativas de IA e normas de direitos autorais. Os litigantes incluem uma variedade de empresas envolvidas nessas batalhas legais de alto risco.
Google: processo de coleta de dados
Google está enfrentando uma ação coletiva acusando a gigante da tecnologia de uso indevido de informações pessoais e violação de direitos autorais. As alegações detalham que o Google coletou dados, incluindo imagens de sites de namoro, playlists do Spotify, vídeos do TikTok e literatura usada para refinar Bard. Lançada em julho de 2023, a alegação sugere que o Google pode ser responsável por danos de mais de US$ 5 bilhões. Optando pelo anonimato, os demandantes representam uma preocupação crescente com a privacidade e os direitos de propriedade.
Esta onda de ações judiciais de direitos autorais de IA não é sem precedentes. O caso de 2015 da Author’s Guild contra o Google estabeleceu uma referência jurídica significativa. A Guilda desafiou a digitalização de milhões de livros pelo Google, oferecendo trechos online. A decisão favoreceu o Google, caracterizando o uso como transformador e não competitivo com o mercado original dos livros.
OpenAI: questões de direitos autorais
A OpenAI também entrou na briga legal, com os autores Paul Tremblay e Mona Awad alegando violação de direitos autorais. Seu advogado, Butterick, representa um grupo mais amplo de autores cujos trabalhos, afirmam, foram replicados nos extensos dados de treinamento da OpenAI, totalizando potencialmente mais de 300.000 livros. Ajuizada em junho de 2023, a ação exige indenização por danos não divulgados.

OpenAI e Microsoft: ação judicial do NYT
Além disso, o New York Times lançou uma ação judicial contra a OpenAI e a Microsoft. O processo de dezembro de 2023 afirma que a OpenAI utilizou milhões de artigos do Times para treinar seus modelos de linguagem, que agora rivalizam com a publicação no fornecimento de informações confiáveis. Além disso, o processo afirma que os modelos da OpenAI não só ecoam o talento estilístico único do Times, mas também recitam o seu conteúdo literalmente. O Times, marcando a primeira vez num grande meio de comunicação americano, prosseguiu discussões sobre a questão dos direitos de autor no início do ano, mas sem sucesso, culminando neste litígio histórico.
Meta e OpenAI: o caso Silverman
A ação legal da comediante Sarah Silverman contra Meta e OpenAI traz à luz alegações de violação de direitos autorais, postulando que tanto o ChatGPT quanto o Large Language Model (Llama) da Meta AI foram desenvolvidos usando dados de origem ilegal que incluíam seu trabalho. O processo aponta para “bibliotecas paralelas” como Library Genesis, Z-Library e Bibliotek, famosas pelo compartilhamento de conteúdo baseado em torrent, o que muitas vezes ocorre sem autorização legal. Especificamente, o caso observa que o Lhama de Meta foi informado por um conjunto de dados conhecido como Pile, compilado por EleutherAI, que supostamente contém dados da Bibliotek. Este processo foi iniciado em julho de 2023.

GitHub, Microsoft e OpenAI: a controvérsia do Copilot
Uma ação coletiva de direitos autorais de IA tem como alvo GitHub, Microsoft e OpenAI em relação à ferramenta Copilot. Este serviço baseado em IA completa automaticamente trechos de código aprendendo com a entrada de um programador. Os demandantes argumentam que o Copilot regurgita ilegalmente código dos repositórios do GitHub, desconsiderando os requisitos de licenciamento, incluindo a atribuição adequada. Além das reclamações de direitos autorais, o processo também acusa o GitHub de má gestão e fraude de dados pessoais. Arquivado em novembro de 2022, o caso sofreu repetidas tentativas de demissão por parte da Microsoft e do GitHub.
Stability AI, Midjourney e DeviantArt: a disputa pela integridade artística
Janeiro de 2023 viu um processo contra empresas geradoras de imagens de IA Estabilidade AI, Midjourney e DeviantArt. Os demandantes alegam que essas plataformas infringem os direitos autorais ao treinar e gerar derivados dos trabalhos dos demandantes. Além disso, há controvérsias sobre a capacidade dessas ferramentas de replicar os estilos de artistas específicos. O juiz presidente, William Orrick, expressou a intenção preliminar de rejeitar a denúncia.

Stability AI: os processos judiciais da Getty Images
Os processos duplos da Getty Images contra a Stability AI destacam a cópia e o processamento não autorizado de inúmeras imagens e metadados associados aos quais a Getty detém direitos no Reino Unido. Um processo subsequente no Tribunal Distrital dos EUA para o Distrito de Delaware ecoa violações semelhantes de direitos autorais e marcas registradas. Também enfatiza a preocupação com imagens “bizarras ou grotescas” geradas com a marca d’água Getty, potencialmente manchando a reputação do estimado repositório de imagens. Esses movimentos legais foram feitos em janeiro de 2023.
Principais questões levantadas por esses processos judiciais de direitos autorais de IA
O surgimento de ações judiciais de direitos autorais sobre IA sinaliza uma mudança na forma como vemos a criatividade digital. Estes confrontos jurídicos de alto perfil levantam várias questões importantes que poderiam redefinir a lei de direitos autorais em relação à IA generativa:
- Licenciamento para materiais de treinamento de IA: Existe necessidade de licenciamento quando os modelos de IA são treinados em conteúdo protegido por direitos autorais? Dado que os sistemas de IA generativos replicam os materiais de formação durante a sua fase de aprendizagem, o debate jurídico depende de saber se esta replicação se enquadra no uso justo ou requer licenciamento formal.
- Violação de direitos autorais e resultados de IA: Os resultados produzidos pela IA generativa infringem os direitos autorais dos materiais utilizados na formação? Um aspecto fundamental que os tribunais devem determinar é se as semelhanças entre os resultados da IA e os dados de formação se baseiam em conteúdos protegidos ou não protegidos. Além disso, a questão de quem é responsável por qualquer violação de direitos autorais cometida por um sistema de IA ainda não foi resolvida.
- Conformidade com as leis de direitos autorais digitais: As tecnologias generativas de IA violam as leis que regem a alteração ou remoção de informações de gestão de direitos autorais? Esta questão é particularmente relevante no caso contra a IA de estabilidade, onde as imagens geradas pela IA incluíam informações falsas de gestão de direitos de autor, como marcas de água reproduzidas.
- Direito de publicidade e IA: A criação de obras geradas por IA que imitem o estilo de um indivíduo específico infringe seu direito de publicidade? Este direito, que difere entre estados, restringe o uso da imagem, nome, imagem, voz ou assinatura de um indivíduo para fins comerciais sem consentimento.
- Licenças de código aberto e IA: Como as licenças de código aberto se cruzam com o treinamento e a distribuição de conteúdo gerado por IA? Esta é uma preocupação central no processo GitHub Copilot, onde os demandantes argumentam que a falha em atribuir o material de origem e em liberar o Copilot como código aberto viola os termos do licenciamento de código aberto.
À medida que estes processos judiciais de direitos de autor sobre IA avançam e começam a oferecer respostas, as entidades envolvidas no desenvolvimento e implementação de ferramentas generativas de IA devem estar atentas às diretrizes emergentes no nexo entre IA e propriedade intelectual. Também pode ser prudente que estas empresas considerem estratégias para mitigar riscos potenciais neste terreno jurídico em evolução. As ações judiciais de direitos autorais de IA destacam a necessidade de políticas claras sobre uso e direitos de dados.
Crédito da imagem em destaque: Igor Omilaev/Unsplash





