Para OpenAi, “seria impossível criar inteligência artificial sem conteúdos protegidos por copyright”
A startup do ChatGPT enfrenta processos de autores que não autorizaram o uso de suas criações para treinar os robôs da empresa.
O ChatGPT é uma inteligência artificial (IA) geradora de textos. A partir de uma base de dados com milhares de conteúdos, ele analisa o que eles têm em comum e aprende a reproduzir padrões – ou seja, escreve algo na mesma pegada. Funciona para receitas de bolo, redações do Enem, reportagens e até livros de ficção.
Aí que está o problema: todos esses conteúdos foram feitos por alguém – e boa parte deles está protegido pelas leis de direitos autorais. Muitos autores, você deve estar imaginando, não concordaram com o uso de seus textos para treinar uma IA.
Isso tem gerado uma série de processos. Em setembro de 2023, vários escritores (entre eles, George R.R. Martin, de Game of Thrones) entraram com uma ação contra a OpenAI. Em dezembro, foi a vez do jornal The New York Times.
O problema não se restringe às IAs de texto. A Getty Images, um dos maiores bancos de imagem do mundo, processou a Stability IA – é a criadora do Staple Diffusion, um dos principais robôs geradores de imagem (entenda aqui como essa tecnologia funciona).
A resposta da OpenAI
Em uma apresentação ao comitê de comunicação e seleção digital da Câmara dos Lordes, do Parlamento britânico, a OpenAI afirmou que, sem acesso a trabalhos protegidos por direitos autorais, não poderia treinar seus modelos de linguagem.
“Como os direitos autorais abrangem hoje praticamente todo o tipo de expressão humana, seria impossível treinar os principais modelos de IA da atualidade sem utilizar materiais protegidos por copyright”, admite em seu documento. “Limitar os dados de formação a livros e desenhos de domínio público criados há mais de um século poderia resultar numa experiência interessante, mas não proporcionaria sistemas de IA que satisfizessem as necessidades dos cidadãos de hoje.”
A principal defesa jurídica das empresas de IA é de que o uso desse material seria previsto sob a justificativa do “fair use”. É um conceito da legislação dos Estados Unidos que permite certos usos de material de copyright sem a necessidade de autorização ou pagamento ao autor. É usado, sobretudo, para justificar a reprodução de material por empresas jornalísticas e de educação.
Essa lei não se aplica ao Brasil, diga-se. Por aqui, temos a Lei de Direito Autoral (Lei 9.610/98) e seus artigos 46, 47 e 48, que delimitam o que é e o que não é livre de uso. A norma, contudo, é de 1998 – então não considera a inteligência artificial na equação.
A OpenAI acredita estar agindo dentro dos meandros da lei, e que os processos são infundados. “Ao treinar nossos modelos, a OpenAI cumpre os requisitos de todas as leis aplicáveis, incluindo as leis de direitos autorais”, afirmam. “Acreditamos que, legalmente, a lei de direitos autorais não proíbe o treinamento de inteligências artificiais.”