Ronaldo Gogoni 15/08/2024 às 9:38
Mais uma vez, desenvolvedores e companhias responsáveis por modelos generativos de Inteligência Artificial (IA) são confrontados com a Realidade da Vida: o Copyright é soberano, e ninguém escapa dele. Um processo movido em 2023, por artistas contra Stability AI (responsável pelo Stable Diffusion), Midjourney, Runway, e a plataforma DeviantArt, acusando-as de coletar artes sem autorização dos criadores para treinar seus algoritmos, foi autorizado a prosseguir nos EUA.
Isso significa que os advogados dos reclamantes terão acesso a documentos internos das empresas de tecnologia, para averiguar como a coleta de artes, sejam desenhos ou outras criações, é feita, e a extensão da mesma, no que tudo pode ser exposto e levando a mais processos individuais.
Já há algum tempo, ficou claro que a desculpa dada por Sam Altman, ao apelar para o Uso Aceitável (conceito em que a violação de direitos autorais é válida, quando o ato gera ganhos à sociedade), dizendo que IAs generativas "proverão benefícios à toda humanidade" e por isso, não devem ser processadas, não vai colar.
Primeiro, cada vez maias companhias estão usando algoritmos e soluções generativas para cortar custos, o que já está se revertendo em demissões em massa. Segundo, muitas dessas soluções são baseadas na coleta indiscriminada de todos os tipos de dados, sensíveis ou não, públicos ou não, protegidos por copyright ou não.
As companhias simplesmente puseram seus crawlers para vasculhar a internet de alto a baixo, e coletar tudo o que pudessem, para que pudessem usar no treinamento de seus algoritmos, e usaram. O problema, conteúdos protegidos por copyright têm suas próprias regras, os detentores dos direitos podem optar por não permitir o acesso, e têm direito a serem pagos pelo uso.
OpenAI e cia. deram de ombros, dizendo que não tinham que pagar nada, usando basicamente a desculpa "se está na internet, é público"; Mustafa Suleyman, CEO da Microsoft AI, não teve melindre em dizer exatamente isso, que todo conteúdo na net é "material freeware" para treinamento de IAs.
Para seu desgosto, como já dissemos, o Copyright é soberano. A DMCA (Digital Millenium Copyright Act), Lei de alcance global que rege direitos autorais em diversos países, Brasil incluso, é bem clara sobre o direito irrevogável dos detentores dos copyrights, desde que uma obra seja registrada, e a Lei de IA passada na União Europeia (UE) a segue direitinho: todos os modelos são obrigados a revelarem os conteúdos usados, permitindo aos controladores das obras fazerem o que de direito, de exigir a remoção do material, à abertura de processos.
De lá para cá, várias companhias e grupos já entraram na Justiça, na Europa e em outros países, para exigir seus direitos contra a coleta não autorizada de dados. A Sony Music, por exemplo, exige a remoção de todas as músicas e letras dos artistas que representa, de todos os modelos, em todo o mundo, e quem não se submeter será processado, doa a quem doer. Da mesma forma, agências de notícias também estão processando empresas, no que muitas, como a OpenAI, passaram a fazer acordos para não terem que ir toda semana ao tribunal.
E então temos os modelos de IA generativos voltados à criação de arte, sejam imagens ou vídeos, como Stable Diffusion, Midjourney e Runway AI, além do motor da plataforma de divulgação DeviantArt, que despertou o ódio dos artistas ao anunciar que coletaria tudo por padrão, e os usuários que fizessem opt-out, mas depois retrocedeu.
Estas foram alvo de uma ação coletiva nos Estados Unidos, movida por três artistas, entre eles a cartunista e ilustradora Sarah Andersen; no início Kelly McKernan e Karla Ortiz foram removidas do processo, por suas artes não serem registradas, mas apresentaram emendas e foram reinstauradas; depois, outros artistas também se juntaram à ação, como Hawke Southworth, Grzegorz Rutkowski, Gregory Manchess, Gerald Brom, Jingna Zhang, Julia Kaye, e Adam Ellis.
O processo (cuidado, PDF), movido em janeiro de 2023, acusa Stability AI, Midjourney, Runway, e DeviantArt de violarem a DMCA, ao coletarem suas artes sem autorização ou notificação, para o treinamento de seus algoritmos de IA, com a intenção de lucrar com o trabalho alheio, ao permitir a recriação de seus estilos via solicitações dos usuários dos motores, sem pagar um centavo sequer aos criadores.
Os reclamantes tiveram que apresentar evidências de que os motores eram por design criados para coletar conteúdo alheio, o que fizeram ao anexar ao processo diversos artigos acadêmicos, que analisam como esses algoritmos funcionam, que corroborando sua versão dos fatos. Algumas das alegações não encontraram respaldo e foram descartadas pela corte, mas William Orrick III, juiz distrital sênior do Distrito Norte da Califórnia, decidiu (cuidado, PDF) que o processo continue.
Na ordem, Orrick diz que as companhias de IA e o DeviantArt violaram de forma aparente tanto a DMCA, quando a Lei Lanham, que protege artistas contra o uso comercial não autorizado de suas criações.
Nesta segunda fase, os advogados dos artistas terão acesso a documentos internos das acusadas, e poderão revisar todo o processo de coleta e treinamento dos algoritmos de IA, a fim de provarem que houve uso não autorizado e não remunerado de material protegido por lei de direitos autorais.
Os artistas estão comemorando esta primeira vitória, como era de se esperar.
A major update in our case, all of our theories of copyright infringement are able to proceed. Onward!https://t.co/8anvimE7Cf
— Sarah Andersen (@SarahCAndersen) August 13, 2024
Stability AI, Midjourney, Runway e DeviantArt não se manifestaram a respeito.
Fonte: Ars Technica