Meio Bit » Internet » Google: IA "jornalista" incomoda veículos de mídia

Google: IA "jornalista" incomoda veículos de mídia

Google desenvolve ferramenta que, em tese, age como co-piloto de jornalistas na redação de artigos; executivos de mídia não gostaram

38 semanas atrás

Entre as ferramentas de Inteligência Artificial (IA) que o Google anda desenvolvendo, está a "Genesis", um auxiliar na composição de artigos jornalísticos. Demonstrado a veículos de imprensa como The New York Times, The Washington Post e The Wall Street Journal, o algoritmo teria incomodado os executivos de mídia, por "subestimar" jornalistas humanos.

Isto é o que uma IA entende como "um robô jornalista escrevendo um artigo em um computador" (Crédito: Stable Diffusion/Ronaldo Gogoni/Meio Bit) / google

Isto é o que uma IA entende como "um robô jornalista escrevendo um artigo em um computador" (Crédito: Stable Diffusion/Ronaldo Gogoni/Meio Bit)

Ao mesmo tempo, é curioso notar que o Google agora segue a política "todos iguais, mas uns mais iguais que outros", ao rever a política do AdSense que tratava todo conteúdo escrito por algoritmos em sites e blogs, independente da natureza, como spam. Agora que está mirando diretamente nesse segmento, a gigante das buscas permite alguns casos de uso.

Genesis não escreve sozinho... por enquanto

Segundo um porta-voz do Google, que entrou em contato com a agência Reuters, o Genesis é um algoritmo acessório e dependente de entradas de um usuário humano, no que a companhia estaria buscando negociar seu uso (corporativo, claro) com veículos de larga escala e alcance. O contato não citou nomes, mas o artigo do NYTimes revelou, por outras fontes, que além deles próprios, as negociações envolvem também o jornal The Washington Post, propriedade de Jeff Bezos, e a News Corp. de Rupert Murdoch, dono do The Wall Street Journal.

Segundo a nota do porta-voz do Google, o Genesis "não foi desenvolvido para, e nem pode, substituir o trabalho essencial de jornalistas em reportar, criar, e checar fatos através de seus artigos", e dessa forma, o algoritmo atuaria mais como uma ferramenta de produtividade; sua função se limitaria a sugerir títulos, usando parâmetros pré-definidos (leia-se SEO), ou oferecer opções para a escolha mais adequada de estilo literário, para aumentar a produtividade dos autores.

O Google estaria desenvolvendo o Genesis baseado em seu próprio modelo de linguagem de larga escala (LLM) chamado PaLM 2, um modelo de aprendizado de máquina que coleta quantidades massivas de textos, posts, ensaios, artigos e outras fontes literárias da internet, a fim de treinar seus algoritmos na tarefa de redigir sentenças coerentes. Este é o mesmo método por trás do GPT-4 e do ChatGPT, da OpenAI.

Não é a primeira vez que o Google se mete a desenvolver IAs para criar notícias. Em 2017, a gigante fechou uma parceria com a Associação de Imprensa do Reino Unido, na criação de um sistema a cargo das notas mais simples e de pouca variação, como previsão do tempo, horóscopo, saúde, emprego, segurança, etc. O projeto, chamado RADAR (Repórteres, Dados e Robôs, no original em inglês) continua ativo.

Antes do Google, em 2015, a rede AP apresentou uma ferramenta própria de IA, criada para publicar informes econômicos, o setor mais engessado da mídia jornalística.

Durante a conferência I/O 2023, o Google reforçou a ideia de que IAs devem ser postas a serviço do usuário (Crédito: Google)

Durante a conferência I/O 2023, o Google reforçou a ideia de que IAs devem ser postas a serviço do usuário (Crédito: Google)

De lá para cá, a Inteligência Artificial avançou ao ponto de muitos considerarem o fator humano desnecessário, no que um algoritmo poderia escrever tão bem quanto, ou melhor que um jornalista remunerado, o que ligou os alarmes do setor. No entanto, experimentos do tipo não deram muito certo.

Em 2020, The Guardian publicou uma matéria supostamente escrita pelo GPT-3, mas posteriormente o jornal confessou que o texto original de 6 mil palavras foi revisado por humanos, que selecionaram manualmente as sentenças que faziam mais sentido. Dessa forma, a artigo publicado diferia em muito da versão "crua", que nunca foi revelada.

Em janeiro de 2023, tanto o BuzzFeed quanto o CNET começaram a publicar artigos escritos por IAs, no que ambos foram espinafrados por textos sem variação, cheios de erros e com casos notórios de plágio de outras fontes, além de oposição pesada da própria equipe interna de jornalistas, no caso do segundo site.

Em julho do mesmo ano, o site Gizmodo publicou um artigo escrito por IA sobre a cronologia de Star Wars, cuja versão original estava cheia de erros crassos, além de deixar várias obras de fora. O texto foi posteriormente corrigido, por humanos obviamente; até a publicação deste post, o "Gizmodo Bot" não voltou a escrever.

Levando esses pontos em consideração, o Google estaria promovendo o Genesis como "o próximo passo na evolução do jornalismo", ao oferecer uma ferramenta de auxílio para aumento de produtividade e redução de erros. Ele seria um corretor ortográfico e otimizador, mas seria incapaz de compor algo sozinho.

Claro, isso não impede a gigante das buscas de evoluir seus algoritmos a ponto de torná-los autossuficientes, mas ao menos por enquanto, esta não é a intenção. Durante a conferência I/O, o CEO Sundar Pichai reforçou a ideia da companhia em prover soluções de IA que estejam a serviço dos usuários, ao invés de substituí-los.

Ainda assim, o Genesis não teria agradado. Dois executivos presentes durante à demonstração, teriam afirmado que o algoritmo é "incômodo", e que o Google "parecia subestimar o esforço necessário" para que jornalistas capacitados possam produzir notícias interessantes e precisas, sem vícios ou erros.

Google muda de ideia sobre IA e spam

Embora o Genesis seja inicialmente voltado para grandes conglomerados de mídia, o que pode indicar que o preço dele hoje é proibitivo, o Google já se preparou para um cenário onde o sistema especialista estaria ao alcance de qualquer site ou blog de menor porte, talvez até mesmo oferecendo uma versão gratuita do software, obviamente mais limitado, para pequenos criadores de conteúdo em texto.

Isso porque a companhia andou revendo alguns conceitos antigos sobre o que pode e o que não pode ser publicado na internet, para fins de monetização através do AdSense. No passado recente, o Google considerava que todas as ferramentas de automação, mesmo as mais avançadas, violavam suas Diretrizes para Webmasters, e dessa forma, todo texto identificado como escrito por uma IA seria classificado como spam.

Quando isso acontece, nao só a monetização do texto é bloqueada e o site, como o ranking do site vai para o fundo do poço, ao ser marcado como propagador de conteúdo de baixa qualidade. Isso joga o domínio para as últimas colocações dos resultados de busca no Google Search; a visibilidade despenca, as visitações também, e o dinheiro seca.

O Google, que continua atuando como O curador da internet, decide quem e como pode escrever algo, promovendo quem se enquadra e pulverizando quem não joga conforme suas regras, mas ao menos sobre o uso de IAs, as coisas mudaram um pouco, até para não afetar seu próprio Genesis.

No passado, o Google classificou todo conteúdo escrito por IAs como spam... até criar seu próprio algoritmo gerador de artigos (Crédito: freezelight/Flickr)

No passado, o Google classificou todo conteúdo escrito por IAs como spam... até criar seu próprio algoritmo gerador de artigos (Crédito: freezelight/Flickr)

Nas recomendações do Google Search sobre conteúdos gerados por IAs, a gigante das buscas diz agora que "usos apropriados" dos algoritmos não mais violam suas diretrizes, desde que sites, blogs e agências sigam seus conceitos de "Experiência, Autoridade e Confiabilidade" (E-E-A-T). Se um sistema especialista redigir um artigo que se enquadre no que a empresa considera como "conteúdo de qualidade", e não seja usado para tentar manipular o ranking, ou roubar conteúdo alheio, está tudo bem.

O combate a conteúdos de IA de baixa qualidade não será posto de lado, entretanto. O Google deixa bem claro que "está nessa batalha há muito tempo", e é plenamente capaz de identificar textos que usaram ferramentas de tradução automática, ou copia-e-cola textos de terceiros, com ou sem modificações. Um algoritmo que se limita a coletar trechos de sites concorrentes, e os cola de modo a dificultar a identificação como plágio, cairá na malha fina do mesmo jeito.

No momento, é possível que o Genesis não dê em nada, visto que os clientes em potencial não gostaram da ferramenta, tendo inclusive se sentido ofendidos com a ideia de uma IA escrevendo notícias, ainda que apenas como um auxiliar. Da mesma forma, é cedo para dizer se o Google poderá investir nisso por conta própria, o que eventualmente se desdobraria em uma guerra contra todas as agências de mídia do globo, que estão tentando forçar a companhia a pagar pela indexação de links.

Fonte: The New York Times, Reuters

relacionados


Comentários