Carlos Cardoso 6 anos atrás
[box type="warning"] !AVISO! Este texto é sobre uma PESQUISA ACADÊMICA, o vídeo é uma prova de conceito de uma técnica em sua fase inicial de desenvolvimento. Abstenha-se de comentários “ah tem defeito” “ah dá pra perceber que é falso”, “ah, no Linux tem isso”. Obrigado. [/box]
Antigamente uma imagem era prova cabal para resolver uma disputa, mas as técnicas de manipulação foram crescendo, e hoje é preciso uma complicada análise forense antes que uma foto seja usada como prova válida em um tribunal. Vídeo costumava ser mais aceitável, forjar vídeos não era possível, ao menos dentro de um orçamento realista.
Agora há vários grupos desenvolvendo técnicas para criar vídeos onde pessoas falam coisas que nunca disseram. O mais recente é o “Synthesizing Obama: Learning Lip Sync from Audio”, criado por pesquisadores da Universidade de Washington. Eles criaram uma rede neural que analisou 14 h de vídeos de Barack Obama, estudou como ele pronuncia os fonemas, micro-expressões, etc e gerou um modelo.
Em seguida um áudio foi usado como input, e o software gerou um vídeo novo de Obama falando o texto, com perfeita sincronia labial.
Agora imagine um bom imitador gerando o áudio, e um vídeo com qualidade propositalmente piorada, para esconder os artefatos da geração. Se com posts no Facebook de fakes do Bolsonaro pessoal já pira, imagine um vídeo do Obama confirmando o Pizzagate por exemplo.
A grande verdade é que mais que nunca, não devemos acreditar em tudo que vemos. Ou ouvimos.
Aqui o vídeo do trabalho dos pesquisadores. É impressionante.
Fonte: Engadget.