Carlos Cardoso 5 anos atrás
Não é de hoje que os pesquisadores surpreendem a gente com técnicas e algoritmos mais e mais complexos para manipulação de imagens, mas é raro quando o uso legítimo consegue ser mais impressionante do que o maligno. Você lembra dos Deep Fakes, vídeos criados com técnicas de machine learning onde o rosto de atrizes pornôs era trocado pelo de celebridades. Pois bem, isso é passado. Os chamados Deep Video Portraits vão muito além.
A técnica, descrita no paper... err.. Deep Video Portraits, foi criada por Hyeongwoo Kim, do Instituto Max Planck de Informática, na Alemanha, entre outros cientistas. Eles conseguiram alterar um vídeo não trocando o rosto do sujeito, mas alterando... expressões.
Depois de treinar o sistema com vídeos da fonte e do alvo, aplicando aquelas equações do paper onde só reconheço os números, eles conseguem fazer uma pessoa alegre ficar triste, por exemplo. Também podem pegar um vídeo de alguém falando e recriar a segunda pessoa fazendo o mesmo discurso, com as mesmas expressões e até as imagens do fundo são reconstituídas, acompanhando a movimentação da cabeça.
Outro exemplo que vai ser com certeza "A" aplicação que renderá muitos milhões de dólares é... dublagem. Hoje por melhor que seja o dublador, a boca do ator dublado não se encaixa na fala. Com o DVP eles conseguem facilmente redesenhar os movimentos labiais copiando a expressão do dublador.
Veja o vídeo completo da técnica em ação: