Carlos Cardoso 6 anos atrás
Em um dos episódios mais esquecíveis de Star Trek: TNG Wesley Crusher, o Virjão da Galáxias, constrói uma máquina que imita a voz de outros personagens e, kibando o Capitão Picard quase explode a Enterprise. A idéia em si não era nova, em ficção científica robôs já imitavam vozes humanas para o Mal, como Arnoldinho fez com os pais adotivos de John Connor.
Sintetização de voz avançou bastante desde as vozes claramente robóticas dos robôs dos anos 50, a ponto da própria ficção científica perceber que robôs não precisam falar como robôs. E como é a norma, a ficção científica define os parâmetros e a ciência vem logo atrás, mas desta vez acho que avançaram bem rápido.
A Lyrebird é uma startup criada por três estudantes de Doutorado da Universidade de Montreal. Eles criam modelos de vozes para sintetizadores, com um diferencial: eles podem começar do zero OU podem pegar uma amostra de voz de uma pessoa de verdade, e criar um modelo em cima disso.
Só precisam de um minuto de amostra, e o resultado é… assustador. Aqui Donald Trump, Barack Obama e Hillary Clinton discutindo a tecnologia da empresa:
Tenha em mente que os exemplos acima são os primeiros testes, disponibilizados em baixa qualidade de áudio, a versão final será ordens de magnitude melhor, mas o Trump deles me enganaria no rádio fácil.
A Lyrebird vai disponibilizar uma API para geração remota de áudio, usam clusters de GPUs e conseguem hoje gerar 2.000 frases por segundo, com controles de entonação E emoções.
As possibilidades, para o bem e para o mal são imensas. Deve dar até pra simular advogado de voz fina.
Fonte: dica do Klebiano no tuinto.