Pesquisadores da Universidade de Washington desenvolveram um software que utiliza o áudio de algum discurso/fala/conversa e gera um vídeo realista com sincronia labial. Como exemplo, a equipe montou um vídeo do ex-presidente dos Estados Unidos, Barack Obama, que você poderá conferir aqui embaixo.

Mais detalhes

Quem explica mais sobre a tecnologia é Kemelmacher-Shlizerman, professor assistente na Paul G Allen School of Computer Science & Engineering:

"A conversão realista de áudio para vídeo tem aplicações práticas, como a melhoria da videoconferência para reuniões, bem como as futuristas, como a capacidade de manter uma conversa com uma figura histórica na realidade virtual criando imagens apenas a partir de áudio. Esse é o tipo de avanço que ajudará a habilitar esses próximos passos".

A apresentação completa da tecnologia será realizada durante o evento SIGGRAPH 2017

Obviamente, uma tecnologia desse tipo é muito interessante para diversas aplicações. Desde personagens no cinema até video games. Contudo, já imaginou o que isso pode causar no lado negativo? Por exemplo, a construção de falas para políticos e influenciadores.

Sobre o funcionamento, o software trabalha com machine learning, por isso a escolha inicial foi o ex-presidente dos EUA — existem muitos vídeos e entrevistas na internet para os algoritmos trabalharem. "Em breve, ferramentas de chat em vídeo como Skype ou Messenger serão capazes de coletar dados de vídeos para usar em modelos computacionais", adicionou o professor.

A apresentação completa da tecnologia será realizada durante o evento SIGGRAPH 2017, que acontece no próximo mês. Aqui, você pode ver um PDF com mais detalhes.