Um grupo de cientistas da Microsoft em Pequim, China, revelou o VASA-1, uma nova Inteligência Artificial (IA) que possui a habilidade de produzir vídeos realistas de rostos humanos a partir de uma única imagem e um trecho de áudio.
Isso resulta em vídeos com expressões faciais e sincronia labial que reproduzem a realidade.
É possível também animar imagens artísticas como personagens fictícios ou até mesmo obras de arte. Além disso, o VASA-1 pode gerar falas em diversos idiomas ou até mesmo cantar canções, basta incluir o áudio desejado na ferramenta.
No VASA-1, os usuários podem controlar diversos aspectos da imagem, como direção dos olhos, da cabeça, angulação do rosto e da câmera, expressões faciais, entre outras características.
Os vídeos produzidos têm uma resolução de 512×512 pixels e podem atingir uma taxa de até 40 quadros por segundo.
Riscos e benefícios do VASA-1
A equipe que se encontra por trás da criação do VASA-1, sabe que a tecnologia pode ser usada para fins criminosos, como golpes e criação de deepfakes.
Por isso, a comercialização do VAZA-1 só será feita quando for usada de maneira responsável e de acordo com as regulamentações apropriadas.
A equipe também acredita que há diversos pontos positivos na ferramenta, como melhorar a acessibilidade para pessoas com deficiência, apoiar quem precisa de tratamento terapêutico e, também, melhorar a equidade educacional.
Vá mais longe com a Studio Visual
Sua empresa precisa de especialistas em tecnologia? Há mais de 22 anos, a Studio Visual atua no mercado de soluções digitais, oferecendo serviços em diferentes frentes, como Desenvolvimento, UX e UI, SEO, Content Marketing e muito mais.
Saiba como podemos ajudar a sua empresa a alcançar melhores resultados. Converse com um de nossos especialistas!