A nova ferramenta AI Video, da Microsoft, pode ser o próximo grande avanço da Internet – ou um pesadelo

A nova ferramenta AI Video, da Microsoft, pode ser o próximo grande avanço da Internet – ou um pesadelo

Edgar Cervantes / Autoridade Android

DR

  • A Microsoft desenvolveu uma nova ferramenta de IA chamada VASA-1 que pode gerar vídeos a partir de uma única imagem e clipe de áudio.
  • Esta tecnologia tem um potencial incrível para utilizações positivas, mas também acarreta o risco de manipulação prejudicial.
  • A Microsoft insiste que está abordando o VASA-1 com cautela, enfatizando a necessidade de regulamentações adequadas antes de ser lançado ao público.

A IA generativa continua a remodelar nosso cenário digital com avanços aparentemente enormes de vez em quando, e a mais recente inovação da Microsoft é possivelmente a mais inovadora – e enervante – até agora.

VASA-1, um modelo de imagem para vídeo, confunde a linha entre o vídeo real e o fabricado. A partir de uma única imagem e um clipe de áudio, ele pode gerar imagens chocantemente realistas, completas com movimentos e expressões labiais realistas.

A Microsoft está perfeitamente consciente do poder da tecnologia, observando que o VASA-1 é “capaz não apenas de produzir uma preciosa sincronização de áudio labial, mas também de capturar um amplo espectro de emoções e nuances faciais expressivas e movimentos naturais da cabeça que contribuem para a percepção de realismo e vivacidade."

O sistema gera vídeo de alta resolução (512×512) a impressionantes 45 FPS. Ainda mais notável, ele pode gerar vídeos realistas de rostos falantes a 40 FPS em tempo real.

As aplicações potenciais são tentadoras. Imagine ferramentas educacionais com figuras históricas realistas ou companheiros virtuais que oferecem suporte e benefícios terapêuticos. No entanto, o potencial de utilização indevida é igualmente imenso, sinalizando imediatamente preocupações sobre deepfakes altamente convincentes, capazes de espalhar desinformação e minar a confiança.

A Microsoft sabe disso muito bem e insiste que se trata principalmente de um esforço de pesquisa, pelo menos por enquanto. A empresa reconheceu os riscos inerentes, afirmando: “…como outras técnicas de geração de conteúdo relacionadas, ainda pode ser potencialmente utilizada indevidamente para se passar por humanos. Opomo-nos a qualquer comportamento para criar conteúdo enganoso ou prejudicial de pessoas reais…”

Felizmente, a Microsoft afirma que não lançará esta tecnologia potente prematuramente. O seu plano de esperar por regulamentações robustas é tranquilizador e precisa de se tornar uma norma para o resto da indústria tecnológica.

O ritmo alucinante da inovação torna a previsão do futuro — e as consequências de sistemas como o VASA-1 — uma tarefa difícil. Se tal ferramenta se tornasse pública, inauguraria uma nova onda de criatividade e acessibilidade, ou alimentaria uma onda crescente de desconfiança e manipulação? Deixe-nos saber seus pensamentos nos comentários abaixo.Tem uma dica? Fale Conosco! Envie um e-mail para nossa equipe em [email protected]. Você pode permanecer anônimo ou obter crédito pelas informações, a escolha é sua.Comentários