Em sua conferência anual re:Mars hoje em Las Vegas, o vice-presidente sênior e cientista-chefe da Alexa da Amazon, Rohit Prasad, anunciou uma série de recursos novos e futuros para o assistente inteligente da empresa. O que mais virou a cabeça do grupo foi um novo recurso em potencial que pode sintetizar clipes de áudio curtos em falas mais longas.
No cenário apresentado no evento, a voz de um ente querido falecido (a avó, neste caso), é usada para ler uma história de ninar para o neto. Prasad observa que, usando a nova tecnologia, a empresa é capaz de obter uma saída de áudio muito impressionante, usando apenas um minuto de fala.
“Isso exigiu invenções em que tivemos que aprender a produzir uma voz de alta qualidade com menos de um minuto de gravação versus horas de gravação em estúdio”, observa o executivo. “A maneira como fizemos isso acontecer foi enquadrando o problema como uma tarefa de conversão de voz e não como um caminho de geração de fala. Estamos questionavelmente, vivendo na era de ouro da IA, onde nossos sonhos e ciência.”
Os detalhes são escassos, no momento. Não há cronograma ou detalhes adicionais, mas – pelo menos – este é o tipo de notícia que provavelmente convidará todo tipo de escrutínio sobre possíveis aplicações além de algo tão banal ou até mesmo emocionante como ler uma criança. mágico de Oz.