Edgar Cervantes / Autoridade Android
DR
- O Google anunciou que o modelo Gemini 1.5 Pro já está disponível para visualização pública.
- A empresa acrescentou que o modelo de IA atualizado suporta processamento de áudio.
- O Google afirma que essa tecnologia pode ser usada para transcrições de alta qualidade, análise de ligações sobre ganhos e muito mais.
Os modelos de IA generativos Gemini do Google são divididos em Nano, Pro e Ultra. A empresa anunciou o Gemini 1.5 em fevereiro e agora está confirmado que o Gemini 1.5 Pro está disponível para visualização pública e ganhou um recurso notável.
O Google confirmou que o Gemini 1.5 Pro agora suporta processamento de áudio. A gigante das buscas afirma que esse suporte inclui áudio em arquivos de vídeo e fala.
“Isso fornece aos usuários uma análise intermodal contínua, fornecendo insights sobre texto, imagens, vídeos e áudio. Ele também fornece transcrição de alta qualidade e pode ser usado para pesquisar conteúdo de áudio e vídeo, como para pesquisar, analisar e responder perguntas em teleconferências de resultados ou reuniões de investidores”, explicou o Google.
Uma grande atualização para os esforços de IA do Google
A empresa afirmou anteriormente que o Gemini 1.5 Pro venceu o Gemini 1.0 Pro em 87% dos benchmarks e estava quase no mesmo nível do Gemini 1.0 Ultra. Também afirmou anteriormente que os clientes poderiam processar uma hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700.000 palavras em um único fluxo.
É importante notar que o Gemini 1.5 Pro é mais para usuários do Workspace do que para consumidores. Mas eventualmente estará acessível aos consumidores através do assistente Gemini e outros meios. No entanto, o suporte para processamento de áudio abre as portas para muitos outros recursos no futuro.
O Google já oferece truques relacionados ao áudio em telefones Pixel, como transcrição no aplicativo Recorder (alimentado por tecnologia de IA mais antiga) e a ferramenta Audio Magic Eraser. Portanto, estamos ansiosos para ver se os principais recursos de áudio do Gemini 1.5 Pro se transformarão em um futuro modelo de IA no dispositivo, pois isso poderia permitir recursos de áudio mais avançados em smartphones no futuro.