Edgar Cervantes / Autoridade Android
DR
- Na segunda-feira, a OpenAI realizará um evento que poderá contar com o anúncio de um novo assistente digital multimodal.
- Ser multimodal permitiria ao assistente usar imagens para instruções, como identificar e traduzir uma placa no mundo real.
- Isto seria uma ameaça direta contra os assistentes digitais do Google, nomeadamente o Google Assistant e o mais recente Gemini.
Nas últimas semanas, surgiram rumores, sugerindo que a OpenAI – a empresa responsável pelo ChatGPT – poderia em breve lançar um mecanismo de busca baseado em IA, o que seria uma ameaça direta ao negócio principal do Google. Dado o quão proeminente o ChatGPT se tornou em tão pouco tempo, isso representaria a primeira ameaça real à Pesquisa Google em décadas.
No entanto, parece menos provável que a OpenAI tenha um mecanismo de busca a caminho (via A informação). Em vez disso, novos rumores sugerem que o evento agendado da OpenAI para segunda-feira poderá ver a empresa anunciando um assistente digital multimodal. Embora não seja um mecanismo de busca tradicional, ainda permitiria que as pessoas pesquisassem coisas usando o poder da IA, portanto ainda seria uma ameaça significativa para o Google.
Multimodal significa que a IA pode lidar com vários formulários de entrada, não apenas com texto. No caso deste suposto assistente digital, ele seria capaz de se conectar a uma câmera, processar informações do mundo real e depois responder com mais informações sobre o que vê. Por exemplo, você poderia apontar uma câmera para uma placa em um idioma diferente e pedir ao ChatGPT para identificar e traduzir a placa para você, e a IA falaria com você em resposta.
Se isso parece familiar, é porque é algo que o Google Lens, o Google Assistant e, mais recentemente, o Google Gemini já fazem. Na verdade, o ChatGPT também já pode fazer isso, mas não por meio de uma interface. Em outras palavras, o lançamento de segunda-feira poderá fazer com que a empresa anuncie um modelo GPT atualizado que oferece respostas mais rápidas e precisas com entrada de imagem e respostas sonoras empacotadas em um aplicativo. Ou seja, um concorrente direto do Gemini (e, posteriormente, do Google Assistant e do Siri da Apple).
Para ser claro, quase certamente não seria o GPT-5, a tão esperada continuação do GPT-4 e GPT-4 Turbo. A empresa indicou que o GPT-5 não comparecerá a este evento. A informação sugere que só pousará no final de 2024.