A Google anunciou, nesta terça-feira (19), a chegada do Gemini Omni, um inovador modelo de inteligência artificial voltado para a criação de vídeos. A novidade foi revelada durante a conferência I/O e representa um avanço significativo em relação ao modelo anterior, Veo 3.1.
O Gemini Omni é projetado para transformar a forma como vídeos são gerados, integrando habilidades de criação e raciocínio. A ferramenta possui amplo conhecimento sobre física e a consistência dos elementos, o que lhe permite oferecer resultados mais realistas. Os usuários poderão enviar pedidos utilizando fotos, vídeos, áudios e textos para refinar suas solicitações.
Entre as funcionalidades do Gemini Omni, destaca-se a possibilidade de realizar edições específicas em vídeos existentes. Os usuários poderão mudar personagens, estilos visuais ou até ângulos de filmagem, mantendo a essência do clipe original. Essa capacidade torna o modelo uma versão aprimorada do Veo, oferecendo um resultado que pode ser descrito como uma edição “turbinada”.
O modelo também traz melhorias na compreensão de conceitos físicos, como gravidade e energia cinética, o que resulta em criações mais fiéis à realidade. Além disso, o Gemini Omni é capaz de suportar comandos de diversas fontes de mídia, ampliando as opções para os criadores de conteúdo.
Um recurso inovador do Gemini Omni é a criação de um avatar digital que simula a aparência do usuário, possibilitando sua utilização em diversas produções. A primeira versão disponibilizada é o Omni Flash, que pode ser acessada através do Google Flow e do YouTube Shorts, mas apenas para assinantes dos planos pagos Google AI Pro e AI Ultra.
A inteligência artificial continua a ser um tema central nas inovações apresentadas pela Gigante de Mountain View. Durante a conferência I/O, a empresa também destacou o novo visual do Gemini e o modelo 3.5 Flash, que promete respostas mais rápidas, além de um recurso para a criação de documentos a partir de comandos de voz.

