A Google aproveitou o evento I/O 2026 para apresentar o Gemini Omni. Um novo modelo de inteligência artificial multimodal que promete não ter limites. A gigante tecnológica afirma que os utilizadores podem criar qualquer coisa a partir de qualquer formato de entrada, seja texto, áudio, imagens ou vídeo.
A revolução na edição e criação de vídeo
A primeira versão a chegar ao público é o Gemini Omni Flash, que se foca inicialmente na geração de vídeo. O modelo permite combinar várias formas de entrada para gerar clipes de alta qualidade. Além disso, os utilizadores podem carregar vídeos reais e pedir à inteligência artificial para alterar o ambiente, adicionar efeitos especiais ou inserir novas personagens, tudo através de comandos de linguagem natural.
A Google garante que o modelo compreende as leis da física, como a gravidade e a dinâmica de fluidos, para garantir um elevado nível de realismo. As edições mantêm a consistência das personagens e dos cenários ao longo de toda a sequência.
Integração no YouTube e pesquisa inteligente
A plataforma de vídeos da Google também recebe grandes novidades. A barra de pesquisa integra agora a funcionalidade “Ask YouTube”, que permite aos utilizadores fazer perguntas complexas e receber respostas que combinam vídeos longos e Shorts.
O Gemini Omni também passa a estar disponível gratuitamente no YouTube Shorts Remix e na aplicação YouTube Create. Esta integração oferece aos criadores uma forma inovadora de misturar conteúdos, pois o modelo compreende a intenção do utilizador e lida com ajustes complexos de áudio e vídeo nos bastidores. Outras empresas do sector, como a OpenAI, acabaram por encerrar projectos semelhantes, como o Sora, mas a Google adopta uma abordagem mais integrada e menos intrusiva.
Segurança, avatares e disponibilidade
Para evitar problemas de privacidade e a proliferação de falsificações, a Google implementou várias medidas de segurança e regras de utilização.
- A criação de avatares digitais permite aos utilizadores gerar vídeos onde aparecem e soam como eles próprios, mas a Google exige a aplicação de marcas de água SynthID em todos os conteúdos gerados, para que qualquer pessoa consiga verificar a origem do ficheiro através da aplicação Gemini, da Pesquisa Google ou do próprio browser.
- A ferramenta de detecção de imagem e semelhança expande-se agora a todos os criadores com mais de dezoito anos, para que estes possam solicitar a remoção imediata de vídeos onde a sua imagem tenha sido utilizada de forma indevida por ferramentas de inteligência artificial de terceiros.
- O acesso ao Gemini Omni Flash já se encontra disponível a nível global na aplicação Gemini e na plataforma Google Flow para os subscritores dos planos pagos Plus, Pro e Ultra, enquanto os utilizadores gratuitos podem experimentar a tecnologia através das ferramentas de remistura do YouTube.