Está a tornar-se cada vez mais difícil distinguir o que é real do que é fantasia na Internet, e a Google não está a facilitar nada com o anúncio do Veo 3.1. O novo modelo de inteligência artificial para criar vídeos a partir de descrições de texto supostamente oferece melhor áudio e mais realismo, juntamente com maior precisão na interpretação dos pedidos (prompts). A IA de vídeo actualizada está disponível em todo o ecossistema Google, incluindo na ferramenta de produção de filmes Flow, onde o novo modelo irá desbloquear novas funcionalidades. E, se está preocupado com o custo de gerar todos estes vídeos de IA, a Google também disponibiliza uma variante ‘Rápida’ (‘Fast’) do Veo 3.1.
O Veo causou sensação quando foi lançado no início deste ano. Meses depois, com o lançamento do Veo 2, mostrou uma melhoria espantosa na qualidade dos vídeos gerados por IA em muito pouco tempo. Afinal, ter à disposição um catálogo de vídeos quase infinito no YouTube é muito útil para treinar modelos de IA para gerar vídeo, por isso a Google já avançou para o Veo 3.1, que traz uma série de funcionalidades novas.
A Google afirma que o Veo 3.1 oferece uma melhor compreensão dos prompts, o que resulta em vídeos gerados com mais qualidade e menos processamento desperdiçado. O áudio, que foi uma característica marcante do lançamento do Veo 3, também melhorou. A funcionalidade de texto para vídeo do Veo 3 estava limitada a gerar vídeos em resolução 720p na horizontal; no entanto, há um volume (e uma procura) cada vez maior de vídeo na vertical nos vários serviços online. Assim, o Veo 3.1 pode produzir vídeo horizontal e vertical na proporção 16:9.
A Google deu conta de que traria as ferramentas de geração de vídeo Veo para os YouTube Shorts, pequenos vídeos verticais albergados no YouTube, semelhantes aos que se encontram no TikTok e noutras redes sociais. O lançamento do Veo 3.1 abre a porta para cumprir essa promessa. É certo que, daqui para a frente, vídeos gerados no Veo vão começar a aparecer com mais frequência também no TikTok, agora que se encaixam no formato. Este lançamento também mantém a Google na corrida com a OpenAI, que lançou recentemente uma aplicação Sora para iPhone, com uma nova e impressionante versão da sua IA de geração de vídeo.

Já quase que dá para fazer filmes
O modelo Veo 3.1 está disponível em todo o ecossistema de IA da Google. Os utilizadores podem criar conteúdos com o Veo 3.1 e o Veo 3.1 Fast através da aplicação Gemini, e os programadores terão acesso no Vertex AI e através da API Gemini. Usar a variante Fast ajuda a manter os custos baixos, ao pagar por token. Presumivelmente, os utilizadores da aplicação Gemini vão poder gerar mais vídeos no modo Fast.
O Veo é o modelo subjacente na ferramenta de produção de filmes Flow da Google e está a receber novas capacidades graças à integração do modelo actualizado. As funcionalidades ‘Ingredients to Video’, ‘Frames to Video’ e ‘Extend’ são agora compatíveis com áudio gerado. Com o ‘Ingredients to Video’ pode carregar várias imagens como referência ou usar a funcionalidade ‘Frames to Video’ para definir imagens como ponto de partida ou de chegada, enquanto adiciona áudio personalizado ao clipe. A funcionalidade Scene Extension permite aumentar a duração dos vídeos em sete segundos de cada vez, até um máximo de vinte extensões, para criar vídeos que podem ir até aos 141 ou 148 segundos.
Há também um par de funcionalidades de vídeo totalmente novas a chegar com o Veo 3.1. A Google diz que o Veo 3.1 é mais capaz de replicar a aparência de um vídeo enquanto faz edições de precisão. Assim, poderá adicionar um objecto a um clipe, mantendo o resto inalterado. Da mesma forma, pode remover um elemento sem alterar o resto da cena. A adição de objectos está disponível no Flow e na API. A remoção de objectos ainda não estará disponível no Flow, mas a Google diz que a funcionalidade vai chegar em breve.
Se quiser experimentar, basta usar a aplicação Gemini no smartphone ou no browser.