A OpenAI anunciou o ChatGPT Images 2.0, uma nova versão do seu sistema de geração de imagens no ChatGPT para todos os planos pagos. Esta novidade é apresentada como uma actualização centrada numa «maior precisão, melhor controlo e resultados mais consistentes em tarefas visuais complexas».
Entre as melhorias destacadas pela OpenAI está a capacidade de produzir «texto mais legível dentro das imagens», um ponto onde a geração de imagem com IA costuma falhar com frequência. A empresa sublinha também um «melhor desempenho em vários idiomas» e resultados mais credíveis em «cartazes, capas e composições editoriais», com «tipografia mais estável».
A actualização passa ainda a lidar melhor com «composições estruturadas, sequências visuais e elementos que exigem coerência entre várias imagens». Nos exemplos partilhados, a OpenAI mostra páginas de banda desenhada e peças gráficas com continuidade visual entre cenas e objectos.
Outra das novidades é o modo ‘Images with thinking’, que acrescenta uma etapa prévia de planeamento antes da criação final. Nas notas desta versão, a OpenAI explica que este modo permite ao sistema «planear e refinar o resultado antes de gerar a imagem». Esta opção está disponível nos planos pagos, quando o utilizador escolhe os modelos Thinking e Pro.