O ChatGPT Images 2.0 inaugurou uma nova era para criar imagens com inteligência artificial, trazendo avanços significativos em comparação ao seu antecessor. O modelo da OpenAI melhorou a fidelidade ao atender pedidos, um aspecto crucial em um momento em que as ferramentas de IA são cada vez mais utilizadas para criar posts em redes sociais, banners e identidades visuais.
Melhorias na Criação de Imagens
O novo modelo apresenta uma consistência aprimorada, permitindo uma melhor compreensão de instruções detalhadas e a correta posição de objetos nas imagens. Isso significa que um prompt que anteriormente poderia resultar em uma imagem desorganizada agora gera resultados mais fiéis à ideia original, reduzindo a necessidade de retrabalho.
Além disso, o ChatGPT Images 2.0 não se limita mais ao formato quadrado, suportando proporções de 3:1 a 1:3. Isso possibilita a criação de imagens semelhantes a fotos panorâmicas ou banners verticais. A ferramenta agora também compreende melhor os textos, criando descrições claras e recebendo suporte a múltiplos idiomas na mesma criação.
Inovações e Funcionalidades
Uma das grandes novidades do ChatGPT Images 2.0 é o modo de raciocínio, que permite ao gerador de imagens lidar com tarefas mais complexas. Esse recurso possibilita a pesquisa na web, a reavaliação de instruções e a criação de múltiplas imagens simultaneamente. Essa mudança é um passo importante para resultados mais profissionais, especialmente em projetos que envolvem identidades de marca e mockups de produtos.
Limitações Persistentes
Apesar dos diversos avanços, a OpenAI reconhece que o modelo ainda enfrenta dificuldades com tarefas que envolvem modelos físicos, como origamis ou cubos mágicos, além da criação de diagramas complexos. Imagens compartilhadas nas redes sociais também indicam que o modelo tende a utilizar muito texto, o que pode resultar em uma poluição visual. Refinar os prompts pode ser necessário para melhorar a clareza das criações.
Opinião
O ChatGPT Images 2.0 representa um avanço significativo na criação de imagens com inteligência artificial, mas ainda há espaço para melhorias em sua aplicação prática, especialmente em contextos mais complexos.





