A OpenAI lançou geração de imagens AI nativas integradas no ChatGPT, usando as capacidades multimodais do GPT-4o.
Embora já fosse possível criar imagens AI no ChatGPT por intermédio do Dall-E, agora isso passa a ser feito nativamente pelo modelo GPT-4o - que a OpenAI descreve como sendo omnimodal, podendo lidar com texto, áudio, imagens e vídeo - e com capacidades que a OpenAI diz superaram o Dall-E 3.
Passando à parte prática, o que mais interessa é que esta capacidade fica acessível para os utilizadores gratuitos, mas com limitação idêntica à que era aplicada às imagens do Dall-E 3. Embora a OpenAI não tenha referido exactamente que limite é esse, a informação no site indicava um limite de três imagens geradas por dia, valor que a OpenAI diz que poderá rever de acordo com a utilização.
A OpenAI refere que este novo modelo é muito mais capaz a gerar imagens com texto, e também a combinar diferentes elementos com relacionamento entre eles, e que tem capacidade para gerar imagens com 20 ou mais objectos da forma que é pedida, em vez dos 5 a 8 que os modelos AI tradicionalmente suportam antes de se "baralharem". Também é melhor na "consistência" de imagens, suporte para transparência, e outras coisas.
Como sempre, nada como experimentar e ver os resultados, que podem ser explorados por qualquer utilizador gratuito do ChatGPT.
Actualização: Já começaram a surgir alguns exemplos curiosos das suas capacidades.
Actualização 2: O sucesso deste novo sistema já levou ao adiamento do seu lançamento para os utilizadores gratuitos.
2025/03/25
Subscrever:
Enviar feedback (Atom)
Sem comentários:
Enviar um comentário (problemas a comentar?)