2025/08/26

Gemini ganha edição AI de imagens melhorada

O Gemini passa a contar com edição melhorada de fotos via AI, mantendo maior consistência em rostos e outros elementos.

A Google está a lançar uma grande actualização no Gemini, apresentando o novo modelo de imagens Gemini 2.5 Flash Image. A ferramenta permite fazer edição melhorada em fotografias através de simples instruções em texto, mantendo rostos, animais e outros detalhes consistentes - algo que tradicionalmente é complicado para os geradores de imagem AI.

O editor já está disponível esta semana na aplicação Gemini, bem como através da API e das plataformas para programadores da Google. Utilizadores atentos já tinham descoberto o modelo com o divertido nome "nano-banana" em sites de avaliação, onde se destacou pela capacidade de combinar várias fotos sem distorcer os rostos das pessoas.
Com esta actualização, a Google entra em confronto directo com a OpenAI, que este ano aumentou significativamente a utilização do ChatGPT graças ao seu gerador de imagens integrado. Também a Meta se está a posicionar no sector, licenciando os modelos Midjourney. Além da vertente criativa, a Google sugere usos práticos, como decorar a casa ou planear projectos, permitindo combinar várias referências num só resultado realista. A Google sublinha ainda que existem salvaguardas, incluindo marcas de água e metadados em todas as imagens geradas, bem como restrições contra conteúdos nocivos ou explícitos. O objectivo, diz, é dar controlo criativo aos utilizadores sem abrir espaço para abusos.
Apesar da dimensão da Google e da exposição implícita que os seus produtos têm, na área AI a OpenAI continua a ter vantagem. Actualmente, o ChatGPT regista 700 milhões de utilizadores semanais, contra 450 milhões de utilizadores mensais do Gemini; com esta melhoria na edição de imagens - que fica acessível também para os utilizadores gratuitos - a Google espera reduzir esta diferença.

Sem comentários:

Enviar um comentário (problemas a comentar?)