As ferramentas AI de geração e manipulação de imagem têm vindo a melhorar ao longos dos últimos anos, mas agora o Gemini 2.0 Flash atinge um patamar em que isso pode ser feito de forma bastante eficiente e acessível a todas as pessoas - através do Google AI Studio.
Este modelo tem capacidades incríveis a nível da interpretação e manipulação de imagens, fazendo com que se torne possível efectuar todo o tipo de alterações com simples pedidos de texto. Coisas como aplicar novas roupas e acessórios a pessoas; remover mobiliário de uma sala e fazer experiências com diferentes estilos de mobília; ou até a remoção de watermarks de imagens.
Alright, Google really killed it here.
— Halim Alrasihi (@HalimAlrasihi) March 14, 2025
You can easily swap your garment just by uploading the pieces to Gemini Flash 2.0 and telling it what to do. pic.twitter.com/pNPBkIdRqy
You can now design your house with AI.
— Deedy (@deedydas) March 15, 2025
I asked Google Gemini "make the furniture go away" and then "decorate it with a modern chic aesthetic". It did it on the first try.
An interior designer would have charged $5–10k for this in the US. You can get infinite reps for free. pic.twitter.com/Tiv6TjuAyl
New skill unlocked: Gemini 2 Flash model is really awesome at removing watermarks in images! pic.twitter.com/6QIk0FlfCv
— Deedy (@deedydas) March 15, 2025
This is wild. Google's new Gemini model turns complex effects authoring into simple text prompts.
— Bilawal Sidhu (@bilawalsidhu) March 16, 2025
Technical barriers gone - just describe what you want. Entire ComfyUI workflows now collapsed into simple prompts.
5 workflows you should try for free in Google AI studio. pic.twitter.com/8lccCHIxVQ
4/5 I think i'm going to have a lot of fun using this model in my own videos and thumbnails -- you can pull out some exceedingly creative results quickly, that would otherwise have been a multi-controlnet comfyui nightmare.
— Bilawal Sidhu (@bilawalsidhu) March 16, 2025
Another 3d wireframe + semantic LiDAR point cloud test pic.twitter.com/sIOWqkaeat
Claro que nem sempre os resultados são perfeitos, mas não deixa de ser um excelente indicador da velocidade com que, aquilo que há alguns anos parecia apenas "ficção científica" se está a tornar realidade.
Não é difícil antever que, num futuro não muito distante, os programas de edição de imagem poderão começar a dar menos destaque a todas as ferramentas manuais tradicionais, e passar a disponibilizar um botão de microfone ou caixa de chat onde os utilizadores simplesmente peçam aquilo que querem fazer.
Sem comentários:
Enviar um comentário (problemas a comentar?)