2022/11/10

Midjourney v4 melhora qualidade de imagem

O sistema de AI de geração de imagens a partir de texto Midjourney prepara melhorias significativas na qualidade das imagens geradas.

O Midjourney era um dos sistemas de AI que tem estado na moda, mas que era associado à geração de imagens mais simples do que congéneres como o DALL-E 2, Imagen e Stable Diffusion. Algo que deixará de acontecer com a chegada da nova versão.

A nova versão 4.0, que por enquanto está em fase de teste, é o resultado de uma nova arquitectura e de 9 meses de treino num supercomputador, resultando em imagens com muito maior qualidade, e podendo lidar com descrições bastante mais complexas. Mas, também importante, é que mesmo descrições simples resultam em imagens prontas a usar - o que nem sempre acontece com os outros sistemas (que beneficiam de descrições mais detalhadas).
Por exemplo, em cima podemos ver as diferenças entre o Midjourney v3 (à esquerda) e v4 (à direita) para a mesma descritção: "a muscular barbarian with weapons beside a CRT television set, cinematic, 8K, studio lighting".

As diferenças são evidentes, com os resultados quase "caricaturais" do modelo v3 a darem lugar a imagens bastante mais de acordo com aquilo que se esperaria de tal descrição. E com isto, põe em causa a necessidade dos "especialistas nas descrições" que se especializavam em criar os textos ideais para se obterem imagens de qualidade destes sistemas de AI.

Faz-nos também pensar no nível que estes sistemas poderão atingir daqui por mais um par de anos, tendo em conta a rápida e notória evolução que tem havido em tão curto espaço de tempo.

Sem comentários:

Enviar um comentário (problemas a comentar?)