2024/02/22

Stable Diffusion 3.0 melhora imagens e texto

A Stability AI anunciou a chegada do seu novo sistema de geração de imagens AI, o Stable Diffusion 3.0.

A Stability AI não tem estado parada, nos últimos meses tendo apresentado um sistema de geração de vídeo (que agora foram eclipsados pelo Sora da OpenAI) e um novo modelo para geração de imagens com o Stable Cascade. E agora temos um primeiro olhar sobre as melhorias do Stable Diffusion 3.0.

O Stable Diffusion 3.0 usa um novo modelo diffusion transformer, que tem uma arquitectura parecida dom o Sora da OpenAI, e que a empresa diz ser o próximo passo a dar no sistemas de geração de imagens e de vídeo.
Para além das melhorias a nível da qualidade de imagem, outra das grandes vantagens é que agora passa a ser possível obter resultados muito mais fiáveis quando se pedem para que determinadas palavras apareçam nas imagens - algo que era um ponto fraco dos modelos anteriores. A Stability AI diz que agora até será possível incluir frases completas nas imagens, de forma visualmente realista e correcta.

Sem comentários:

Enviar um comentário (problemas a comentar?)