A Google está a expandir o acesso à versão mais recente do seu gerador de imagens AI Imagen 2.
O Imagen 2 vem com melhorias face ao modelo original, agora tendo a capacidade de gerar imagens com textos, e também logotipos (para desagrados dos designers que se dedicam a isso). Para se tentar destacar de modelos rivais como o Dall-E 3 da OpenAI e o Titan da Amazon, que também têm essa capacidade, a Google salienta que o Imagen 2 pode fazê-lo em múltiplas línguas, incluindo Chinês, Hindu, Coreano, Português e Espanhol (além de inglês), com mais línguas a serem adicionadas ao longo de 2024.
Este modelo também promete ser melhor a lidar com alguns dos elementos que por vezes baralham os modelos anteriores, como as mãos de pessoas no caso de recriações foto-realistas.
Apesar das melhorias, a Google opta por não dar informação sobre as imagens usadas para o treino deste modelo, nomeadamente a nível de inclusão de imagens de autores que não deram permissão para isso, nem tão pouco faz qualquer referência a potenciais compensações para esses autores - um tópico que continuará a ser bastante discutido à medida que os modelos AI se vão espalhando cada vez mais pela sociedade.
Na primeira versão a Google revelou ter usado o conjunto de imagens LAION para o treino, um conjunto de imagens que recentemente se veio a descobrir conter várias imagens problemáticas, incluindo de abuso sexual de menores.
Sem comentários:
Enviar um comentário (problemas a comentar?)