2025/01/27

DeepSeek lança modelos Janus Pro de geração de imagem

A DeepSeek não dá tréguas à OpenAI e outras empresas AI, e lança os novos modelos Janus Pro de geração de imagem, capazes de superar o Dall-E 3, e disponíveis como open-source.

Tirando partido da sua onda de popularidade conseguida à custa do seu modelo R1 ultra-eficiente de raciocínio, a DeepSeek expande-se para outras áreas além do texto.

Os Janus Pro são uma nova família de modelos AI multimodais capazes de criar imagens. Segundo a empresa, o maior, o Janus Pro 7B, supera o DALL-E 3 da OpenAI em benchmarks como GenEval e DPG-Bench. Estes modelos, que variam entre 1 e 7 mil milhões de parâmetros, já estão disponíveis para download na plataforma Hugging Face sob licença MIT, permitindo o seu uso comercial sem restrições.
O Janus Pro utiliza o que a DeepSeek descreve como uma "estrutura autorregressiva inovadora", capaz de gerar imagens com resoluções até 384 x 384. Embora seja uma resolução reduzida em comparação com outros modelos, o desempenho da família Janus Pro, aliado ao seu tamanho compacto, volta a gerar uma onda de curiosidade e entusiasmo. A DeepSeek afirma que o Janus Pro supera modelos mais antigos como o Stable Diffusion XL e PixArt-alpha, posicionando-se como líder na próxima geração de modelos unificados.

Este lançamento surge numa altura em que a DeepSeek tem estado no centro das atenções. Os modelos de linguagem e imagem da empresa, desenvolvidos com técnicas eficientes em termos de computação, têm posto em causa as tácticas e investimentos bilionários das empresas ocidentais. Mas, pelo lado positivo, o facto de da maioria das suas inovações estarem a ser disponibilizadas ao mundo, significa que qualquer interessado poderá aproveitar as suas técnicas e ideias para melhorar os seus modelos AI.

Sem comentários:

Enviar um comentário