2025/05/01

Alibaba lança Qwen3

A Alibaba revelou o Qwen3, uma nova família de modelos AI criada para lidar com tarefas complexas de raciocínio e competir com as melhores modelos AI da Google e da OpenAI.

A gama Qwen3 inclui modelos até 235 mil milhões de parâmetros, sendo que a maioria será disponibilizada com licença aberta em plataformas como o Hugging Face e GitHub. A empresa afirma que alguns modelos superam alternativas como o o3-mini da OpenAI e o Gemini 2.5 Pro da Google em testes de programação e raciocínio, embora o modelo mais avançado ainda não esteja acessível ao público. Estes modelos híbridos conseguem alternar entre respostas rápidas e raciocínio profundo, adaptando-se à complexidade de cada pedido.

Com suporte para 119 línguas, o Qwen3 foi treinado com mais de 36 biliões de tokens, incluindo manuais escolares, conjuntos de perguntas e respostas, código e conteúdo gerado por IA. Alguns modelos usam uma arquitectura Mixture of Experts (MoE), que melhora a eficiência ao dividir tarefas em subtarefas resolvidas por submodelos especializados.
Para além do desempenho técnico, a Alibaba diz que o Qwen3 também se destaca a seguir instruções, formatar respostas e interagir com ferramentas. Os modelos podem ser descarregados ou usados através de serviços cloud como o Fireworks AI e o Hyperbolic. No caso dos modelos mais compactos, é possível executá-los totalmente em computadores pessoais, com capacidades que poderiam parecer impossíveis há apenas alguns anos.

Esta nova geração de modelos AI "abertos" vem novamente pressionar os modelos "fechados" de empresas como a OpenAI e Google, e contribuir para o dinamismo e avanço neste sector ultra-competitivo.

Sem comentários:

Enviar um comentário (problemas a comentar?)