O Brasil surpreendeu com o lançamento do Rio 3.5 Open 397B, um modelo AI criado pela Prefeitura do Rio de Janeiro.
A cidade do Rio de Janeiro anunciou o desenvolvimento do Rio 3.5 Open 397B, um modelo de inteligência artificial open-source que resulta de um processo de treino adicionado ao Qwen 3.5 397B. O projecto demonstra uma nova abordagem no raciocínio dos modelos de linguagem, procurando melhorar a eficiência sem comprometer o desempenho.
O principal destaque é a utilização do SwiReasoning, uma estrutura que alterna dinamicamente entre dois modos de raciocínio: o tradicional chain-of-thought, em que o modelo explicita os passos do seu pensamento, e um modo de raciocínio em espaço latente, no qual o processamento ocorre internamente sem gerar texto intermédio visível. A escolha entre os dois modos é feita através de sinais de confiança baseados em entropia. O sistema avalia o grau de incerteza da resposta e decide se precisa de "pensar em voz alta" ou se consegue resolver a tarefa internamente. Esta abordagem permite reduzir o consumo de tokens e aumentar a eficiência computacional.
Os resultados parecem validar esta aposta, com o Rio 3.5 Open 397B a superar modelos como o Qwen 3.7 e DeepSeek V4 Pro, e em certos benchmarks até se aproxima de modelos como o GPT-5.5.
O Rio 3.5 Open 397B junta-se a uma tendência crescente no sector AI: criar modelos capazes de adaptar o seu processo de raciocínio consoante a complexidade da tarefa. À medida que os custos de inferência continuam a ser um dos maiores desafios da indústria, técnicas híbridas como o SwiReasoning poderão desempenhar um papel importante na próxima geração de modelos de linguagem. Demonstra também como até entidades sem "tradição" no sector podem tirar partido dos modelos AI open-source existentes, e reduzir a dependência em serviços AI que podem ficar inacessíveis de um dia para o outro.


Sem comentários:
Enviar um comentário