A DeepMind da Google apresentou o Genie 3, o seu novo modelo AI capaz de criar simulações interactivas em tempo real a partir de texto ou imagens. Sete meses após o lançamento do Genie 2, esta nova versão representa um salto em qualidade e interactividade. Com o Genie 3, é possível gerar mundos virtuais com alta fidelidade visual e que se adaptam em tempo real aos pedidos do utilizador, tanto a nível de movimentação como de outros eventos, como mudar o tempo, ou adicionar personagens ou objectos.
Apesar de ser inevitável ver o Genie 3 como uma ferramenta para criar jogos (e filmes) interactivos, a DeepMind diz que as potencialidades do modelo são bastante mais vastas, considerando-o uma peça essencial na investigação de inteligência artificial. Os chamados "world models" permitem testar agentes AI em ambientes dinâmicos e controlados, fornecendo dados quase ilimitados. Isto é particularmente útil numa altura em que os dados reais começam a escassear e a ser menos eficazes para treinar modelos rumo à chamada inteligência artificial geral (AGI). Ainda recentemente um responsável por uma empresa de robots humanóides falava de como era difícil arranjar dados de qualidade para treinar os modelos que façam as tarefas rotineiras do dia a dia, e usando um modelo como Genie 3 isso torna-se bastante mais fácil.
Introducing Genie 3, the most advanced world simulator ever created, enabled by numerous research breakthroughs. 🤯
— Logan Kilpatrick (@OfficialLoganK) August 5, 2025
Featuring high fidelity visuals, 20-24 fps, prompting on the go, world memory, and more. pic.twitter.com/aTVguwTkSJ
Uma das grandes melhorias do Genie 3 é a nível da persistência do mundo. Os modelos AI deste tipo têm dificuldade em manter a consistência daquilo que sai fora do campo de visão. A sua memória visual é agora de vários minutos, um grande avanço face ao Genie 2, que só retinha informação por cerca de 10 segundos. Os ambientes gerados são consistentes e navegáveis em tempo real a 720p e 24 fps.🔘 Long-horizon consistency
— Google DeepMind (@GoogleDeepMind) August 5, 2025
Environments created remain largely consistent over several minutes, with visual memory extending as far as 1️⃣ minute in the past.
This ability is critical to enable AI agents to learn about the world, and provides humans with an immersive… pic.twitter.com/XUDQtKRg7i
Por agora, o Genie 3 continua a ser uma ferramenta de investigação, sem acesso público. A DeepMind planeia disponibilizá-lo a especialistas e investigadores para testes, mas promete que quer tornar os seus "world models" acessíveis a mais pessoas no futuro.


















Sem comentários:
Enviar um comentário (problemas a comentar?)