2025/07/22

Google DeepMind também obtém ouro nas Olimpíadas de Matemática

A Google Deep Think não fica atrás da OpenAI e anunciou que também conquistou uma medalha de ouro na Olimpíada Internacional de Matemática.

Tendo optado por aguardar mais um pouco pelo anúncio oficial face à OpenAI, a mais recente versão do Gemini Deep Think da Google DeepMind alcançou a medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, resolvendo correctamente cinco dos seis problemas propostos. Ao contrário de outras empresas, como a OpenAI, a Google submeteu o seu modelo aos mesmos critérios de avaliação aplicados aos estudantes, respeitando o tempo limite de 4h30m e sem ajuda humana na interpretação ou formatação das respostas.

Esta versão do Gemini é uma evolução do sistema usado em 2024, que apenas conseguiu medalha de prata e precisou de assistência para fazer a interpretação das questões (e demorou 3 dias a processar os problemas). O Deep Think surpreendeu ao resolver um dos problemas mais difíceis usando apenas teoria de números elementar, enquanto muitos humanos recorreram a conceitos de nível universitário. No entanto, falhou na questão considerada mais complicada do teste devido a um erro inicial de interpretação. Mesmo assim, obteve 35 pontos, resultado que apenas 8% dos participantes humanos conseguem atingir - e curiosamente ficando empatado exactamente com o resultado obtido pela OpenAI.
Mesmo assim, existe alguma picardia entre a Google e OpenAI, com a Google a dizer que a OpenAI não teve os resultados valiados devidamente, e a OpenAI a dizer que a Google deu uma ajuda extra ao modelo AI. A OpenAI destaca também o facto do seu modelo ter reconhecido "não saber" como resolver a sexta questão (a mais difícil), em vez de simplesmente alucinar e inventar alguma coisa sem sentido.
A Google planeia continuar a desenvolver este modelo e, para já, está a disponibilizá-lo a matemáticos e investigadores seleccionados. Eventualmente, o Deep Think será oferecido aos subscritores do plano Google AI Ultra, que custa 250 dólares por mês. A DeepMind já confirmou que pretende regressar à competição no próximo ano, com o objectivo de conquistar uma pontuação perfeita. Tal como na OpenAI, este novo modelo dá passos significativos na direção da inteligência artificial generalista, que tem sido um dos grandes objectivos das empresas AI.

Sem comentários:

Enviar um comentário (problemas a comentar?)