2025/03/13

Google lança modelos AI Gemini Robotics para robots

A Google DeepMind apresentou os modelos de AI Gemini Robotics e Gemini Robotics-ER, concebidos para melhorar a destreza dos robôs e a sua interacção com o mundo real.

Fala-se que a evolução das capacidades dos robots, particularmente dos modelos humanóides, anda de mão dada com a evolução dos modelos AI, e a Google vem demonstrar que efectivamente é esse o caso.

Embora há muito que seja possível criar mecanicamente robots humanóides, o grande problema está em dar-lhes a capacidade de controlo que lhes permita ver e interagir de forma natural com o mundo em seu redor. Isso era facilmente demonstrado pela sua (in)capacidade de lidar com tarefas domésticas simples, de coisas como dobrar roupa ou arrumar objectos diferenciados. Mas, com a assistência dos novos modelos AI, isso começa finalmente a mudar. Os modelos AI Gemini Robotics e Gemini Robotics-ER permitem que os robots efectuem tarefas delicadas, como dobrar origami ou fechar sacos de plástico sem os danificar, além de serem igualmente robustos para lidar com interferências - como alguém que mude a posição de um objecto.

Tradicionalmente, este tipo de tarefas tinha que ser processada usando rotinas de movimentos pré-programados, e a complexidade de lidar com todas as possíveis variações fazia aumentar a complexidade exponencialmente ao ponto de se tornar impraticável. Mas, com os modelos AI a poderem fazer a sua "magia" com processamento directo e integrado da visão do mundo e do controlo dos movimentos a efectuar, tudo isso se transforma.




Este modelos da DeepMind podem ser aplicados em diferentes tipos de robots, de braços robóticos a humanoides completos, como o Apollo da Apptronik (usado nas demonstrações acima). O modelo vision-language-action (VLA) ajuda os robots a processar informações visuais, interpretar comandos de linguagem e executar movimentos precisos, enquanto o modelo embodied reasoning (ER) melhora a percepção espacial para um controlo ainda mais eficiente. Apesar dos avanços promissores, o modelo ainda está na fase de investigação, sem previsão para uso comercial.

Não descurando a inevitável parte da segurança, a Google criou também um quadro de regras chamado "Robot Constitution", inspirado nas Três Leis da Robótica de Isaac Asimov, e lançou um novo conjunto de dados, ASIMOV, para testar a segurança dos robôs em ambientes reais.


Sem comentários:

Enviar um comentário (problemas a comentar?)