Uma directora de segurança da Meta viu os seus pesadelos tornarem-se realidade quando o popular agente AI OpenClaw (ex-ClawdBot) não faz aquilo que lhe foi pedido. Summer Yue, responsável por alinhamento no novo laboratório de investigação em superinteligência da empresa, partilhou que o OpenClaw começou a apagar centenas de emails da sua caixa - apesar de lhe ter dito expressamente para não efectuar qualquer operação sem pedir confirmação do utilizador.
Yue tinha dado acesso à sua conta de email para que o agente analisasse os emails e sugerisse o que arquivar ou eliminar - com o pressuposto de que nada seria feito sem confirmação adicional. O sistema já tinha funcionado durante semanas numa caixa de testes mas, quando foi aplicado à conta de emails principal - com muitos mais emails - as coisas descarrilaram. O modelo terá aparentemente comprimido o contexto da sessão e perdido as instruções originais, passando a agir por conta própria, começando a apagar email atrás de email.
A executiva diz que tentou parar o processo a partir do telemóvel, mas que o agente ignorou esses comandos, obrigando-a a correr literalmente até ao seu Mac mini para parar o funcionamento do OpenClaw. Mais tarde, partilhou uma captura de ecrã onde o próprio agente admite não ter seguido as instruções, prometendo comportar-se melhor no futuro.Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026
O episódio levanta novas questões sobre a integração de agentes AI em ferramentas de produtividade. À medida que empresas como a Meta ou a Microsoft apostam cada vez mais nestes sistemas, casos como este demonstram os riscos - a que nem sequer especialistas na área escapam.


















Sem comentários:
Enviar um comentário (problemas a comentar?)