2026/04/08

Claude Mythos levanta novas questões de segurança

A Anthropic revelou novos detalhes sobre o seu novo modelo AI Claude Mythos, que diz ser tão "perigoso" que irá manter com acesso limitado por questões de segurança - ao abrigo do Project Glasswing.

Ao estilo do que já fez com outros modelos Claude anteriores, a Anthropic revela uma série de episódios curiosos, com o modelo AI Claude Mythos a conseguir fazer coisas surpreendentes - como escapar de um ambiente "sandboxed" (teoricamente sem acesso à internet), enviar um email a um investigador, e até gabando-se do que conseguiu fazer em alguns fóruns na net. Mas, se tudo isso eram apenas cenários de teste, o que provavelmente levanta mais preocupações imediatas é o facto do Mythos ter conseguido detectar vulnerabilidades 0-day efectivas em sistemas operativos, programas e librarias.

Entre os casos descobertos estão vulnerabilidades antigas que passaram despercebidas durante anos, como um bug com 27 anos no OpenBSD e outro com 16 anos no FFmpeg. O modelo conseguiu também desenvolver autonomamente um exploit para browser que combinava quatro vulnerabilidades diferentes, permitindo escapar às protecções do sistema.
Devido a estas capacidades, o Anthropic avançou com a criação do Project Glasswing, uma nova iniciativa que utiliza o Claude Mythos, para identificar e corrigir vulnerabilidades críticas em software, com a acesso limitado a um grupo restrito de parceiros. A ideia é a de que estas capacidades do Mythos - e outros modelos AI de última geração - sejam usadas de forma defensiva antes de poderem ser exploradas para fins maliciosos.

Isto era algo que já se previa há muito. Com as capacidades dos sistemas AI a evoluírem de mês para mês, esta evolução torna-se numa "corrida" em que se espera que os modelos AI usados para fins benéficos se mantenham à frente de modelos AI usados para ataques. Por agora a grande condicionante é a imensa quantidade de hardware e dinheiro que é necessária para treinar estes modelos AI, o que faz com que - para o bem e para o mal - por agora se tenha que acreditar que o interesse dos gigantes tecnológicos seja comum ao interesse da sociedade em geral.

2 comentários:

  1. "librarias" -> ou libraries ou, no nosso português, bibliotecas

    ResponderEliminar
  2. libraria não existe. São bibliotecas.

    ResponderEliminar