2025/02/26

Copilot acede a milhares de repositórios GitHub privados

Investigadores de segurança descobriram que o Microsoft Copilot continua a aceder a milhares de repositórios do GitHub que foram tornados privados depois de terem estado públicos.

O Copilot da MS é um valioso assistente de programação - que agora passa a enfrentar a concorrência do Gemini Code Assist - mas que parece sofrer de alguns excessos na recolha de dados. Investigadores descobriram que o Copilot pode apresentar dados recolhidos de projectos no GitHub que estiveram acessíveis publicamente, mas que entretanto foram convertidos para repositórios privados ou até mesmo eliminados.

A investigação refere que isto afecta mais de 20.000 repositórios do GitHub, que estiveram com acesso público em 2024, mas que foram eliminados ou tornados privados. Dados destes repositórios continuam a estar acessíveis via Copilot, afectando mais de 16.000 organizações, expondo propriedade intelectual, dados empresariais sensíveis, chaves de acesso e outras informações confidenciais que os seus criadores pensariam já estar protegidos do acesso público.

A Microsoft foi alertada para o problema em Novembro de 2024, mas classificou-o como sendo de "baixa gravidade", argumentando que o armazenamento em cache era aceitável. Em Dezembro de 2024, a Microsoft deixou de exibir links para a cache do Bing nos resultados de pesquisa, mas os investigadores dizem que o Copilot continuava a aceder aos dados, mesmo que já não fossem visíveis através das pesquisas convencionais. Por agora, a única opção para a protecção de chaves, é assegurar que as chaves expostas foram invalidadas.

Este caso vem levantar novas questões e preocupações sobre informação potencialmente sensível que seja apanhada pelos modelos AI, e se será necessário disponibilizar formas de assegurar a remoção desses dados em situações como esta.

Sem comentários:

Enviar um comentário (problemas a comentar?)