Investigadores de segurança descobriram que o Microsoft Copilot continua a aceder a milhares de repositórios do GitHub que foram tornados privados depois de terem estado públicos.
O Copilot da MS é um valioso assistente de programação - que agora passa a enfrentar a concorrência do Gemini Code Assist - mas que parece sofrer de alguns excessos na recolha de dados. Investigadores descobriram que o Copilot pode apresentar dados recolhidos de projectos no GitHub que estiveram acessíveis publicamente, mas que entretanto foram convertidos para repositórios privados ou até mesmo eliminados.
A investigação refere que isto afecta mais de 20.000 repositórios do GitHub, que estiveram com acesso público em 2024, mas que foram eliminados ou tornados privados. Dados destes repositórios continuam a estar acessíveis via Copilot, afectando mais de 16.000 organizações, expondo propriedade intelectual, dados empresariais sensíveis, chaves de acesso e outras informações confidenciais que os seus criadores pensariam já estar protegidos do acesso público.
A Microsoft foi alertada para o problema em Novembro de 2024, mas classificou-o como sendo de "baixa gravidade", argumentando que o armazenamento em cache era aceitável. Em Dezembro de 2024, a Microsoft deixou de exibir links para a cache do Bing nos resultados de pesquisa, mas os investigadores dizem que o Copilot continuava a aceder aos dados, mesmo que já não fossem visíveis através das pesquisas convencionais. Por agora, a única opção para a protecção de chaves, é assegurar que as chaves expostas foram invalidadas.
Este caso vem levantar novas questões e preocupações sobre informação potencialmente sensível que seja apanhada pelos modelos AI, e se será necessário disponibilizar formas de assegurar a remoção desses dados em situações como esta.
Subscrever:
Enviar feedback (Atom)
Sem comentários:
Enviar um comentário (problemas a comentar?)