2020/02/06

Investigadores mostram que dados "anonimizados" são uma ilusão


Muitas empresas vendem dados dos utilizadores, defendendo-se com o facto de que são "anonimizados" e, como tal impossíveis de associar a cada indivíduo. No entanto, é uma desculpa que já não funciona, e há cada vez mais investigadores a demonstrá-lo.

No passado já vimos exemplos de como dados de localização eram suficientes para chegar a indivíduos específicos, inferindo os locais onde moram, onde trabalham, e onde passam o resto do tempo. Mas o maior problema surge quando se começam a compilar e agregar diferentes fontes de dados, sendo precisamente isso que um grupo de jovens investigadores demonstrou.

A maioria das pessoas terá a tendência para avaliar o perigo de cada um dos (cada vez mais frequentes) roubos de dados de forma individual. Este serviço pode apenas ter revelado o seu username e email; aquele pode ter apenas revelado o seu email e número de telefone; e o outro pode apenas ter revelado a sua morada e telefone mas sem email. No entanto, estes são dados que para sempre circularão nos meandros obscuros da internet e que estarão a ser compilados por hackers e serviços... e que os utilizarão para completar perfis cada vez mais completos destas pessoas.


Com os dados acima referidos, provenientes de diferentes fontes, um atacante poderá fazer o cruzamento de dados para, a partir dessas múltiplas bases de dados, conseguir saber a morada e telefone associado a cada email e utilizador. E isto é apenas um exemplo básico do tipo de associação de dados que se pode fazer. Casos mais extremos poderiam fazer coisas como, pegar em registos de localização e informação sobre receitas, para analisar que pessoas estariam num consultório ou farmácia na altura, e associar ao seu perfil eventuais condições de saúde. (E o mesmo poderia ser feito com qualquer outro tipo de dados que viesse a ser apanhado, como compras em lojas, restaurantes, etc. etc. etc.) Aliás, chega-se ao cúmulo de bastarem dados sobre a forma como se trava para se poderem identificar condutores com grau de certeza bastante elevado!

Este cenário de compilação e associação de dados demonstra que a desculpa da "anonimização de dados" já não pode servir de desculpa, e que o impacto de todo e cada dado sobre os utilizadores que é tornado público, quer seja de forma deliberada ou inadvertidamente, acabará por os colocar em risco (e já nem vamos falar do tracking que é feito pelos serviços publicitários em muitas apps).

Sem comentários:

Enviar um comentário (problemas a comentar?)