2013/04/03

Dados Anónimos da Geolocalização não são tão "Anónimos" quanto se pensa


A nossa privacidade é algo que levamos cada vez mais a sério neste mundo digital onde as nossas pegadas electrónicas vão permitindo criar um perfil cada vez mais completo dos nosso hábitos diários. Pagamos as nossas compras com cartões de pagamento electrónicos que permitem aos bancos saber precisamente como gastamos o nosso dinheiro (e implicitamente saber por onde andamos); os identificadores electrónicos nos automóveis... nem é preciso dizer; e os nossos telemóveis e smartphones... mesmo não usando qualquer tipo de app ou ligação à internet; permitem também traçar o nosso percurso a cada momento do dia.

Este tipo de dados de geolocalização é usados para inúmeros fins (como para determinar congestionamentos de trânsito em tempo real), e o seu uso deixa-nos um pouco mais descansados por serem dados que são usados de forma "anónima". Isto é, estes dados mostram o trajecto que milhares de pessoas fazem diariamente, mas sem qualquer informação relativamente a quem são.

O problema é que um estudo veio chamar a atenção para aquilo que eu próprio já tinha discutido com colegas e amigos: os dados dos nossos movimentos são mais que suficientes para se tornarem numa forma de identificação altamente fiável! (estudo em pdf)

O mais assustador é a pequena quantidade de "pontos" necessários para identificar de forma individual estas pessoas. Usando-se apenas quatro pontos, os investigadores conseguiram individualizar 95% das pessoas num universo de 1.5 milhões.

É simples de se perceber: imaginem em quantas pessoas saem à mesma hora da vossa casa; fazem precisamente o mesmo percurso que vocês; vão para o mesmo local de trabalho; e regressam ao final do dia pelo mesmo trajecto?... Em 99% dos casos, responderão que: são só vocês; certo? E é precisamente aí que está o "problema". Não haverá muitos casos de pessoas que sejam vizinhas; trabalhem no mesmo local; e que se desloquem para o trabalho à mesma hora usando o mesmo meio de transporte.

Quer isto dizer que estes dados, que são recolhidos quer queiramos ou não (uma vez que fazem parte do processo de funcionamento das redes celulares), acabam por ser bastante identificativos mesmo sendo "anonimizados". Embora se possa imaginar que no futuro possam vir a existir ferramentas que permitam esconder parte destes dados (por exemplo, não dar indicações precisas quando estamos num raio de 5Km de nossa casa/trabalho), o melhor é assumir que... a era da privacidade já se foi; e que hoje em dia será sempre possível, de forma mais simples ou mais difícil, saber-se o que fazemos e por onde andamos.


Eu continuo a ser apologista do: já que estes dados existem e estão a ser recolhidos; o mínimo que se deveria exigir seria termos acesso aos mesmos! - Porque motivo não deveremos ter o direito de entrar no site do nosso operador de telecomunicações e ver todos estes dados geolocalizados a nosso respeito? E de forma algo relacionada... porque não podermos ver o relatório que os operadores de TV por cabo/fibra também recolherão certamente acerca dos nossos hábitos televisivos, por exemplo? (Actualização: nem de propósito, nos EUA estão a querer implementar a directiva "Right to Know", que daria aos utilizadores o acesso a todos os dados guardados sobre eles, assim como todas as empresas e serviços a quem esses dados sejam disponibilizados).

9 comentários:

  1. Não sei até que ponto será assim tão bom o "Right to Know".

    Uma coisa é os dados serem recolhidos, e ser possível a tal fácil identificação. Outra coisa, é os dados estarem realmente a ser tratados. E é aqui que eu quero chegar. Se queremos ter acesso a eles, então significa que os próprios dados, ficarão mais "acessíveis" dentro da própria operadora. Vão ficar mais fáceis de "ler" e entender.

    Não sei se já perceberam onde quero chegar. Mas penso que para quem é da área da informática, acho que sim. Sabemos bem, que por vezes à informação "indevida" nas BDs de muitas entidades que é recolhida e guardada de forma "menos" anónima. Mas muitas vezes, mal é usada e para fazer a tal identificação, não será qualquer um e o trabalho que dá versus o proveito do resultado disso é pouco ou nenhum. Se tivermos que criar/dar acesso a esta informação, então fica mais fácil a consulta destes dados por mais pessoas e o interesse por eles, poderá aumentar.

    ResponderEliminar
    Respostas
    1. Penso que não se coloca esse problema. Não é por os dados estarem "escondidos" do utilizador comum que estão mais protegidos; tal como uma cortina a esconder uma porta aberta não evitará que se seja assaltado.

      Segurança é uma coisa; privacidade e direito à informação é outra; e nenhuma delas tem implicações directas na outra. Ou seja; os dados têm que estar seguros, quer estejam facilmente visíveis ou não. Para além disso, será essencial que se saiba precisamente quem é que terá acesso a esses dados e de que forma.

      (Senão entravámos na conversa da "segurança pela obscuridade"... e bem se sabe que isso não passa de uma ilusão. :)

      Eliminar
    2. Como alguém que está na área da programação, sabes que aquilo que eu disse, é verdade. Compreendo que queiras o acesso ao que guardam de ti. Mas o que eu quero dizer é que se hoje essa informação guardada, não estiver a ser tratada, poderá estar acessível a meia dúzia de pessoas, tipo administrador de sistemas, ou de base de dados, etc...

      Se as operadoras fossem disponibilizar-te o acesso aos dados, teriam que disponibilizar uma UI toda bonita, xpto de corrida e tal. Isso leva a que mais facilmente (não obrigatoriamente), esteja acessível a mais pessoas. Tipo a operadores de call center e tudo. O que por sua vez, leva a maiores possibilidades de "fuga" e venda de informação.

      Eliminar
    3. Bem, por esse princípio não deveríamos poder ver o nosso extracto bancário online nem fazer pagamentos ou outras coisas que tais. :)

      Como disse, a segurança e direito de acesso à informação são coisas "independentes"... e não se deve dizer que o acesso a uma implica a falta da outra. É questão de fazer as coisas bem feitas.

      Eliminar
  2. Relatório de hábitos de TV poderia ser problemático no caso de uma família, em que um membro veja certas coisas e não queira que os outros saibam. Conteúdos para adultos por exemplo, mas não só.

    ResponderEliminar
    Respostas
    1. Quem paga pelo serviço terá direito a saber como é utilizado. Tal como nos operadores lá ficará registado que o cliente X viu o canal Y às tantas horas da noite.

      (Da mesma forma que se pagares a conta de telemóvel a um filho, etc. quererás saber se fez chamadas para números de valor acrescentado...)

      Eliminar
    2. Então e no caso da internet? Quem paga também terá o direito de pedir ao ISP uma listagem de todos os sites acedidos?

      Não me parece que quem paga tenha direito a saber "tudo". Não tem o direito de ouvir as chamadas ou ler emails por exemplo. Serviços de valor acrescentado, como chamadas ou video-on-demand, são casos especiais porque implicam pagamento extra. E mesmo aí, a partir de certa idade no caso dos filhos, parece-me preferível definir um valor limite mensal do que controlar para onde andam a ligar.

      Todos os membros de um agregado familiar têm direito à privacidade, e não o perdem totalmente para o dono da casa ou para quem paga as contas.

      Eliminar
    3. Porque não? Estamos num país onde os operadores até se davam ao luxo de diferenciar entre tráfego nacional e internacional, e onde não tinhas grandes hipóteses de saber se estavas a pagar "por um" ou "pelo outro".

      Senão, estaremos perante apenas a "ilusão" da privacidade; onde tu não tens acesso a esses dados, mas - num caso extremo - o teu vizinho pode ter (se trabalhar na empresa respectiva, ou noutra a quem esses dados - que tu nem sabes quais, ou que contêm - são cedidos).

      Eliminar
  3. Este comentário foi removido pelo autor.

    ResponderEliminar