2015/10/16

Hackers usam interferências para comandar Siri e Google Now remotamente


Os nossos smartphones estão cada vez mais à escuta, prontificando-se a cumprir com os nossos comandos a cada vez que se diga "Ok Google" ou "Hey Siri"; mas os comandos de voz abrem também uma nova vertente de ataque que alguns hackers demonstram como explorar, remotamente e em silêncio.

Alguns veteranos que se interessem pelas questões da segurança e/ou paranóia digital lembrar-se-ão dos sistemas que permitiam espiar remotamente o que se exibia nos velhos monitores CRT, usando apenas as emissões electromagnéticas. Desta vez, o processo é idêntico, mas em sentido inverso.

Já terão reparado que os smartphones com rádio FM pedem para se ligar os headphones, para que o seu cabo actue como antena. Dois investigadores franceses (um deles chamado José Lopes Esteves, o que não me parece deixar dúvidas quanto à sua ligação com terras lusas) criaram um sistema que emite sinais que são captados pelo cabo dos headphones e que replicam o sinal de activação dos comandos de voz e respectivos comandos falados. Tudo isto sem que seja dito qualquer frase audível.

Embora seja preocupante, este sistema tem a "desvantagem" de ter uma área de actuação bastante reduzida, na ordem dos 5 metros de distância do emissor - embora sistemas mais potentes pudessem aumentar essa distância. Temos também o detalhe de que o utilizador poderia facilmente aperceber-se de que o seu smartphone estaria a fazer algo indevido e interromper a operação; e isto sem esquecer de que o ataque só afectaria dispositivos com o cabo dos headphones ligados.

... Poderá ser um ataque de interesse para os "espiões", mas eu continuo a achar que terá muito mais piada começar a injectar uns samples de "Ok Google" e "Hey Siri" no meio de músicas populares, ou gritar essas mesmas frases no meio de um cinema em silêncio. Seria uma forma fácil de detectar quem se tivesse esquecido de silenciar os smartphones! :)

6 comentários:

  1. Atenção que o Hey Siri faz um reconhecimento à voz do utilizador. Tem de ser dito varias vezes para ele "reconhecer" o timbre de voz e "afinar" o seu reconhecimento.

    Ou seja só reconhece a voz que lhe foi "Introduzida" como sendo do "dono".
    Não estou a ver este processo a sintetizar a voz do "dono" para lhe entrar no iPhone.

    ResponderEliminar
    Respostas
    1. Eles referem esse pormenor... e como é facilmente ultrapassado causando interferências que simulem o pressionar do botão no auricular, que acede à Siri sem necessidade do trigger por voz. :)

      Eliminar
    2. Mas mesmo depois de passado o trigger ele tem de reconhecer o timbre de voz. Por isso mesmo é que há a necessidade de lhe "ensinar" o ton de voz do user pronunciando várias "frases chaves".

      Eliminar
    3. Se o objectivo for esse, então está a falhar redondamente... pois ainda agora testei com colegas, e embora baixe as vezes que reconhece o "Hey Siri" de outras pessoas - depois no reconhecimento continua a reconhecer os pedidos sem grandes problemas. :)

      Eliminar
    4. Claro que ainda pode (e vai) ser melhorado. Mas já tem alguma evolução.

      Eliminar
    5. Eu, que tenho uma voz muito mais grave que a da minha esposa, consigo activar a Siri do seu iphone à 2ª ou 3ª vez sem qualquer dificuldade.

      Eliminar