2024/06/28

Perplexity AI criou contas académicas falsas para obter dados do Twitter

A Perplexity AI continua sob fogo quanto à forma como obteve os dados para treinar os seus modelos AI, tendo até criado contas académicas falsas para roubar dados do Twitter.

Recentemente descobriu-se que a Perplexity AI ignora por completo as instruções nos sites web que não desejam ter os seus conteúdos usados por modelos AI, continuando a aceder a esses sites e a usar esses dados como bem entende - dizendo que isso é um serviço feito por uma empresa sub-contratadada, e que na verdade o pedido de exclusão não tem qualquer validade legal, e que se tratam de conteúdos de acesso público. Agora, a empresa passa a ter a sua imagem ainda mais prejudicada, descobrindo-se que terá criado contas falsas para roubar dados ao Twitter.

O Twitter (agora X) há muito que fechou o acesso total à sua informação através de APIs, mas permitia o acesso aos dados para projectos académicos. Tirando partido disso, os criadores da Perplexity AI criaram contas académicas falsas, montes delas, para poderem obter o máximo de dados do Twitter e criarem o seu projecto inicial "Bird SQL", que usava AI para responder a perguntas sobre tudo o que fosse feito no Twitter.

Isto não é propriamente uma novidade. No passado, empresas como a Clearview AI criaram arquivos com milhares de milhões de rostos roubando todas as fotos que podiam apanhar na internet, que resultaram em multas de milhões mas que já não conseguem reverter o facto dessas bases de dados terem sido criadas. Este caso da Perplexity AI só vem demonstrar que isto é algo que é bastante mais comum do que a indústria tecnológica poderia gostar de admitir.

Sem comentários:

Enviar um comentário (problemas a comentar?)