A Reddit montou uma armadilha para ver se os bots AI estavam a roubar dados, e diz ter apanhado a Perplexity em flagrante.
A Reddit apresentou um processo contra a Perplexity, acusando-a de roubar conteúdo do Reddit através dos resultados do Google, contornando sistemas de protecção criados por ambas as empresas. Segundo a queixa, a Perplexity terá conspirado com outras companhias para evitar os mecanismos anti-scraping e recolher dados, num esquema que a Reddit tenta equiparar a um "assalto a um banco digital".
Para comprovar o roubo, a Reddit criou uma armadilha digital, publicando conteúdo que só poderia ser acedido pelos bots da Google para integrar as páginas de resultados do Google. Horas depois, o mesmo texto apareceu nas respostas geradas pela Perplexity, o que, segundo a empresa, demonstra que o motor AI anexou esses mesmos os resultados de pesquisa. A queixa acusa a Perplexity e os seus parceiros de terem deliberadamente contornado uma tecnologia da Google chamada SearchGuard, responsável por bloquear acessos automatizados aos resultados. Entre os acusados estão as empresas Oxylabs (Lituânia), AWMProxy (ligada a antigos botnets russos) e SerpApi (EUA), todas especializadas em ferramentas de scraping. A Reddit afirma que estas companhias disfarçam os seus bots como utilizadores reais e utilizam redes de servidores para evitar bloqueios, tendo extraído quase três mil milhões de páginas de dados do Reddit num período de duas semanas. Todas as empresas acusadas negam as acusações, argumentando que o acesso a dados públicos faz parte da liberdade de expressão e é essencial para investigações e inovação.
A Perplexity rejeitou qualquer ilegalidade, contra-acusando a Reddit de tentar extorquir licenças de conteúdo e de usar o processo como forma de pressão nas negociações com a Google e a OpenAI. A empresa diz que o seu "answer engine" apenas resume discussões públicas e cita links, tal como qualquer motor de pesquisa, sem que esses dados sejam usados para o treino de modelos AI. A Reddit, por sua vez, diz que o caso ameaça os seus acordos de licenciamento de dados e prejudica a confiança dos utilizadores. A decisão promete reacender a discussão sobre se os dados publicamente acessíveis na web são realmente públicos.
2025/10/24
Reddit processa Perplexity por "roubo de dados"
Publicado por
Carlos Martins
às
21:00
AI Copyright Direitos de Autor Inteligência Artificial Perplexity Reddit
Subscrever:
Enviar feedback (Atom)


















Sem comentários:
Enviar um comentário (problemas a comentar?)