2017/05/06

O perigo da estatística e dos gráficos


A estatística é uma preciosa aliada no tratamento de dados, mas há que estar informado quanto às suas limitações... que por vezes podem resultar em dados bastante enganadores.

Quando se quer analisar um conjunto de dados, é frequente recorrermos a coisas como a média, desvio padrão, mediana, etc. São funções que nos dão valores quantitativos bastante úteis, mas que em determinadas situações também revelam as suas limitações e mostram a importância da representação gráfica.


O quarteto de Anscombe é um dos exemplos perfeitos que demonstra isto, com um conjunto de dados completamente diferente mas que resultam no mesmo resultado para a média, desvio padrão e correlação.

E agora, temos um novo exemplo que será ainda mais impressionante destes perigos das funções estatísticas, que mostra este mesmo efeito para um conjunto ainda mais alargado de padrões bem diferenciados... e no qual até se inclui um dinossauro:


Para todas estas imagens, que incluem linhas paralelas, círculos, estrelas, donuts e outros, todos os valores estatísticos para a média, desvio padrão e correlação continuam a ser idênticos até à segunda casa decimal.

Estes mesmos riscos também se podem aplicar de forma inversa, quando temos dados que em determinadas representações gráficas não nos permitem ter a ideia adequada do que lhes deu origem; como poderão ver no vídeo que se segue.

1 comentário: