2015/02/21

The Ghost in the MP3 mostra-nos o que se perde na compressão para MP3


A maioria das pessoas estará consciente que ao gravar uma foto como JPEG, o seu tamanho reduzido é conseguido à custa da redução da qualidade da imagem; agora, temos um curioso projecto que chama a atenção para os sons que se perdem quando se converte uma música para MP3.

Este The Ghost in the MP3 leva-nos pelos meandros da compressão usada pelos MP3 para reduzir o tamanho das músicas, culminando com um trabalho feito apenas à custa dos sons desaparecidos (e também da informação visual, com a compressão de vídeo).

Lá podemos encontrar diagramas e excertos sonoros que nos mostram o efeito da compressão "psico-acústica" usada pelo MP3, e que tenta eliminar as frequências que seriam praticamente inaudíveis (como sons mais subtis "abafados" pela presença de outro som mais volumoso) mas que inevitavelmente afectam a qualidade do som em maior ou menor grau.



Importa também referir que o MP3 foi criado numa era em que as prioridades eram outras, sendo dado principal destaque à facilidade de descompressão (essencial para as capacidade dos CPUs da época). Aliás, ainda me lembro de deixar o computador a "mastigar" durante longas dezenas de minutos, ao fazer a conversão dos meus CDs para MP3... coisa que hoje em dia parecerá completamente pré-histórica...


Audível ou não, aqui fica o "fantasma" do que se perde com uma conversão para MP3 da música Tom's Dinner da Susanne Vega.





1 comentário:

  1. compressão de audio/vídeo 101: São transformadas de fourier e discretas do co-seno. :)
    Em linguagem de leigo, são operações matemáticas numa amostra do sinal (álgebra matricial) com/sem trigonometria que, dito de forma simples, geram uma nova matriz só com a informação mais relevante (sinais + "fortes"/+ "energia", do ponto de vista do ouvido ou visões humanas. Os sons mais fortes do que falas). A matrizes resultantes quando descodificadas são idênticas à imagem/som original com um erro (a perda de sinais menos relevantes) associado (a tua imagem "lost").
    Estas abordagens são validas quer não só para mp3, como para jpegs e mpegs, com ligeiras modificações (em mpegs o algoritmo tenta prever o movimento entre frames).
    É tambem usada em muitos outros campos de DSP, como por exemplo o projecto SETI, para analisar as amostras de sinais de radio, encontrar os sinais mais fortes (potenciais sinais extraterrestes de radio emitidos por estrelas ou aliens :) ) e comprimir os resultados para posterior analise.

    ResponderEliminar