Descomplicómetro – Compressão de dados - PCGuia

Descomplicómetro – Compressão de dados

A compressão de dados é um daqueles processos que toda a gente sabe que funciona, mas ninguém sabe... como funciona.

Se a Gillette é sinónimo de lâmina de barbear, ZIP é sinónimo de compressão de dados. Mas isto não invalida todas as restantes soluções de compressão que existem no mercado, especialmente tendo em conta que todas elas partilham algo em comum entre si, a impressionante capacidade de garantir que um ficheiro com um determinado tamanho consiga ficar significativamente mais pequeno, por mera magia. É, porém, essa “magia” que lhe queremos revelar. Este procedimento tornou-se tão popular que já vem incluído, de forma nativa, nos principais sistemas operativos do mercado:Windows e Mac OS.

Algoritmos

Decerto já terá ouvido falar na palavra ‘algoritmos’. Para muitos, o desenvolvimento de um algoritmo poderá valer uma fortuna, se o mesmo conseguir funcionar conforme foi proposto, ou criado. No caso da compressão de dados, este algoritmo pega em pequenos dados, indexando-os, para eliminar repetições, tornando assim os ficheiros mais pequenos. Imagine um texto que diz: «Os leitores gostam da PCGuia. A PCGuia gosta dos leitores». Esta frase é constituída por dez palavras, sendo algumas delas repetidas. Utilizando um algoritmo de compressão, as palavras seriam indexadas, eliminando, assim, as repetidas.

O facto de terem sido indexadas permitiria recuperar as palavras eliminadas, para que não se perdessem quando fossem descomprimidas.
Ou seja, se atribuirmos um número às palavras, a frase acabaria por ficar 1 2 3 4 5 6 5 7 8 2. O 5 e o 2 apacerem duas vezes, pois representaram as palavras repetidas ‘PCGuia e ‘leitores’. Como deve imaginar, um número é significativamente mais pequeno que uma palavra, razão pela qual a indexação é fundamental para que as palavras não se percam durante o processo de conversão e compactação.
Se cada palavra, espaço ou pontuação corresponderem a uma unidade, a frase original dispõe de 57 unidades, enquanto a frase indexada corresponde apenas a vinte, embora seja necessária a indexação para a recuperação sem perda da informação inicial.

Multimédia

No que toca a conteúdos multimédia, a situação é parecida, embora a abordagem seja diferente, uma vez que existe perda de dados. No caso das imagens, por exemplo, o algoritmo de compressão elimina informações que considera irrelevantes, como diversas tonalidades de cores, idênticas a outras já existentes, como o azul do céu. Aqui, a maioria dos pixéis com diversas referências de cor azul passa a usar a mesma referência, sem influenciar demasiado o resultado final. Isto acontece também com os vídeos, embora o resultado seja menos notório, já que cada fotograma só está visível durante um curto período, como 1/25 a 1/50 de segundo (nos casos de 25 e 50fps).

Já no caso do áudio, a situação é igual, sendo eliminadas partes do espectro sonoro que habitualmente não são captadas pelo ouvido humano. Esta solução, aplicada em formatos como o MP3 (embora implique ligeiras perdas na qualidade do som), permite reduzir a dimensão do ficheiro original para um décimo, algo que podemos considerar como uma solução mais que justa.

Categorias
Descomplicómetro

Editor da revista PCGuia, com mais de 10 anos no mercado de publicações tecnológicas. Grande adepto de tudo o que seja tecnológico, ficção científica e quatro rodas.
Assinaturas

ARTIGOS RELACIONADOS