Processamento do Som

por: Projeto Ciência Viva
(Ministério da Ciência e da Tecnologia – Portugal)

Quando se fala em processamento, fala-se de cálculos. Para se fazerem cálculos, é necessário quantificar grandezas. Quando se processa o som, a grandeza essencial a medir é a variação da intensidade do som, ao longo do tempo. A unidade de medida da intensidade do som (nível de pressão acústica) mais utilizada é o decibel (dB). Para se ter uma idéia de quais os valores das intensidades sonoras, em decibéis, de certas situações familiares a que estamos expostos no nosso dia-a-dia, atente-se na seguinte tabela:

Intensidade 10-20 dB (SPL) 40-45 dB (SPL) 60-65 dB (SPL) 85-90 dB (SPL) 100-120 dB (SPL) 120-130 dB (SPL) 140-… dB (SPL)
Cenário típico espaço aberto sossegado conversa em espaço aberto ruído de tráfego citadino ruído de maquinaria pesada escavadoras de pressão concerto rock ao vivo disparo de uma arma de fogo ou dinamite

De notar que estes dados são meramente indicativos, por forma a que tenhamos idéia nos níveis de intensidade a que expomos os nossos ouvidos em certas situações, de uma forma aproximada.

1. Áudio analógico

Neste sub-tópico vão ser apresentados os princípios base presentes nos dispositivos analógicos de áudio mais comuns.

Um microfone é um dispositivo transdutor na medida em que converte uma forma física de energia, numa outra forma, concretamente, uma variação de pressão acústica correspondente ao som, numa variação correspondente de tensão elétrica (ou potencial elétrico). A um valor alto de pressão acústica corresponderá um valor alto de tensão elétrica no cabo do microfone e vice-versa. Sendo representado por um sinal elétrico, o som é facilmente processado por um sistema eletrônico analógico como por exemplo um amplificador de alta fidelidade, ou por um sistema digital como exemplo um digitalizador e gravador de CDs.

Figura 1 – O microfone, ao captar o som, traduz as variações de pressão acústica (dB) na sua entrada em variações de tensão elétrica (Volts)no seu cabo.

Como o sinal elétrico à saída do microfone é de muito baixa amplitude, é muitas vezes necessário amplificá-lo por forma a elevar a tensão elétrica. Para isso usa-se um amplificador. Um amplificador típico é caracterizado por algumas imperfeições funcionais, sobretudo não-linearidades, que degradam a forma de onda do sinal. Contudo, o nível de degradação é tão mais baixo quanto maior for a qualidade do amplificador, podendo ser imperceptível se o amplificador for de boa qualidade.

O alto-falante é, à semelhança do que acontece com o microfone, um dispositivo transdutor. Só que neste caso o processo é o inverso: na entrada do alto-falante apresenta-se uma variação de tensão elétrica que ele vai tratar de converter para variações de pressão acústica na sua saída.

Figura 2 – O alto-falante traduz as variações de tensão elétrica (Volts) no seu cabo em variações de pressão (dB) na saída. É um dispositivo que reproduz som.

Há basicamente duas maneiras de efetuar uma gravação analógica: ou por registro magnético em fita magnética ou por enrugamento da superfície de um disco (caso do vinil). No caso da fita magnética (cassete), o som é armazenado de uma forma contínua sob a forma de variações de magnetismo na própria fita. No caso de um disco de vinil, por exemplo, a sua superfície é “escavada”, de modo a refletir a variação de amplitude do som que está a ser gravado em relevo na própria superfície de vinil. À medida que forem envelhecendo, bem como à medida que forem mais vezes utilizadas, as gravações efetuadas sob estes formatos tendem a perder qualidade.

2. Áudio digital

Em áudio digital, a forma de onda de som é repartida em amostras individuais, regularmente espaçadas no tempo, constituindo uma aproximação à forma de onda original. Este processo é o que se chama de conversão analógico-digital, ou também de amostragem.

Figura 3 – O processo de amostragem ou conversão analógico-digital.

Por taxa de amostragem ou freqüência de amostragem entende-se o número de amostras retiradas da forma de onda original, por segundo. Quanto mais elevada for a taxa de amostragem, melhor será a aproximação à onda original.

Figura 4 – O erro de aproximação diminui à medida que taxa de amostragem aumenta. A onda de baixo é amostrada a uma taxa que é o dobro da da onda de cima.

A taxa de amostragem limita a gama de freqüências que o sinal a amostrar pode conter, sendo que o limite máximo para essa gama é metade do valor da taxa de amostragem. Este valor provém de um teorema muito conhecido na gíria do áudio: o Teorema de Nyquist. Portanto, para um sinal com freqüências até 8000 Hertz, é necessário que a taxa de amostragem seja maior ou igual a 16000 Hertz. Por exemplo, nos sistemas baseados em Compact Disc Audio (CD), a taxa de amostragem é de 44100 Hertz (44100 amostras por segundo), visto que a freqüência máxima que um ouvido humano pode captar é de cerca de 20000 Hertz.

O som é representado então por uma seqüência de amostras, regularmente espaçadas no tempo. Essas amostras são representadas numericamente, em formato digital. Este formato consiste num código, chamado código binário, em que os números são representados sob a forma de uma seqüência de bits. Um bit pode apenas apresentar o valor ‘0’ ou o valor ‘1’, retratando dois estados possíveis: ligado (‘on’) ou desligado (‘off’). Portanto, se usarmos apenas um bit, apenas temos a capacidade de exprimir dois números. Se acrescentarmos mais um bit, o número de combinações possíveis duplica: ’00’, ’01’, ’10’ ou ’11’, o que significa que já podemos exprimir 2×2= quatro números.

O número de bits usados para representação determina a precisão (ou resolução) em amplitude do processo de amostragem referido atrás. Quanto mais bits forem usados, maior será essa resolução. Para obtermos uma resolução equivalente à de um sistema CD de áudio, são necessários 16 bits, o que significa que temos 65536 combinações numéricas possíveis. Os valores de amplitude amostrados são sempre arredondados para o código binário mais próximo.

Figura 5 – No processo de amostragem, o valor da amostra é arredondado para o código binário disponível mais próximo. Ilustração com um escala de 3 bits (8 valores possíveis). Se se aumentar o número de bits, a resolução aumenta e o erro causado pelo arredondamento diminui.

O processo de reprodução é o inverso: as amostras são postas em seqüência, à entrada de um outro dispositivo, um conversor digital-analógico, que vai tratar de reconstruir o sinal analógico, pronto para ser enviado para um alto-falante, por exemplo. Como se pode ver, há sempre qualquer coisa de natureza analógica quando se toma contacto com um sistema, qualquer que seja ele.

A gravação digital é efetuada armazenando os valores das amostras, bit a bit, em seqüência ordenada. Por exemplo, no caso da gravação em CD, cada bit é inscrito numa superfície refletora de luz, alterando a característica de reflexão nesse ponto de maneira diferente, conforme se trate de um bit ‘1’ ou ‘0’. Se a superfície do CD se mantiver em condições aceitáveis, qualquer leitor de CDs terá pouca dificuldade em reconhecer um bit como ‘0’ ou ‘1’. Assim, uma gravação feita neste formato pode durar “uma vida”. Há porém um tipo de registro digital que é realizado em suporte magnético (como no caso dos discos rígidos nos computadores).

As placas de aquisição/reprodução de som presentes nos computadores (mais conhecidas como placas de som) servem como meio intermediário entre os computadores e o exterior. Elas são capazes de fazer a conversão analógico-digital do sinal elétrico proveniente de um microfone, por exemplo, bem como a conversão digital-analógica. As taxas de amostragem e número de bits que a placa usa para aquisição não são fixos e podem ser programáveis.

Quando usamos um programa de computador que faz a aquisição de som através da placa de som, ele “diz-lhe” qual a taxa de amostragem e número de bits que deve usar para essa aquisição. As amostras de som serão recebidas seqüencialmente pelo programa, submetendo-as ao processamento desejado. Quando um programa de computador faz a reprodução de som, a placa de som é informada (pelo programa) da resolução em amplitude (número de bits) e do número de amostras por segundo com que a conversão digital-analógica deve ser realizada, antes do som ser reproduzido. Os dados serão enviados seqüencialmente, e a placa de som tratará do resto.


Fonte: http://telecom.inescn.pt/research/audio/cienciaviva/processamento_som.htm