sábado, 29 de junho de 2013

7 - A questão dos sons guardados nas mídias disco de vinil e disco digital (CD)


Os sulcos cortados pelo estilete no vinil apresentam-se como diversas formas de ondulados, uns mais profundos, outros mais rasos, ondulações mais suaves e mais extensas e por aí vai. Poderemos dizer que estes são os "dados" armazenados no vinil. A agulha do toca-discos em contato com estas diversas ondulações, é obrigada a produzir um movimento que é transmitido para uma pequena bobina no interior da cápsula fonocaptora, que se movimenta em relação a um ímã, (Que pode ser natural ou elétrico) e isso produz energia elétrica. Ou seja, a voz do cantor e os instrumentos musicais produzem ondas numa direção e sentido, que captadas pelo microfone são transformadas em ondas elétricas com a mesma direção e sentido, que por sua vez são transmitidas ao braço do estilete de corte com a mesma direção e sentido, produzindo no vinil, ondulações também com a mesma direção e sentido, que por sua vez também geram na agulha dos toca-discos ondas elétricas com a mesma direção e sentido e que por sua vez, finalmente, passam pelo amplificador com mesma direção e sentido chegando os alto-falantes, aí, já transformada em onda mecânica, exatamente na mesma direção e sentido. Ou seja, há um mínimo de alteração possível na transmissão de dados em forma de eletricidade até a sua a reconversão em energia mecânica. É importante se observar que em nenhum momento a agulha do toca-discos deixa de ter contato com os sulcos (e o aparelho estiver corretamente regulado), que são a fonte de dados, garantindo assim uma informação contínua e fiel ao original. No CD, vindo os dados de uma mídia analógica, como uma fita de rolo ou um disco digital de super-áudio, os dados sonoros não são na sua íntegra, na sua totalidade, inseridos no CD. Porque? Por que se todos os dados tivessem que ir parar dentro do CD, do conteúdo total a ser gravado, só caberiam seis minutos de música! (Pode até caber menos, dependendo do aumento da taxa de amostragem, pois a amostragem-padrão para "wav" não é fixa e pode ser maior, apesar do CD comercial, ou CD-A, ou CD-Worm (Worm é uma sigla que significa "Write Once Ready Many) ter um padrão fixo de 44.100 amostragens por segundo). Isso porque o espectro sonoro gerado na ocasião de uma música repleta de vozes e instrumentos é imenso, incluindo-se aí, além dos tons e semi-tons (Os harmônicos e os infinitos sub-harmônicos que podem ser gerados principalmente pelos instrumentos que possuem a escala não temperada como os violinos, violoncelos). E isso sem falar dos formantes dos instrumentos, que são características sonoras (Timbre pessoal de cada instrumento, pois nenhum instrumento soa igual ao outro). Leva indiscutível vantagem aí o Vinil posto que seu sulco comporta-se como uma amostragem infinita, numa comparação com o CD ou qualquer meio digitalizado de áudio. Como você vê, na explicação acima, a gama sonora é imensa e não podem conter em um CD toda essa gama sonora! E especialmente, no caso dos formantes, não há a possibilidade de contê-los na sua integralidade, pois é fato cientificamente provado posto que já foi tentado em experiência a reprodução de formantes digitalmente e isso não foi possível a contento (Fato real, conhecido e notório no meio acadêmico). Matematicamente, poderemos dar um exemplo: Peguemos um programa, um software comum de gravação como (O Audacity) para usarmos como gravador nesta experiência. Este software deverá gravar os dados num arquivo com extensão ".wav", que é um formato dito "sem compressão", que supostamente não "economiza" de maneira alguma na hora da captura de dados. Grave sua voz, com a taxa máxima de amostragem e tamanho de quantização que seu equipamento permite, falando um pequeno texto, por 3 minutos exatos. Depois verifique o tamanho do arquivo: Você perceberá que o arquivo ficou com muitos megabytes! Vamos exemplificar em 30 MB: De que tamanho ficaria cada música, se cada uma tivesse apenas 3 (Três) minutos? Cada uma ficaria com 720 "megas" de tamanho, ou seja, um CD só comportaria uma música! E os CD's em média possuem mais de 15 músicas. Então qual é o milagre? O milagre é a minimalização (Que na realidade deveria ser 'rarefação', "fatiamento" da onda elétrica original). De cada onda sonora de cada instrumento e cada voz são retirados "amostras" ("Samples", 'exemplos', em inglês) e é só isso que vai para dentro do CD. É como se eu pegasse uma tela gigante com todas as suas cores e estampas, e na impossibilidade de guardá-la toda em um caminhão para transporte, resolvesse "fatiá-la" retirando-lhe vários pedaços para que ela pudesse caber no caminhão e, no local de destino, colasse todas as fatias, colocando no lugar das que foram retiradas algo semelhante ao estava no lugar delas, para que pudessem recompor a tela inteira. Ou seja, as partes faltantes seriam recompostas por aproximação (Interpolação) no aparelho tocador (Ou player, como preferir), no ato de ouvir. Pois é: Assim que funciona a gravação digital: Interpolação passiva e ativa. Os dados capturados do "master" são retidos em parte para serem gravados no CD em forma de seqüências binárias de 0 e 1, mas somente 'exemplos', ou seja, amostragens de cada trecho da onda sonora em toda sua extensão. É como se você pinçasse em uma extensão de onda em várias partes dela em um intervalo de 10 em 10 cm. A isso se chama amostragem. Quanto menores os intervalos, maior a amostragem. Evidente que eu usei a medida em centímetros para tornar mais compreensível o exemplo. O CD-WORM (Write Once; Ready Many) quando surgiu tinha seqüências binárias de 16 bits em 44.100 amostragens por segundo, o que dá 22.050 hertz. A sigla kHz acompanhada do numeral 44.100 (Ex.: 44.100 Hz) é inadequada, pois fere o princípio de Shannon-Nyquist. O Termo correto é "amostras por segundo (Ou a.s) e seguida do verdadeiro alcance de freqüências de um CD-A, que é de 20.050 Hz. Hoje, um CD de qualidade é gravado em 44.100 amostras por segundo em "palavras" de 16 bits, em sistema PCM, que gera um espectro de freqüências que vai qualitativamente até 20.050 hertz, com ruído de dithering tratado, o que significa ruído distribuío aleatoriamente, como se faz em imagem. (Veja mais abaixo sobre quantização, dithering ou dither, e erro de clipping, no item 19 deste blog). Já os SACD operam em outra técnica que permitem 28.224 Mhz em 1 bit (É o "Highest-grade", o DSD format - DIRECT STREAM DIGITAL de 2.8224 [MHz]), mas que na prática não ultrapassa muito os 192 a.s (O leigo Khz) do outro sistema, mas precisam de um CODEC para serem lidos, não são lidos diretamente como um CD-A. Já há o CD híbrido, composto de CD + SACD, também com a segunda camada (Layer reflective) em DSD. (A Pauler Acoustics, estúdio Alemão da empresa Stcock Fish Records, o produz). Já temos "players" com chips de 24 bits por canal tocando a essas mesmas 192.000 a/s ("kHz") (Mas os equipamentos para ler o SACD devem ser apropriados para a leitura desta mídia, sob pena de não oferecerem os prometidos benefícios). Mas voltando ao assunto, poderemos notar o tamanho que ficaria um LP dentro de um CD se nenhum dado fosse economizado: Partindo do exemplo dos três minutos para cada música, um bom LP, que só comporta dezoito minutos de música de cada lado, em média, ficaria com seis músicas, porque 18 : 3 = 6. Fazendo a conta: 6 X 720 = 4.320. Isso mesmo, 4,3 gigabytes! Só de um lado. Os dois então teriam a astronômica quantia de 8.640 gigabytes, ou seja, um LP, se convertido para dados binários, teria 8,6 gibabytes de tamanho. E isso comercialmente seria inviável. Mas como recompõem-se os dados que faltam, por amostragem, já que o CD não traz tudo, sendo apenas um arquivo de dados impressos fisicamente tal qual uma fita perfurada? É o próprio conversor do "CD player". Ele coloca ali o que falta para que você escutar a música, límpida, maravilhosa, sem ruído nenhum, através de um processo que ocorre na conversão dos dados para sinal analógico (Na imensa maioria das vezes, aplicando técnicas de "interpolação", que certamente não é o mesmo sinal da música do evento inicial). É lógico que isso é quase (Eu disse quase!) imperceptível para ouvidos menos treinados. E não é a mesma música assim como não seria a mesma tela, no caso do exemplo do caminhão. E isso aparece de diversas formas, porque aí quem está encarregado de perceber isso não é mais uma máquina e sim o ser humano, que descreve o que sente com subjetividade, mas que não é nenhuma loucura: Muitos falam que falta "calor" na música, eu, particularmente, percebo que a duração dos graves no vinil é maior e eles são mais intensos, pois já fiz o teste (Lógico, fazendo-se a comparação no mesmo lugar e com o mesmo equipamento, sendo colocado para tocar a mesma música gravada tanto no LP quanto no CD, naturalmente, industrial, bem masterizado. Outros falam que falta-lhe a "textura" e enfim, há várias percepções por aí a fora, para quem tem bom ouvido e bons equipamentos. Finalmente, é importante acrescentar que existem diversos tipos de DAC (De "digital audio converter" - Conversores de sinal analógico para digital). Alguns armazenam blocos de bits antes de serem processados, para que se possa efetuar alguma eventual "correção" de leitura. Outros, processam os bits diretamente (1 bit por vez) e aí é que entra a tecnologia secreta de cada fabricante: Cada um opta por um caminho, uma lógica, um algoritmo e por aí vai. De um modo geral, por canal, o som digital é mais fácil de ser compreendido como um plano cartesiano X,Y, onde há uma matriz de pontos representada por uma linha horizontal, que é a do tempo (Taxa de amostragem por segundo. Exemplo: 44.100 amostras por segundo – a.s) e a vertical, que é a dos valores da quantização (Representada em número de bits por quantização exemplo: 16 bits). Assim, sem falar em compressão de dados (MPEG, ATRAC, etc.), que é um processo intermediário entre a mídia e o sinal armazenado no buffer de saída para o DAC, o número de bits por quantização versus o número de amostras por segundo é igual ao número de bits por segundo que o "coitado" do DAC terá de ser capaz de processar. Exemplo trivial: (CD-A): 16 bits X 44.100 = 705.600 bits/seg. ou 705,6 kilobits/seg ou 705,6 kb/seg ou ainda 705,6 kbps por canal. Multiplicando-se isso por 2 canais (No caso do CD-A), teremos 1.411.200 ou 1,4112 Mbps que é a taxa final sem compressão (MPEG, ATRAC, etc.). Atente-se que “bit” é representado com "b" minúsculo. Já Byte, que é hoje é chamada tecnicamente “palavra” (Denominação antiga – Setor) de 8 bits, escreve-se  com "B" maiúsulo. Muitos iniciados confundem, o que é normal no início da familiarização com a ciência da informática.