Ver post
  #1 (Link directo)  
08-may-2008, 14:09
Laucha Laucha no está en línea


Mi última entrada del Blog:
 
Posts: 2,880
Predeterminado Sampling - Teoría, posibililidades y limitaciones

Publicidad
Dejo un informe que hicimos junto a un compañero para la universidad, sobre el SAMPLING (aplicada a la historia de los sintetizadores y samplers).

Los temas desarrollados son:

*Principios del sonido digital
_ Introducción
_ Analogía con el cine y la imagen digital
_ Muestreo del sonido – frecuencia de muestreo
_ Muestreo con frecuencias inferiores – el aliasing
_ Velocidad de muestreo y cuantización
_ Rango dinámico
_ Calidad del sonido digitalizado
_ Conversiones A/D y D/A

*Aplicaciones
_ Grabación digital
_ Grabación digital basada en ordenador y disco duro
_ Los Samplers
_ Muestreo de instrumentos acústicos mediante el sampler

*Historia del Sampler

*Concluciones


Espero les sea útil




Principios del sonido digital


Introducción

Los aparatos electrónicos que generan o procesan el sonido operan siempre sobre una representación del mismo. En la actualidad los dos métodos mas comunes para dicha representación son : el analógico y el digital.
En un aparato digital, que es a lo que apuntaremos, el sonido se representa como una serie de números, llamadas muestras, que son las medidas de la onda sonora en instantes sucesivos. El principio fundamental del audio digital, entonces, consiste en discretizar las señales sonoras continuas (como por ejemplo, las emitidas por un micrófono) para convertirlas en secuencias de numeros. La discretización o muestreo (sampling) de estas señales se lleva a cabo en dos niveles diferentes, el temporal y el de la amplitud.
La siguiente figura nos muestra una señal continua, discretizada sólo en el tiempo (cuadros blancos) y en el tiempo y la amplitud (puntos negros). Cuanto menor sea la cuadrícula, mayor similitud existirá entre la señal original y la señal digitalizada:




Analogía con el cine y el video digital

Para aclarar algunos conceptos, haremos una analogía con el cine y el video digital. En ambos casos, existe una discretización temporal (incluso en el caso del cine que no es un medio digital). En el cine, la unidad de discretización temporal es el fotograma (24 fotogramas por segundo), mientras que en el video esta unidad se suele denominar con el término inglés Frame (dependiendo del sistema, este valor suele ser de 25 ó 30 frames por segundo). Esto correspondería en el audio, a la discretización temporal.
Pero en el caso del video digital se producen dos discretizaciones adicionales. La segunda convierte cada frame en una matriz de puntos (por ejemplo 800 x 600), y la tercera asigna un número (de entre un conjunto finito de valores) a cada punto de forma que cada uno de estos números corresponde a un color y un brillo determinado.
Es ovbio que cuantos más puntos apliquemos, y cuantos más números utilicemos para cada punto, mayor será la similitud entre la señal analógica original y la señal digitalizada. Si disponemos de pocos puntos, la imagen aparecerá cuadriculada, y si el número de valores posibles para cada punto es pequeño, perderemos matices en los colores y en los brillos. En las siguientes imágenes se muestran estos casos. Algo parecido ocurre con el sonido.




Muestreo del sonido – Frecuencia de muestreo

La palabra muestreo es el equivalente del término inglés sampling , y se utiliza para indicar la acción de tomar muestras de una señal a intervalos de tiempos regulares. Para digitalizar un sonido es necesario muestrearlo, pero a qué frecuencia?.Anteriormente comentábamos que para el caso de la imagen, la frecuencia de muestreo suele estar entre los 24 y los 30 frames por segundos. Con esta frecuencia se consigue engañar la retina del ojo haciéndole creer que lo que recibe no son imágenes discontinuas, sino un flujo continuo de luz, pero estos valores son totalmente insuficientes en el caso del sonido.
En el siguiente gráfico observaremos este fenómeno a través de una señal sinusoidal de 30Hz (se repite 30 veces por segundo) Lo que ocurre en este caso si se la muestrea a 20 Hz es que estaremos tomando el valor de la onda original cada 0,05 segundos. La nueva señal obtenida juntando los puntos muestreados tiene un período aparente de 0,1 segundos, es decir una frecuencia de 10Hz, lo cual no se corresponde en absoluto con la señal original.


Por lo tanto esta señal esta muestreada en forma incorrecta.
La frecuencia mínima de muestreo esta determinada por la teoría de Nyquist. El teorema del muestreo o teoría de Nyquist, afirma que para muestrear correctamente una señal de X frecuencia, se requiere como mínimo una frecuencia de muestreo de dos veces la frecuencia de la señal a muestrear (2X Hz).
En el ejemplo anterior, una frecuencia de 60Hz hubiese pues bastado para muestrear correctamente la señal original. Pero el oído humano es capaz de detectar frecuencias sonoras de hasta 20 KHz, por lo que, para muestrear correctamente cualquier sonido se necesitará una frecuencia de muestreo superior o igual a 40 KHz. De aquí proceden los famosos 44,1 KHz utilizados en los discos compactos, ya que el excedente de 4.1 Khz son para que la pendiente del filtro pasa bajos sea menos abrupta y no genere distorsión ni Aliasing, como veremos a continuación.



Muestreo con frecuencias inferiores – El aliasing

Si muestreamos a una frecuencia inferior, como por ejemplo a 30 KHz, los resultados que obtengamos podrán ser correctos para las frecuencias por debajo de los 15 KHz (la mitad de la frecuencia de muestreo). Para las aplicaciones que no precisen de la máxima fidelidad, esto es más que suficiente. El sonido será un poco menos brillante, pero se parecerá todavía bastante al original, pues la zona de frecuencia más acentuada suele estar entre los 1000 Hz y los 3000 Hz.
Existe, sin embargo un problema adicional. Tal como se vió en el ejemplo anterior, al muestrear con frecuencias inferiores, surgen frecuencias “fantasmas”que realmente no estan en el sonido original (como los 10 Hz que aparecían en el ejemplo) y que alteran el sonido muestreado. Este fenómeno recibe el nombre de Aliasing.

El aliasing “inventa” frecuencias de valores aproximados a la diferencia entre la frecuencia original y la frecuencia de muestreo. Para evitar este fenómeno, cuando se desee muestrear a frecuencias inferiores a 44.1 KHz, se debería filtrar previamente la señal entrante, eliminando todos sus valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20 KHz, deberíamos filtrar la señal original, eliminando todos sus componentes por encima de los 10KHz.
Para realizar lo dicho anteriormente, se hace pasar la señal, antes de ser digitalizada, por un filtro pasa-bajos con una frecuencia de corte igual a la mitad de la frecuencia de muestreo para atenuar las frecuencias más agudas que las de dicha frecuencia de corte.
Luego al convertir la señal digital a analógica es necesario también pasar dicha señal por otro filtro pasa-bajos de las mismas características que el anterior para suavizar la onda escalonada. Con este proceso se podría obtener una señal analógica idéntica a la de partida.
La siguiente figura nos muestra las etapas de la conversión analógica a digital y de la digital a analógica, la frecuencia de corte de los filtros pasa-bajos ha de ser inferior a la frecuencia de Nyquist ya que la transición de la zona de paso a la de atenuación no es repentina :


Si el corte de los agudos del filtro pasa-bajos a la salida del conversor D/A es demasiado repentino, se producirían desplazamientos de fase en las frecuencias agudas, lo que se percibe como distorsión en dicha región. Para evitarlo, se recurre al sobremuestreo que consiste en interpolar muestras en la señal y enviar esta nueva señal a más velocidad al conversor D/A. Por ejemplo, con una señal de 44,1KHz, si el dispositivo tiene 4 veces de sobremuestreo, la nueva velocidad será de 176,4KHz y la frecuencia de Nyquist se hace tan alta como 88,2KHz , con lo que la pendiente del filtro puede ser mucho más suave.


Velocidad de muestreo y cuantización.

Son dos conceptos importantes en las señales digitalizadas o sampleadas.
La velocidad de muestreo es la frecuencia (en Hertzios) con que se toman las muestras de la señal analógica. Intuitivamente se comprende que cuanto más grande sea, más se parecerá la señal digital a la original analógica.
La cuantización es la precisión con que se muestrea la señal, es decir la cantidad de “voltajes”intermedios que el conversor mide, lo cual, ya que las muestras se codifican como números binarios, depende del número de bits de cada muestra.
En el siguiente gráfico se puede apreciar cómo la cuantización con muestras de mayor número de bits es más exacta:


En definitiva, el conversor tiene que redondear la medida de la señal al valor más próximo, lo que da lugar a errores en más y en menos cuyo efecto es equivalente al de sumar a la señal original un ruido.
La cuantización en este caso es lineal, porque todos los intervalos son iguales. Otro sistema, menos empleado debido a su complejidad, es la cuantización en coma flotante, en el que los intervalos son logaritmos y a igual número de bits da mejor la relación señal ruido que el lineal. El formato de 32 bits en coma flotante es especialmente empleado en aplicaciones donde se realizan muchas operaciones numéricas para que los errores acumulados no se hagan audibles.


Rango dinámico

El rango dinámico se mide en decibeles y viene dado aproximadamente por la fórmula:


Rango dinámico (db) = 10 x log10 (amplitud máxima(al cuadrado) / amplitud mínima(al cuadrado))

Si en un sistema digital consideramos la amplitud máxima como 2 bits y la amplitud mínima como 1, tendremos que un sistema de conversión de 8 bits posee un rango dinámico de aproximadamente 48 db, mientras que en uno de 16 bits, el rango dinámico es de 96 db.
Dado que el umbral de dolor no se sitúa hasta alrededor de los 130 db, sería deseable que un sistema de alta fidelidad pudiese alcanzar este rango dinámico. Para ello serían necesarios unos 22 bits de resolución. Todos sabemos que no es éste el estándar que se ha adoptado, que ha quedado establecido en 16 bits. Por ello, todo sistema digital convencional posee un rango dinámico máximo de 96 db (valor teórico que en la práctica se ve disminuído por factores de circuitería).


Calidad de un sonido digitalizado

Estos valores de 44,1 KHz y 16 bits de resolución adoptados en el disco compacto y otros dispositivos digitales, son los que nos llevan a afirmar que el sonido digital de alta fidelidad no es todo lo bueno que podría ser, ya que ciertos equipos analógicos superan estas cotas. No se puede negar sin embargo que el sonido digital ofrece muchas ventajas, entre las que hay que destacar el menor desgaste y sobretodo, la posibilidad de realizar copias idéntica, es decir, sin ninguna pérdida. El formato digital permite además, tal como iremos viendo, muchas más posibilidades de manipulación y procesado.
Por otro lado, cuando no se necesite una calidad de alta fidelidad, se pueden utilizar especificaciones inferiores. En este sentido, una frecuencia de muestreo de 11.025 Hz y una resolución de 8 bits, ofrecen una calidad comparable a la de una línea telefónica convencional, por lo que serán suficientes para algunas aplicaciones de voz, donde lo que se busque sea la comprensión de un mensaje, al margen de preocupaciones estéticas.


Conversores A/D y D/A.

El sistema digitalizador de sonido se compone de un conversor analógico / digital en la entrada y un conversor digital /analógico a la salida. Ambos están controlados por un reloj digital que determina la frecuencia de muestreo. Para evitar el aliasing como dijimos anteriormente, se coloca en la entrada del conversor A/D un filtro pasa-bajos, que elimina de la señal analógica todos los componentes con frecuencias superiores a los 22 KHz. En el proceso de digitalización, el conversor A/D genera un número binario (de 8 a 16 bits) a cada pulso del reloj. Este número es almacenado en la memoria o grabado en un disco duro. Para la audición de esta señal digital, es necesaria la reconversión inversa, de forma que los números almacenados son enviados a un conversor D/A que los convierte en voltajes, a la misma frecuencia de reloj. Esta señal es suavizada mediante un nuevo filtro pasa-bajos, luego amplificada y enviada a los altavoces.


Aplicaciones :

Grabación digital.

La grabación digital se conoce también como PCM (pulse code modulation) o modulación de códigos de pulsos. Sus características principales son, como vimos, la velocidad de muestreo y la cuantización. La velocidad de muestreo determina el rango de frecuencias de la señal, siendo 44,1KHz y 48Khz sus valores más estándar: de la cuantización depende la relación señal / ruido. Con 16 bits se consiguen unos 96 db de relación señal-ruido, lo que supera a un buen grabador analógico. Cuando se intenta grabar una señal con amplitud excesiva, se produce una distorsion que en el mejor de los casos es un descrestamiento de la señal, en estos casos el conversor A/D se mantiene en el valor máximo y los picos de la onda son literalmente cortados , siendo una distorsión mas evidente que cuando se satura una grabación analógica.


Grabación Digital basada en ordenador y disco duro.

El almacenamiento de audio digital se puede hacer en memoria RAM que, al no depender de partes mecánicas móviles, proporciona una gran velocidad de transferencia de datos; los samplers , como veremos, utilizan este tipo de memoria. Pero la memoria RAM resultaría cara, ya que en una señal mono de 16 bits a 44,1KHz, cada minuto ocupa unos 5 MB, por lo que es preferible que el almacenamiento se haga en cinta o en disco duro. La ventaja del disco duro con respecto a la cinta es el acceso aleatorio. Se puede llegar en una fracción de segundo a cualquier punto de la grabación ya que sólo tiene que desplazarse la cabeza y no hay que “rebobinar”.
El concepto de pista es diferente que en los grabadores analógicos, y se parece más al de un secuenciador. Cada pista es una secuencia de música; por ejemplo, si la capacidad total del disco es de 120 minutos, el número de pistas puede ser variable. Podría grabarse una sola pista, o una de 30 y otra de 90 minutos, 6 de 20 minutos, etc.
Los datos son grabados o leídos en forma discontínua ya que cada pista suele repartirse en disversas zonas del disco y como se pierde tiempo en la búsqueda es necesario disponer de memorias buffer intermedias para acomodarse a la corriente contínua de muestras propia del audio.


Los Samplers.

Muchos consideran a los samplers como sintetizadores especiales, ya que de hecho incorporan algunas funciones de éstos; pero son aparatos que graban digitalmente el sonido en memoria RAM. Obviamente los samplers superan a los sintetizadores en la imitación de los timbres de los instrumentos acústicos, pero tampoco hay que despreciar su capacidad de creación de nuevos sonidos manipulando los grabados.
La memoria suele ser de varios MB, pudiéndose grabar en ella uno o varios sonidos cortos, llamados muestras, término que es algo confuso, ya que como se sabe, se da el mismo nombre a cada número de la señal digital.
Para conseguir más capacidad algunos samplers emplean cuantización de 8 ó 12 bits, que no da una relación señal/ruido demasiado buena, por lo que incorporan compresores-expansores que comprimen la señal en grabación y la expanden al reproducirla, método parecido al de los reductores de ruido empleado en la grabación analógica. Otra posibilidad es el muestreo exponencial (o en coma flotante), pudiéndose igualar en relación señal ruido un sampler exponencial a 12 bits con otro lineal a 16 bits. No obstante, ya que los chips de memoria son cada vez mas baratos, la tendencia es a utilizar resolución lineal de 16 bits o más bits.
Con respecto al rango de frecuencias, los samplers suelen permitir el muestreo en distintas velocidades; de este modo se puede ahorrar memoria muestreando a baja velocidad las señales que tengan poco contenido en parciales agudos. Por ejemplo, si se emplean 22,05KHz., se pierde la octava más aguda, pero la muestra ocupa la mitad.


Muestreos de instrumentos acústicos mediante el sampler.

Los sampler son también capaces de tocar las muestras de instrumentos acústicos grabados transportándolas varias octavas hacia el agudo o hacia el grave, de este modo, se puede por ejemplo muestrear un DO central de un piano y obtener, en principio toda la escala del teclado mediante la transposición de esa muestra.
La transposición puede realizarse mediante dos métodos. Uno de ellos es variando la velocidad de lectura de las muestras; si es alta, sonará mas agudo y durará menos, y si es lenta ocurre lo contrario. En este último caso , puede ocurrir que parciales o frecuencias indeseadas muy agudas, poco evidentes en la muestra original, al bajar la frecuencia se noten claramente, lo cual hace que la transposición descendente esté mas limitada. El segundo método, el más empleado, consiste en mantener la velocidad de lectura fija y para realizar la transposición un programa se encarga de calcular la nueva muestra en tiempo real.


Historia del Sampler

Hablar de historia de los samplers digitales es hablar de unos treinta años nada más. En los primeros setenta se empezaron a desarrollar las primeras máquinas para capturar sonidos. Máquinas basadas en rudimentarios ordenadores adaptados para trabajar con señales de audio.

Fairlight

Para empezar un nombre mítico: Fairlight. Este fue el nombre que eligieron Kim Ryrie y Peter Vogel a finales del año 1975 para su proyecto. Desde la ciudad de Sydney, estos dos amigos de la escuela se aliaron para crear un instrumento electrónico. La idea inicial fue la construir un sintetizador que pudiera reproducir sonidos naturales. El proyecto evolucionó hasta basar su diseño en un procesador Motorola de 8 bits (el 6800) en lugar de osciladores convencionales. Otra
idea revolucionaria fue la de adaptar un monitor de ordenador como interface gráfico en el que poder reflejar los pasos de envolvente de los sonidos. Después de diseñar sus propios convertidores, incorporar RAM en bloques de 16Kbytes y diseñar una placa lógica para cada voz de polifonía (8 voces en el primer modelo) salió al mercado el Fairlight CMI en 1979. Su precio por aquel entonces era de 25.000 dólares. Por cierto, la primera serie no tenía MIDI y se fabricaron unas 100 unidades.
La evolución lógica llevó a las series II y III, incorporando procesadores más potentes (Motorola 68000), funciones MIDI, mejoras en la polifonía (16 voces) y un aumento de resolución hasta los 16 bits.
Fieles usuarios del Fairlight en cualquiera de sus reencarnaciones han sido Peter Gabriel, Thomas Dolby, Jan Hammer, etc. En 1988 Fairlight desapareció como empresa, sufriendo una serie de cambios hasta llegar a nuestros días, donde todavía fabrican sistemas de audio digital y aún se puede adquirir un Fairlight Series II completo por unos 70.000 dólares.



Synclavier

A finales de los setenta y primeros ochenta, los dos nombres que más sonaban en el mundo de los instrumentos electrónicos eran Fairlight y el eterno rival: Synclavier. Corría el año 1977 cuando Sydney Alonso y Cameron Jones se propusieron investigar con el ordenador de la universidad y convertirlo en un potente sintetizador de FM. Las cosas se complicaron hasta desarrollar un sistema con su propio teclado y monitor. En 1984 y con la ayuda de Sequential Circuits (en esta
ocasión les prestaron el mecanismo de teclado de un sintetizador legendario: el Prophet-T8), New England Digital sacó al mercado del Synclavier. El concepto del Synclavier fue reunir en una sola máquina los procesos de producción musical, síntesis, muestreo, secuenciación y post-producción de cine y vídeo. Las especificaciones del Synclavier son un tanto relativas, puesto que de unidad en unidad se iban mejorando aspectos y prestaciones. Si tomamos como referencia los modelos más avanzados de los primeros años noventa, podemos decir que tenía 64 voces de polifonía, 32 megabytes de RAM y un secuenciador de 200 pistas. Hasta entonces, el Synclavier siempre fue un sistema de muestreo monofónico, cuando samplers mucho más baratos ya ofrecían posibilidades estéreo. Donde mejores aplicaciones encontró fue en la industria del cine, donde se estableció como un sistema de referencia. Antes de desaparecer en 1993, New England Digital se adentró en el excitante mundo de la grabación a disco duro, acuñando el término “direct-to-disk” como trademark. Una máquina tan peculiar ha tenido usuarios no menos peculiares como Sting o el mismo Frank Zappa, cuyo disco “Jazz From Hell” está compuesto, grabado y producido íntegramente en un Synclavier.


Emulator

La tercera parada en la corta historia de los samplers tiene lugar en la afamada costa oeste americana, exactamente al norte de California. Dave Rossum fundó Emu Systems en 1972. Su interés principal fue el de construir sintetizadores modulares de gran calidad. Por aquella época Sequential Circuits tenía ya un cierto renombre dentro del gremio de los músicos. Rossum recibió ayuda de Sequential en el aspecto técnico y financiero hasta llegar a noviembre de 1980, fecha en la que Rossum construyó su primer prototipo de Emulator. La idea de Rossum era la de construir un instrumento de funciones similares a las del Fairlight pero con un coste mucho menor y usando un esquema de memoria más práctico que el de Fairlight. El primer prototipo tenía 128Kbytes de memoria (una cantidad considerable para la época) y una resolución de 8 bits. Las funciones de edición se limitaban a modificar el punto de comienzo y final de la muestra y cada muestra tenía una duración fija de 2 segundos. La suerte visitó a Dave Rossum en su primera feria como expositor, ya que Stevie Wonder probó el primer Emulator y quedó tan impresionado que encargó
el primero que se fabricara, con el número de serie #001 (actualmente en poder de Stevie Wonder). El nombre “Emulator” se le ocurrió a uno de los técnicos de Emu cuando decidieron cambiar el nombre de “Sampler” (muestreador) por algo más imaginativo, pues el nombre de la compañía, E-mu, se acordó mucho antes. La saga de los Emulator llegó hasta el Emulator III, un sampler con muchas de las características técnicas de los samplers más avanzados de hoy. El Emulator II supuso uno de los mayores éxitos de ventas de aquellos años, llegándose a construir unas 500 unidades. Entre los nombres que han usado intensamente los Emulator se encuentran The Residents (que tienen el número de serie #005), Depeche Mode, Kraftwerk, etc... Ya a finales de los ochenta, el mundo de los samplers sufre una mutación importante.



AKAI S1000

Compañías americanas y japonesas se hacen con el Ensoniq y su Mirage (el espejismo) con secuenciador incorporado, Akai con suS612, sampler MIDI con unidad de discos de 2.8 pulgadas en formato rack, Oberheim y el revolucionario lector “universal” de muestras DPX1, Casio y el FZ-1,el primer sampler de 16 bits según la publicidad de la época. Yamaha con el enrevesado y carismático TX16W... Así una larga lista donde sería difícil no olvidar a alguien. Los noventa han traído la mutación y la simbiosis al mundo de los samplers. Se empieza a estrechar la diferencia entre los samplers “de verdad” y los sistemas basados en ordenadores personales. Los pioneros en este campo han sido los ingenieros de Digidesign que se anticiparon con su tarjeta sampler SampleCell para Macintosh. A partir de ese banderazo de salida, muchas compañías de software han desarrollado samplers con todas las prestaciones contenidos en un paquete de software (detalle importante: estamos hablando de programadores de software cuando hace unos párrafos y unos cuantos años hablábamos de ingenieros y estudiantes de electrónica).




El powerpoint de la presentación:
Archivos adjuntos
Tipo de archivo: ppt SAMPLING.ppt (767.0 KB, 5 vistas)
Citar y responder