Tratamiento digital de la voz: primeros pasos

Tal y como dijimos en Volvemos, aquí llega una publicación para explicar temática relacionada con el tratamiento digital de la voz. Partiremos de conceptos básicos como pueden ser el pitch, amplitud de una señal, etc. Por supuesto, llegará poco a poco 😉

Como no podía ser de otra forma, tendremos que hablar acerca de herramientas que utilizaremos para manejar las señales o programar diferentes funciones. Es el momento de presentar un potentísimo programa de… de todo realmente! Es MatLab. Es un entorno de desarrollo que utiliza su propio lenguaje de programación junto a diferentes toolkits, que no son más que conjuntos de herramientas muy variadas; hay desde toolkits financieras a otras más centradas en ingeniería. MatLab será nuestra herramienta de trabajo más habitual. Por otro lado destacar Audacity, que nos podrá resultar útil por ser más rápida e intuitiva a la hora de ver la representación de una señal, recortarla, darle mayor volumen, etc.

Por tanto uno de los requisitos será saber algo de programación. En caso de que no sepas, no te preocupes! También te ayudaremos. Habrá también próximas entregas con pequeños manuales básicos con funciones que utilizaremos partiendo de un nivel de iniciación.

Empieza la cuenta atrás.

Comentar algunas palabras o términos que utilizaremos a menudo:

– Pitch: sirve para determinar si un sonido será más o menos grave o agudo. Se cuantifica con la frecuencia y, para aclarar, tenemos un pitch grave cuando la frecuencia es menor; contrariamente están las frecuencias altas, cuyo pitch sería agudo. Para saber cuantificar que es “frecuencia baja” o “alta” basta explicar el rango auditivo del ser humano. Como término medio la mayor frecuencia que puede oír es de unos 20 kHz (20.000 Hz) que corresponde con un sonido agudo; de hecho, es muuuuy agudo. Tanto, que prácticamente solo los niños lo escuchan. El rango menor está en 20 Hz, que es un sonido grave, muy grave. Para saber como son basta que te pases por esta entrada.

– Amplitud: se habla de este parámetro en el dominio del tiempo. No es más que el máximo valor que toma una señal. Si quieres ver un ejemplo, instala Audacity, abre un archivo cualquiera de audio (por ejemplo, tu canción favorita ;D ) y observa lo que ves en pantalla. El máximo valor corresponderá con la amplitud.

Continuará…

Acerca de Codificando Escarabajos

Blog de música!
Esta entrada fue publicada en Aprende con nosotros y etiquetada , , , , , , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s