Creado por Victor Hugo Ramirez
hace más de 5 años
|
||
Raíces del PDS El Procesamiento Digital de Señales se distingue de otras áreas en la ciencia computacional, por el único tipo de datos que utiliza: señales. En la mayoría de los casos, esas señales tienen origen en datos sensoriales del mundo real: vibraciones sísmicas, imágenes visuales, ondas de sonido, etc. El PDS son las matemáticas, los algoritmos y las técnicas usadas para manipular esas señales después que han sido convertidas en una forma digital. Esto incluye una amplia variedad de propósitos, como: el mejoramiento de imágenes visuales, reconocimiento y generación del habla, compresión de datos para almacenamiento y transmisión, etc. Suponga que conectamos un convertidor analógico-a-digital a una computadora y la usamos para adquirir una pedazo de datos del mundo real. El PDS contesta a la pregunta: ¿Que sigue? Las raíces del PDS están en los 60s y 70s cuando las primeras computadoras estuvieron disponibles. Las computadoras eran caras en esa época y el PDS fue limitado a solamente algunas pocas aplicaciones críticas. Esfuerzos pioneros fueron hechos en cuatro áreas clave: radar y sonar, donde la seguridad nacional estaba en riesgo; exploración petrolera, donde se hicieron grandes cantidades de dinero; exploración espacial, donde los datos eran irremplazables; e imagenología médica, donde podían ser salvadas vidas. La revolución de la computadora personal de los 80s y 90s ocasionó que el PDS detonara con nuevas aplicaciones. Más allá de estar motivado por necesidades militares y gubernamentales, el PDS fue de pronto guiado por el mercado comercial. Cualquiera que pensó poder hacer dinero en el ese terreno en rápida expansión, de repente se volvió su comerciante. PDS alcanzó al público en variedad de productos como: teléfonos móviles, reproductores de discos compactos y correo de voz electrónico. La figura 1-1 ilustra unas cuantas de esta variedad de aplicaciones. Esta revolución tecnológica ocurrió de arriba hacia abajo. Al comienzo de los 80s, el PDS se impartía como un curso de posgrado en ingeniería eléctrica. Una década después, el PDS se había convertido en una parte estándar del curso de pregrado. Hoy, el PDS es un conocimiento básico necesitado por científicos e ingenieros en muchos terrenos. Como una analogía, el PDS puede ser comparado a una revolución tecnológica previa: la electrónica. Si bien se encuentra en el terreno de la ingeniería eléctrica, casi todos los científicos e ingenieros tienen alguna experiencia en el diseño de circuitos básicos, sin ella estarían perdidos en el mundo tecnológico. El PDS tiene el mismo futuro.
Esta historia reciente es más que una curiosidad; ha tenido un impacto tremendo en la habilidad para aprender y usar PDS. Suponga encontrarse con un problema PDS, y volcarse a libros y otras publicaciones para encontrar una solución. Lo que típicamente encontrará son páginas y más páginas de ecuaciones, oscuros símbolos matemáticos y terminología. ¡Es una pesadilla! La mayoría de la literatura PDS es confusa incluso para aquellos con experiencia en el campo. No es que haya algo malo con este material, solo es que está dirigido para una muy especializada audiencia. Los investigadores de vanguardia necesitan este tipo de matemáticas detalladas para comprender las implicaciones teóricas del trabajo. Una premisa básica de este libro es que la mayoría de las técnicas prácticas de PDS pueden ser aprendidas y usadas sin las barreras tradicionales de matemáticas detalladas y teoría. La guía de científicos e ingenieros para el procesamiento digital de señales está escrita para aquellos que quieren usar PDS como una herramienta, no como una nueva profesión. El resto de este capítulo ilustra áreas donde el PDS ha producido cambios revolucionarios. A medida que avance por cada aplicación, observe que el PDS es muy interdisciplinario. TELECOMUNICACIONES Telecomunicaciones trata de la transmisión de señales de un lugar a otro. Esto incluye muchas clases de información: conversaciones telefónicas, señales de televisión, archivos de computadora y otros tipos de datos. Para transferir la información, necesita un canal entre las dos ubicaciones. Este puede ser un par trenzado, señales de radio, fibra óptica, etc. Las compañías de telecomunicaciones reciben pago por transmitir la información de sus clientes, mientras ellos deben pagar para establecer y mantener el canal. La línea base financiera es simple: a mayor cantidad de información que pueda pasar por un canal, mayor será la cantidad de dinero que podrá hacerse. PDS ha revolucionado la industria de las telecomunicaciones en muchas áreas: generación y detección de tonos de señalización; desplazamiento de la banda de frecuencia; filtrado para remover ruido en la línea, etc. Tres específicos ejemplos de la red telefónica serán discutidos aqu: multiplexado, compresión y control de eco. Multiplexado Hay aproximadamente un billón de teléfonos en el mundo. A la presión de algunas teclas el switcheo de redes permitirá a uno de ellos conectarse con cualquier otro en segundos. ¡La inmensidad de esta tarea es alucinante! Hasta los 60s, una conexión entre dos teléfonos requería pasar las señales de voz análogas a través de switches mecánicos y amplificadores. Una conexión requería un par de cables. En comparación, PDS convierte señales de audio en un flujo de datos seriales digitales. Dado que los bits pueden fácilmente ser enlazados y después separados, muchas conversaciones de teléfono pueden ser transmitidas por un solo canal. Por ejemplo, un teléfono estándar conocido como el sistema T-carrier puede simultáneamente transmitir 24 señales de voz. Cada señal de voz es muestreada 8,000 veces por segundo usando una conversión analógica-digital de 8 bits. Esto resulta en que cada señal de voz sea representada como 64,000 bits/seg y todos los 24 canales estén contenidos en 1.544 megabits/seg. Esta señal puede ser transmitida cerca de 6,000 pies usando líneas de teléfono de cobre calibre 22 ordinarias, una típica distancia de interconexión. La ventaja financiera de la transmisión digital es enorme. El cable y los switches analógicos son caros; las compuertas lógicas digitales son baratas. Compresión Cuando una señal de voz es digitalizada a 8,000 muestras por segundo, la mayoría de la información digital es redundante. Esto es, la información transportada por cualquier muestra se duplica en gran medida por las muestras adyacentes. Docenas de algoritmos PDS han sido desarrollados para convertir voz digital en flujos de datos que requieren menos bits/seg. Estos son llamados algoritmos de compresión de datos. Algoritmos de descompresión coincidente son usados para restablecer la señal a su forma original. Esos algoritmos varían en la cantidad de compresión alcanzada y la calidad de sonido resultante. En general, reduciendo el índice de datos de 64 kbits/seg a 32 kbits/seg, resulta en la no pérdida de calidad de sonido. Cuando se comprime a un índice de 8 kilobits/seg, el sonido es notablemente afectado, pero continúa siendo útil para redes telefónicas de larga distancia. La mayor compresión alcanzada está cerca de los 2 kilobits/seg, resultando en sonido que está altamente distorsionado pero útil en algunas aplicaciones como la comunicación militar o submarina. Control de eco Los ecos son un serio problema en las conexiones telefónicas de larga distancia. Cuando se habla en un teléfono, una señal representando su voz viaja al receptor conectado, donde una porción de esta retorna como un eco. Si la conexión está dentro de unos cuantos cientos de millas, el tiempo transcurrido para recibir el eco es solamente de unos cuantos milisegundos. El oído humano está habituado a escuchar ecos con este pequeño retraso de tiempo y la conexión suena bastante normal. Conforme la distancia se hace mayor, el eco se va haciendo más notorio e irritante. El retraso puede ser de varios cientos de milisegundos para comunicaciones intercontinentales y resulta desagradable. El PSD ataca este tipo de problema midiendo el retorno de señal y generando una apropiada anti-señal para cancelar el irritante eco. Esta misma técnica permite a los usuarios de teléfonos escuchar y hablar al mismo tiempo sin batallar con el retorno de audio (squealing). Esto además puede ser usado para reducir el ruido ambiental cancelando este con un anti-noise generado digitalmente. PROCESAMIENTO DE AUDIO Los dos principales sentidos del hombre son la visión y el oído. Correspondientemente muchos PDSs están relacionados al procesamiento de imágenes y audio. La gente escucha ambos, música y voz. DSP ha hecho cambios revolucionarios en las dos áreas. Música El camino que lleva del micrófono de los músicos a la bocina de los amantes de la música es considerablemente largo. La representación de datos digitales es importante para prevenir la degradación normalmente asociada con el almacenamiento y manipulación analógico. Esto es muy familiar para quienes han comparado la calidad musical del casette contra la del disco compacto. En un escenario típico, una canción es grabada en un estudio musical sobre múltiples canales o pistas. En algunos casos, esto implica grabar instrumentos y voces por separado. Esto se hace para dar al ingeniero de sonido mayor flexibilidad para la creación del producto final. El complejo proceso de combinar pistas individuales en un producto final se llama mix down. El DSP puede proveer muchas funciones importantes durante el mix down, incluyendo: filtrado, adición y eliminación de señales, edición de señales, etc. Una de las más interesantes aplicaciones del PDS en preparación musical es la reverberación artificial. Si los canales individuales son simplemente agregados en conjunto, la pieza resultante suena débil y diluida, como si los músicos estuvieran tocando en campo abierto. Esto es debido a que los escuchas son altamente influenciados por el eco y la reverberación contenida en la música, lo cual es usualmente minimizado en el estudio de audio. PDS permite que ecos y reverberaciones artificiales sean agregados durante el mix down para simular varios ambientes artificiales. Ecos con retraso de unos cientos de milisegundos dan la impresión de locaciones tipo catedral. Agregando ecos con retraso de 10 a 20 milisegundos dan la percepción de cuartos de tamaño más modesto. Generación de voz El reconocimiento y generación del habla son usados para la comunicación entre humanos y máquinas. En lugar de usar sus manos y ojos, usa su boca y oídos. Esto es muy conveniente cuando sus manos y ojos puedan estar haciendo algo más, como manejar un auto, realizar una cirugía o (desafortunadamente) disparando un arma al enemigo. Se utilizan dos enfoques para el habla generada por computadora: grabación digital y simulación del tracto vocal. En grabación digital, la grabación de un hablante humano es digitalizada y almacenada, usualmente en un formato comprimido. Durante la reproducción, los datos almacenados; descomprimidos y convertidos nuevamente en señal análoga. Una hora entera de grabación de voz requiere alrededor de 3 megabytes de almacenamiento solamente. lo que está dentro de la capacidad de cualquier pequeña computadora. Este es el método más común de generación digital de habla usado hoy. Los simuladores de tracto vocal son más complicados, tratando de imitar el mecanismo físico por el que los humanos creamos el habla. El tracto vocal humano es una cavidad acústica con frecuencias de resonancia determinadas por el tamaño y la forma de las cámaras. El sonido se origina en el tracto vocal en alguna de dos maneras básicas, llamadas sonidos sonoros y fricativos. Con los sonidos sonoros, la vibración de las cuerdas vocales produce pulsos periódicos de aire en las cavidades vocales. En comparación, los sonidos fricativos se originan de la ruidosa turbulencia del aire en opresiones estrechas. como los dientes y los labios. Los simuladores del tracto vocal operan generando señales digitales que reconstruyen estos dos tipos de excitación. Las características de la cámara de resonancia son simuladas pasando la señal de excitación a través de un filtro digital con similares resonancias. Este acercamiento fue usado en una de las muchas historias de éxito iniciales, el speak and spell, una ayuda de aprendizaje electrónico ampliamente vendida para niños. Reconocimiento de voz El reconocimiento automático de voz humana es inmensamente más difícil que la generación de habla. El reconocimiento es un ejemplo de cosas que el cerebro humano hace bien, pero las computadoras digitales lo hacen pobremente. Las computadoras pueden almacenar y recuperar una vasta cantidad de datos, realizar cálculos matemáticos a velocidades de ráfaga y realizar tareas repetitivas sin aburrirse o equivocarse. Desafortunadamente, las computadoras son muy pobres cuando se le pone frente datos sensoriales en bruto. Enseñar a su computadora a enviarle un billete mensual es fácil. Enseñar a la misma computadora a entender su voz es una tarea mayor. El procesamiento digital de señales generalmente aborda el problema del reconocimiento de voz en dos pasos: extracción de características, seguida por coincidencia de características. Cada palabra en la señal de audio de entrada es aislada y entonces analizada para identificar el tipo de excitación y frecuencias resonantes. Estos parámetros son entonces comparados con ejemplos previos de palabras habladas para identificar la coincidencia más cercana. A menudo, estos sistemas están limitados por solamente unos cuantos cientos de palabras; pueden aceptar solamente habla con marcadas pausas entre palabras; y deben ser re-entrenados para cada diferente voz. Aunque es adecuado para algunas aplicaciones comerciales, estas limitaciones lo hacen muy modesto comparado con las habilidades de la escucha humana. Hay un gran reto en esta área, con tremendos beneficios económicos. UBICACIÓN DE ECO Un método común para obtener información acerca de un objeto remoto es rebotando una onda en el. Por ejemplo, el radar opera transmitiendo pulsos de ondas de radio y examinando la señal recibida de ecos de aviones. En sonar, las ondas de sonido son transmitidas a través del agua para detectar submarinos y otros objetos sumergidos. Los geofísicos han investigado la tierra durante mucho tiempo activando explosiones y estudiando los ecos en capas de roca profundamente ocultas. Aunque estas aplicaciones tienen una base común, cada una representa diferentes retos y necesidades. El procesamiento digital de señales ha producido cambios revolucionarios en las tres áreas. Radar Radar es el acrónimo de RAdio Detection and Ranging. En el sistema de radar más simple, un radio-transmisor produce un pulso de energía de radiofrecuencia de unos cuantos microsegundos de duración. Este pulso es transmitido por una antena altamente direccional, donde la onda de radio resultante se propaga a la velocidad de la luz. Un avión en la ruta de esta onda reflejará una pequeña porción de la energía hacia una antena receptora, situada cerca del sitio de la transmisión. La distancia al objeto es calculada por el tiempo que se toma entre la transmisión del pulso y la recepción del eco. La dirección del objeto es calculada más fácilmente, sabiendo a donde apuntaba la antena direccional cuando el eco fue recibido. El rango de operación de un sistema de radar está determinado por dos parámetros: cuánta energía hay en el pulso original y el nivel de ruido del receptor de radio. Desafortunadamente, incrementar la energía del pulso normalmente requiere hacerlo más largo. El pulso más largo reduce la exactitud y precisión en la medición del tiempo transcurrido. Esto resulta en un conflicto entre dos parámetros importantes: la habilidad para detectar objetos en rango largo y la habilidad para determinar con precisión su distancia. PDS ha revolucionado el radar en tres áreas, las cuales se relacionan al problema básico. Primero, PDS puede comprimir el pulso después que es recibido, proporcionando mejor cálculo de distancia sin reducir el rango de operación. Segundo, PDS puede filtrar la señal recibida, para reducir el ruido. Esto incrementa el rango, sin degradar el cálculo de distancia. Tercero, PDS habilita la selección rápida y generación de pulsos de diferentes formas y longitudes. Entre otras cosas, esto permite al pulso ser optimizado para un problema particular de detección. Ahora la parte sorprendente: gran parte de esto se realiza a una tasa de muestreo comparable con la frecuencia de radio usada. ¡Por arriba de muchos cientos de megahertz! Cuando se trata de radar, DSP está tanto en el diseño de hardware de alta velocidad, como en el de algoritmos. Sonar Sonar es el acrónimo de SOund NAvigation and Ranging. Se divide en dos categorías, activo y pasivo. En el sonar activo, pulsos de sonido entre 2 kHz y 40 kHz son transmitidos a través del agua, y los ecos resultantes detectados y analizados. Usos del sonar activo incluyen: detección y localización de cuerpos bajo el agua, navegación, comunicación y mapeo del fondo del mar. Un rango de operación máximo de entre 10 y 100 kilómetros, es típico. En comparación, el sonar pasivo simplemente escucha los sonidos subacuáticos, que incluyen: turbulencia natural, vida marina, y sonidos mecánicos de submarinos y embarcaciones superficiales. Como el sonar pasivo no emite energía, es ideal para operaciones encubiertas. Querer detectar a otro, sin ser detectado por el. La aplicación más importante del sonar pasivo es en sistemas de vigilancia militar, que detectan y rastrean submarinos. El sonar pasivo normalmente usa frecuencias más bajas que el sonar activo, porque estas se propagan por el agua con menos absorción. El rango de detección puede ser de cientos de kilómetros. PDS ha revolucionado el sonar en muchas de las mismas áreas que el radar: generación de pulso, compresión de pulso, filtrado y detección de señales. Desde una perspectiva, el sonar es más simple que el radar debido a las bajas frecuencias envueltas. Desde otra perspectiva, el sonar es más complejo que el radar ya que el ambiente es mucho más complejo e inestable. Los sistemas de sonar normalmente emplean grandes arreglos de elementos de transmisión y recepción, más que un solo canal. Para controlar y mezclar apropiadamente las señales en todos estos elementos, los sistemas de sonar pueden guiar el pulso emitido a la ubicación deseada y determinar la dirección desde donde son recibidos los ecos. Para manejar estos múltiples canales, los sistemas de sonar requieren el mismo enorme poder de procesamiento PDS que el radar. Sismología de reflexión Desde los años 20s, geofísicos descubrieron que la estructura de la corteza terrestre podía ser investigada con sonido. Los investigadores, activando una explosión, podían grabar los ecos de capas límite a más de 10 kilómetros bajo la superficie. Estos sismógrafos de eco fueron interpretados por el ojo humano para mapear la estructura de la superficie. El método de la reflexión sísmica rápidamente se adoptó como el principal método para localizar petróleo y depósitos minerales, el cual se mantiene hasta nuestros días. En el caso ideal, un pulso de sonido enviado dentro de la tierra produce un eco sencillo cada capa que atraviesa. Desafortunadamente, la situación usualmente no es así de simple. Cada eco que regresa a la superficie debe pasar a través de todas las otras capas antes de regresar al origen. Esto puede ocasionar que el eco rebote entre capas, dando lugar a que se detecten ecos de ecos. Estos ecos secundarios pueden hacer que la señal detectada sea muy difícil de interpretar. PDS ha sido ampliamente usado desde los 60s para aislar al eco primario de los secundarios en sismógrafos de reflexión. ¿Como se las arreglaban los geofísicos antes del PDS? La respuesta en simple: buscaban en lugares “fáciles”, donde las múltiples reflexiones eran mínimas. El PDS permite encontrar petróleo en ubicaciones difíciles, como el fondo del océano. PROCESAMIENTO DE IMAGEN Las imágenes son señales con características especiales. Primeramente, su unidad de medida es sobre el espacio (distancia), mientras la mayoría de las señales tienen parámetros de medida sobre el tiempo. Segundo, contienen una gran cantidad de información. Por ejemplo, más de 10 megabytes pueden ser requeridos para almacenar un segundo de video de televisión. Esto es más de cien veces mayor que para una señal de voz de duración similar. En tercer lugar, el juez final de la calidad es a menudo una evaluación humana subjetiva, en lugar de un criterio objetivo. Estas características especiales han hecho del procesamiento de imágenes, un subgrupo particular dentro del PDS. Médico En 1895, Wilhelm Conrad Röntgen descubrió que los Rayos X podían traspasar sustanciales cantidades de materia. La medicina fue revolucionada por la habilidad de mirar dentro de un cuerpo humano vivo. Los sistemas de Rayos X se extendieron rápidamente por el mundo en unos cuantos años. A pesar de su obvio éxito, la imagenología de rayos X se vio limitada por cuatro problemas hasta que el DSP y las técnicas relacionadas aparecieron en la década de 1970. Primero, estructuras superpuestos en la imagen pueden ocultarse unas a otras. Por ejemplo, porciones del corazón pueden no ser visibles por las costillas. Segundo, no siempre es posible distinguir entre tejidos similares. Por ejemplo, puede ser posible separar hueso de tejido blando, pero no distinguir un tumor del hígado. Tercero, las imágenes de rayos X muestran anatomía, la estructura del cuerpo, pero no muestran fisiología, la forma en que opera. ¡Las imágenes en rayos x de una persona viva, son exactamente iguales a las imágenes de una persona muerta! Cuarto, la exposición a rayos X puede causar cáncer, requiriendo usarse con moderación y sólo con la justificación apropiada. El problema de la superposición de estructuras fue resuelto en 1971 con la introducción del primer escáner de tomografía computarizada (llamado formalmente computed axial tomography o escáner CAT). La tomografía computarizada (CT) es un ejemplo clásico del Procesamiento Digital de Señales. Rayos X provenientes de múltiples direcciones son pasados a través de la sección del paciente que está siendo examinada. En lugar de simplemente formar imágenes con los rayos X detectados, las señales se convierten en datos digitales y se almacenan en una computadora. La información se usa para calcular las imágenes que son mostradas como cortes del cuerpo. Estás imágenes muestran mucho más detalle que las técnicas convencionales, permitiendo mejorar significativamente el diagnóstico y el tratamiento. El impacto del CT fue casi tan grande como el de la introducción de las imágenes por Rayos X. En solo unos cuantos años, cada gran hospital en el mundo tuvo acceso a un escáner CT. En 1979 dos de los principales contribuyentes en el desarrollo de los CT, Godfrey N. Hounsfield and Allan M. Cormack, compartieron el premio nobel en medicina. ¡Genial PDS! Los otros tres problemas del con los Rayos X fueron resueltos usando otra energía de penetración que los rayos x, como ondas de radio o de sonido. PDS juega un rol clave en todas estas técnicas. Por ejemplo, La imágen por Resonancia Magnética (MRI) usa campos magnéticos en conjunto con ondas de radio para hurgar el interior del cuerpo humano. El ajuste adecuado de la fuerza y la frecuencia de los campos hace que los núcleos atómicos en una región localizada del cuerpo resuenen entre los estados de energía cuántica. Esta resonancia da como resultado la emisión de una onda de radio secundaria, detectada con una antena colocada cerca del cuerpo. La intensidad y otras características de esta señal detectada proporcionan información sobre la región localizada en resonancia. El ajuste del campo magnético permite que la región de resonancia se escanee por todo el cuerpo, mapeando la estructura interna. Esta información generalmente se presenta como imágenes, al igual que en la tomografía computarizada. Además de proporcionar una excelente discriminación entre los diferentes tipos de tejidos blandos, la MRI puede proporcionar información sobre la fisiología, como el flujo de sangre a través de las arterias. La resonancia magnética se basa totalmente en las técnicas de procesamiento de señales digitales y no podría implementarse sin ellas. Espacio A veces, solo tienes que sacar el máximo provecho de una mala imagen. Este es frecuentemente el caso con imágenes tomadas de satélites no tripulados y vehículos de exploración espacial. ¡Nadie va a enviar un técnico a Marte solo para ajustar las perillas de una cámara! PDS puede mejorar la calidad de las imágenes tomadas en condiciones extremadamente desfavorables de varias maneras: ajuste de brillo y contraste, detección de bordes, reducción de ruido, ajuste de enfoque, reducción de desenfoque de movimiento, etc. Imágenes que tienen distorsión espacial, como la que se encuentra cuando se utiliza una imagen plana. tomada de un planeta esférico, también puede ser deformada en una representación correcta. Muchas imágenes individuales también se pueden combinar en una sola base de datos, lo que permite que la información se muestre de manera única. Por ejemplo, una secuencia de video que simula un vuelo aéreo sobre la superficie de un planeta distante. Productos de imagen comercial El gran contenido de información en imágenes es un problema para los sistemas que se venden en grandes cantidades al público en general. Los sistemas comerciales deben ser baratos, y esto no encaja bien con grandes memorias y altas tasas de transferencia de datos. Una respuesta a este dilema es la compresión de imágenes. Al igual que con las señales de voz, las imágenes contienen una gran cantidad de información redundante y pueden ejecutarse a través de algoritmos que reducen la cantidad de bits necesarios para representarlos. La televisión y otras imágenes en movimiento son especialmente adecuadas para la compresión, ya que la mayoría de las imágenes siguen siendo las mismas de fotograma a fotograma. Los productos comerciales de imágenes que aprovechan esta tecnología incluyen: teléfonos de video, programas de computadora que muestran imágenes en movimiento y televisión digital.
¿Quieres crear tus propios Apuntes gratis con GoConqr? Más información.