Su funcion principal es reconocer y localizar objetos en el ambiente mediante el procesamiento de las imagenes.
Un area muy ligada a la de vision computacional es la de procesamiento de imagenes. Aunque ambos campos tienen
mucho en comun, el objetivo nal es diferentes. El objetivo de procesamiento de imagenes es mejorar la calidad de las
imagenes para su posterior utilizacion o interpretacion
Formacion y representacion de la
imagen
La formacion de la imagen ocurre cuando un sensor registra la
radiacion que ha interactuado con ciertos objetos fisicos.La
imagen obtenida por el sensor se puede ver como una funcion
bidimensional, donde el valor de la funcion corresponde a la
intensidad o brillantez en cada punto de la imagen.Una funcion de
la imagen es una representacion matematica de la imagen I=f(x;y).
Cada valor de intensidad, f(x; y), es discretizado a un numero, por
ejemplo un numero entre 0 y 255. Entonces una imagen digital
monocromatica puede ser representada por una matriz de NxM,
donde cada valor es un numero que representa el nivel de
intensidad del punto correspondiente de la imagen. Cada punto
se conoce como pixel.
Proyeccion de la Imagen
La proyección puntual es la
transformación de la imagen que
se presenta al pasar a muchos de
los dispositivos visuales,
incluyendo nuestros ojos y una
camara. La aproximación mas
simple a este fenómeno es el
modelo de "camara de agujero de
alfiler", que consiste en proyectar
todos los puntos de la imágen a
traves del un punto al plano de la
imagen.
Imagenes binoculares
Al proyectarse los objetos, de un
espacio tridimensional a una imagen
bidimensional se pierde la
informacion de la distancia a la
camara o profundidadde cada punto.
Una forma de tratar de recuperar esta
informacion es mediante el uso de dos
camaras, en lo que se conoce como
vision estereo.
Reflectancia
La luz emitida se re eja en el
objeto, y es recibida por el sensor,
generando cierta brillantez en la
imagen (f). La brillantez depende
de la intensidad de la fuente , el
angulo del rayo con la normal de
la supercie, las propiedades de re
ectancia del objeto y la distancia
del objeto a la imagen.Existen dos
tipos basicos de supercie: *Mate:
Refleja la luz recibida en todas
direcciones. *Especular: Refleja la
luz recibida en una sola direccion,
la cual esta en funcion del angulo
entre el rayo incidente y la normal
a la supercie. Las supercies del
mundo real muestran una
combinacion de ambas.
Color
El color es un fenomeno perceptual
relacionado con la respuesta humana a
diferentes longitudes de onda del
espectro visible.Existen diferente formas
de organizar o codicar los diferentes
colores a partir de componentes basicas,
lo que se conoce como espacios de color.
Los modelos RGB y HSI son un ejemplo
de tales espacios o modelos de color.
Modelo RGB El modelo RGB se basa en
los tres sensores humanos,
considerando que todos los colores son
una combinacion de tres colores basicos
o primarios: R (rojo), G (verde), B
(azul).Se considera que el modelo HSI es
el que mejor aproxima a la percepcion
humana. El modelo HSI codica el color
en tres componentes: I - intensidad
(brillantez). H - croma (Hue). S -
saturacion (pureza, inverso a la cantidad
de blanco).
Digitalizacion de imagenes
Al muestrear la imagen para obtener una
representacion digital, hay dos factores
importantes que considerar: a) El intervalo
de muestreo (resolucion). b) El patron
espacial de los puntos de muestreo
(tesselation).
Intervalo de muestreo
El teorema del muestreo de
Shannon dice que para lograr
una recuperacion completa,
es necesario que la frecuencia
de muestreo sea al menos dos
veces mayor a la frecuencia
mayor contenida en el
espectro de la señal original.
Esto se puede demostrar a
partir de un analisis de Fourier
del fenomeno de muestreo. Si
no se cumple esto se presenta
un fenomeno llamado
\aliasing" en el cual las bajas
frecuencias intereren en las
altas frecuencias, resultando
en la perdida de detalle de la
imagen que se ve borrosa.
Patrones espaciales
Existen tres tipos de arreglos de
celdas: rectangular, triangular
hexagonal.Hay dos parametros
principales que considerar
respecto a la forma de las celdas
y que repercuten en diversos
algoritmos de analisis de la
imagen: 1. Conectividad:
Determinar si ciertos elementos
u objetos estan conectados o
no. Para las celdas rectangulares
se presentan problemas en este
aspecto, ya que se puede definir
en dos formas: 4 celdas u 8
celdas. 2. Distancia - Determinar
en forma consistente la
distancia entre pixels. Para esto
es conveniente que la distancia
sea una metrica, que satisfaga lo
siguiente: (a) d(x; y) = 0 $ x = y (b)
d(x; y) = d(y; x) (c) d(x; y) + d(y; z)
d(x; z)
Niveles de analisis
Al considerar vision como un proceso de
informacion, podemos analizarlo de diversas
formas. Marr propone tres niveles: 1. Teoria
computacional - El objetivo del proceso
computacional, sus metas y las estrategias
adecuadas para realizarlo. 2. Representacion
y algoritmo - la descripcion del proceso
computacional, el representar las entradas y
salidas, proponer el algoritmo para lograr
dicha transformacion. 3.
Implementacion - Como se realiza fsicamente
dicho proceso. El analizar un
proceso a los diferentes niveles ayuda a su
mejor entendimiento y realizacion.
Niveles de vision
Vision consiste en partir de una imagen (pixels)
y llegar a una descripcion (predicados,
geometra, etc) adecuada de acuerdo a nuestro
proposito. Procesamiento de nivel bajo - se
trabaja directamente con los pixels para
extraer propiedades como orillas, gradiente,
profundidad, textura, color, etc.
Procesamiento de nivel intermedio - consiste
generalmente en agrupar los elemento
obtenidos en el nivel bajo, para obtener lneas,
regiones, generalmente con el proposito de
segmentacion. Procesamiento de alto nivel -
esta generalmente orientada al proceso de
interpretacion de los entes obtenidos en los
niveles inferiores y se utilizan modelos y/o
conocimiento a priori del dominio.