Zusammenfassung der Ressource
Deep Convolutional
Neural Network
(CNN o DCN)
- ¿Qué es?
- Convolución
- Operación matemática que
combina dos señales para
producir una tercera señal.
- Propiedades
- Asociatividad
- Conmutatividad
- Distribución
- Son similares a las redes neuronales multicapa, cada
parte de la red se especializa en una tarea, lo cual
reduce el número de capas ocultas, por lo que el
entrenamiento es más rápido. Además, presenta
invarianza a la traslación de los patrones a identificar.
- Arquitectura
- Capa convolucional
- Se realizan operaciones de productos y sumas
entre la capa de entrada y los n filtros (o kernel)
que genera un mapa de características. Los
características extraídas corresponden a cada
posible ubicación del filtro en la imagen original.
- Neurona
convolucional
- Similares a las células feed forward, excepto que
normalmente están conectadas a sólo unas pocas
neuronas de la capa anterior. A menudo se utilizan para
preservar la información espacial, porque están
conectados no a unas cuantas células aleatorias, sino a
todas las células en una cierta proximidad.
- Reducción de muestreo
(Pooling)
- Se reduce la cantidad de parámetros al
quedarse con las características más
comunes.
- Se realiza mediante la extracción de estadísticas como
el promedio o el máximo de una región fija del mapa de
características, al reducir características el método
pierde precisión aunque mejora su compatibilidad.
- Clasificación (Red
perceptron multicapa)
- Capas completamente conectadas en la que
cada pixel se considera como una neurona
separada al igual que en un perceptron
multicapa.
- Origines
- Bio-inspiradas por las neuronas
en la corteza visual primaria
(V1) de un cerebro biológico.
- Kunihiko
Fukushima
(1980)
- Neocognitron
- Red neuronal autoorganizada para un
mecanismo de reconocimiento de patrones
no afectado por el cambio de posición.
- http://vision.stanford.edu/teaching/cs131_fall1415/lectures/Fukushima1988.pdf
- Hubel y Wiesel
(1968)
- Trabajo en la corteza visual de los gatos
- La corteza visual contiene
una compleja disposición de
las células
- Campo receptivo
- Células simples y complejas.
- Thomas
Serre et al.
(2007)
- Reconocimiento robusto de
objetos con mecanismos
parecidos a la corteza.
- http://cbcl.mit.edu/publications/ps/serre-wolf-poggio-PAMI-07.pdf
- Yann LeCun
et al. (1998)
- El aprendizaje basado en
gradientes aplicado al
reconocimiento de documentos
- http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf
- Principales capacidades
- Soy especialmente utilizadas para el
procesamiento de imagenes
- Aplicaciones
- Procesamiento de imágenes
- Clasificación de
imágenes
- Segmentación de
imágenes
- Auto-etiquetado de imágenes
- Identificar letras en
imágenes.
- Visión artificial
- Procesamiento de audio
- Clasificación de señales de
audio utilizando convoluciones
en 1D.
- Clasificación de datos
volumétricos usando
convoluciones en 3D.
- Clasificación de series de tiempo
- Algoritmos de
aprendizaje
- Aprendizaje basado
en Backpropagation
- Extracción de características
- Como todas las capas tienen tareas asignadas con ciertas
características de aprendizaje de las imágenes, estas
características se pueden extraer de la red en cualquier
momento durante el proceso de entrenamiento.
- Dropout: Consiste en desconectar un porcentaje de
las neuronas en cada iteración del entrenamiento
- Variantes
- Las CNN son una variación
del perceptrón multicapa
- Implementaciones
- Software
- Google
- Google Translate app
- Hace una traducción
visual en tiempo real de
más de 20 idiomas.
- Búsqueda por imágenes
- ImageNet
- Identificación de
múltiples objetos
en una imágen
- Facebook
- Auto-Etiquetado de personas
en fotografías.
- https://machinelearningmastery.com/inspirational-applications-deep-learning/
- Aplicaciones en software de medicina
para el procesamiento de imágenes
médicas de rayos X o de otro tipo.