Tiene como objetivo la detección y resolución oportuna de situaciones anormales en la red
El proceso de la administración de fallas consiste de distintas fases
Monitoreo de alarmas
Se realiza la notificación de la existencia de
una falla y del lugar donde se ha generado.
Esto se puede realizar con el auxilio de las
herramientas basadas en el protocolo SNMP.
Es una herramienta con la que el
administrador se auxilia para
conocer que existe un problema en
la red. También conocido como
sistema de monitoreo, se trata de
un mecanismo que permite
notificar que ha ocurrido un
problema en la red. Esta propuesta
se basa en la utilización de
herramientas basadas en el
protocolo estándar de monitoreo,
SNMP, ya que este protocolo es
utilizado por todos los fabricantes
de equipos de red.
Tipos de
alarmas
Alarmas en las comunicaciones
Alarmas de procesos
Alarmas de equipos.
Alarmas ambientales
Alarmas en el servicio
excesos en la utilización
del ancho de banda,
peticiones abundantes
de icmp.
alarmas de altas temperaturas.
Una falla de una fuente de
poder, un puerto
fallas en el software
Pérdidas de señal.
Severidad de
las alarmas
Crítica
Mayor
Menor
Indefinida
Localización de fallas.
Determinar el origen
de una falla
Es importante para
identificar las causas
que han originado
una falla. La alarma
indica el lugar del
problema, pero las
pruebas de
diagnóstico
adicionales son las
que ayudan a
determinar el origen
de la misma.
Una vez
identificado el
origen, se
tienen que
tomar las
acciones
suficientes
para reparar el
daño.
Pruebas de diagnóstico.
Diseñar y realizar
pruebas que apoyen la
localización de una falla.
Pruebas de
conectividad física.
Para
verificar
que los
medios de
transmisión
se
encuentran
en
servicio
Pruebas de
conectividad lógica.
Pruebas
punto a punto,
o salto por
salto.
Pruebas de
medición.
Además de
revisar la
conectividad,
se prueban los
tiempos de
respuesta en
ambos
sentidos de la
comunicación,
la pérdida de
paquetes, la
ruta que sigue
la información.
Corrección de fallas.
Tomar las medidas
necesarias para corregir
el problema, una vez
que el origen de la
misma ha sido
identificado.
Reemplazo de
recursos dañados
Aislamiento del problema
Redundancia.
Recarga del sistema.
Instalación de software
Cambios en la configuración.
Administración de reportes.
Registrar y dar
seguimiento a todos
los reportes
generados por los
usuarios o por el
mismo
administrador de la
red.
Cuando un problema
es detectado o
reportado, se le debe
asignar un número de
reporte para su debido
seguimiento, desde ese
momento un reporte
queda abierto hasta
que es corregido.
Este es un medio
para que los
usuarios del servicio
puedan conocer el
estado actual de la
falla que reportaron
El ciclo de vida de la
administración de reportes se
divide en cuatro áreas, de
acuerdo a la recomendación
X.790 de la ITU-T.