Zusammenfassung der Ressource
Administración de fallas
- Tiene como objetivo la detección y resolución oportuna de situaciones anormales en la red
- El proceso de la administración de fallas consiste de distintas fases
- Monitoreo de alarmas
- Se realiza la notificación de la existencia de
una falla y del lugar donde se ha generado.
Esto se puede realizar con el auxilio de las
herramientas basadas en el protocolo SNMP.
- Es una herramienta con la que el
administrador se auxilia para
conocer que existe un problema en
la red. También conocido como
sistema de monitoreo, se trata de
un mecanismo que permite
notificar que ha ocurrido un
problema en la red. Esta propuesta
se basa en la utilización de
herramientas basadas en el
protocolo estándar de monitoreo,
SNMP, ya que este protocolo es
utilizado por todos los fabricantes
de equipos de red.
- Tipos de
alarmas
- Alarmas en las comunicaciones
- Alarmas de procesos
- Alarmas de equipos.
- Alarmas ambientales
- Alarmas en el servicio
- excesos en la utilización
del ancho de banda,
peticiones abundantes
de icmp.
- alarmas de altas temperaturas.
- Una falla de una fuente de
poder, un puerto
- fallas en el software
- Pérdidas de señal.
- Severidad de
las alarmas
- Crítica
- Mayor
- Menor
- Indefinida
- Localización de fallas.
- Determinar el origen
de una falla
- Es importante para
identificar las causas
que han originado
una falla. La alarma
indica el lugar del
problema, pero las
pruebas de
diagnóstico
adicionales son las
que ayudan a
determinar el origen
de la misma.
- Una vez
identificado el
origen, se
tienen que
tomar las
acciones
suficientes
para reparar el
daño.
- Pruebas de diagnóstico.
- Diseñar y realizar
pruebas que apoyen la
localización de una falla.
- Pruebas de
conectividad física.
- Para
verificar
que los
medios de
transmisión
se
encuentran
en
servicio
- Pruebas de
conectividad lógica.
- Pruebas
punto a punto,
o salto por
salto.
- Pruebas de
medición.
- Además de
revisar la
conectividad,
se prueban los
tiempos de
respuesta en
ambos
sentidos de la
comunicación,
la pérdida de
paquetes, la
ruta que sigue
la información.
- Corrección de fallas.
- Tomar las medidas
necesarias para corregir
el problema, una vez
que el origen de la
misma ha sido
identificado.
- Reemplazo de
recursos dañados
- Aislamiento del problema
- Redundancia.
- Recarga del sistema.
- Instalación de software
- Cambios en la configuración.
- Administración de reportes.
- Registrar y dar
seguimiento a todos
los reportes
generados por los
usuarios o por el
mismo
administrador de la
red.
- Cuando un problema
es detectado o
reportado, se le debe
asignar un número de
reporte para su debido
seguimiento, desde ese
momento un reporte
queda abierto hasta
que es corregido.
- Este es un medio
para que los
usuarios del servicio
puedan conocer el
estado actual de la
falla que reportaron
- El ciclo de vida de la
administración de reportes se
divide en cuatro áreas, de
acuerdo a la recomendación
X.790 de la ITU-T.
- Creación de reportes
- Seguimiento a reportes
- Manejo de reportes
- Finalización de reportes