Estudio comparativo de técnicas
supervisadas de machine learning
aplicadas en problemas medicos
Aprendizaje de Máquina
Es una rama del campo de inteligencia artificial que estudia como las maquinas pueden tomar
decisiones a partir de emular a los seres vivos, teniendo en cuenta una información estructurada o sin
estructurar, suministrada a modo de ejemplo
Objetivo
Comparar cuantitativamente 6 técnicas
supervisadas de clasificación multi-clase
SVM: Support Vector Machine
KNN: K-nearest neighbors algorithm
ANN: Artificial neural network
PC: Parzens Classifier
Random Forest: arboles de decisión
Adaboost: Adaptative Boosting
Materiales y Métodos
Base de Datos
Cleveland
Cardiotocografia
Hipotiroidismo
Preprocesamiento
Selección de Variables
Determinación del conjunto de entrenamiento
Ajuste de parámetros
Determinación de los parámetros que rigen el
funcionamiento de los clasificadores
Evaluación del desempeño de los clasificadores
Cálculo de error cuadrático medio
Validación Cruzada
Resultados
Para cada clasificador se realizó una validación cruzada de 20 veces para
obtener el promedio del error cuadrático de clasificación y su respectiva
desviación estándar que finalmente son los indicadores de desempeño.
Conclusiones
De los resultados arrojados para las pruebas realizadas, resulta claro el evidenciar que el alogritmo de RandomForest presenta un
error de clasificación bastante alto en comparación con los demás clasificadores usados en el experimento. Por lo tanto no es el
clasificador más adecuado para ser adecuado en algoritmos que tomen decisiones de diagnóstico de patologías como por ejemplo
estructuras como razonamiento basado en casos, CBR por sus siglas en ingles. Lo anterior se puede deber quizá a la topología de los
datos dependiendo de esta, existen clasificadores que funcionan de mejor manera, es importante el reconocer esto ya que podria
facilitar tareas. Con el hecho de solo saber la topología de los datos se podría predecir que clasificador funcionará mejor.