Los test se pueden clasificar en individuales o grupales, según sea la administración y categoría.
Tests de comportamiento típico: motivación, actitudes y personalidad
Nota:
En este tipo de tests ninguna respuesta puede ser calificada
como correcta o incorrecta
Se evalúa el comportamiento habitual de los individuos, recurriendo a distintas afirmaciones ante las
cuales el examinado debe indicar su nivel de acuerdo o agrado
Escalas de autoeficacia
Nota:
La autoeficacia se relaciona fuertemente con los intereses
vocacionales pero se trata de una relación asimétrica
La teoría social-cognitiva del desarrollo de carrera (Lent, Brown y Hackett, 1994) propone un modelo explicativo de las interrelaciones entre rasgos de
personalidad, intereses, habilidades y autoeficacia que contribuye a esclarecer el significado diferencial de estos constructos
Un concepto relacionado con el de autoeficacia es el de autoestima, o autovaloración, que la persona realiza acerca de sí misma
Inventarios de intereses vocacionales
Nota:
Han sido definidos como perfiles
de agrados y aversiones respecto a actividades relacionadas con
carreras y ocupaciones (Lent, Brown y Hackett, 1994)
Inventarios de rasgos de personalidad
Nota:
La medición de la personalidad atañe principalmente al primer punto, y su propósito principal es describir a los individuos
sobre la base de sus rasgos de personalidad predominantes
Test de ejecución máxima : Inteligencia, aptitudes y
habilidades
Nota:
La característica principal de los tests de ejecución máxima
es que demandan a los examinados que respondan de la forma más eficiente que puedan frente a tareas problemáticas que deban resolverse
Dependen de características ligadas a la constitución cerebral y de disposiciones genéticas de las
personas, y son más resistentes al entrenamiento que las variables medidas por los tests de logro o
habilidades desarrolladas
Matrices Progresivas de Raven, mide tres factores cognitivos (percepción,razonamiento analógico y
capacidad espacial) y que debería complementarse con una medida del razonamiento verbal.
Las escalas más utilizadas para la medición de la inteligencia en nuestro medio son las elaboradas por David Wechsler.
Todas las escalas de Wechsler comprenden subtests verbales y de ejecución
WISC-IV (Wechsler, 2005), para niños y adolescentes, y el WAIS-III (Wechsler, 1999), para
adultos
2. Normativas técnicas
Nota:
Para que un test pueda ser utilizado responsablemente es
necesario que cumpla con determinados estándares técnicos.
Confiabilidad
Nota:
En síntesis, cuanto mayor es la variabilidad entre las
medidas del mismo fenómeno en repetidas ocasiones tanto menor es la confiabilidad, y cuanto menor es la variabilidad mayor
la confiabilidad
El concepto de confiabilidad en la teoría clásica de los tests
Es importante diferenciar entre errores sistemáticos y aleatorios
Un instrumento que mide aptitudes para la matemática puede estar construido de tal manera que sus ítems sean poco comprensibles para un grupo social o etario determinado
Principales factores que afectan la confiabilidad
Nota:
Existen múltiples factores que afectan la confiabilidad de las
puntuaciones obtenidas mediante la aplicación de un test.
Factores internos
Factores externos
Contenido del test
Nota:
Al construir un test debe tenerse en cuenta que la elección de
los ítems, los materiales a través de los cuales estimulamos la
respuesta del individuo, y la formulación de las consignas pueden
ser una fuente de error aleatorio en la medición
Si consideramos a un test como un conjunto de indicadores operacionales de un rasgo o dominio de comportamiento
Tanto si el muestreo de contenido es sesgado, como si no es suficientemente extenso, los puntajes resultantes serán poco confiables
En general un número mayor de ítems del mismo tipo dará como resultado puntajes más confiables
Calificación
En un test existen otros factores que pueden influir negativamente en la confiabilidad
En los tests de opción múltiple pueden cometerse errores cuando la corrección es manual, tales como calificar accidentalmente algunas respuestas
correctas como erróneas y viceversa, o realizar mal la sumatoria de los respuestas clave o correctas
Administración
Es esencial examinar a todos los participantes en condiciones uniformes, estandarizada
Siempre es deseable que las instrucciones del test sean lo suficientemente claras y unívocas
La falta de consistencia en la administración de un test influirá en la estabilidad de las puntuaciones obtenidas por las personas medidas por ese test
Factores internos del examinado
La con- fiabilidad aumenta al incrementarse la variabilidad de las res- puestas y, por consiguiente, se recomienda que las muestras empleadas para verificar la confiabilidad de un test sean lo más heterogéneas posible en aquellas
características que generan diferencias entre las personas que la integran
Dimensiones de la confiabilidad
Si se pretende evaluar en qué grado el puntaje de un indi- viduo en un test
Es esperable que las puntuaciones obtenidas en los instrumentos de medición sean también
relativamente estables
Si se intenta conocer en que medida la elección de la muestra de ítems que componen la prueba resulta una fuente de
error en la medición
Esta dimensión de la confiabilidad alude al grado en que distintas partes o ítems del test miden el mismo constructo o dominio
estimar en qué grado la medición de un rasgo a través de un instrumento es independiente de la subjetividad
El método adecuado para verificar la confiabilidad ínter-examinadores es el acuerdo entre jueces.
Métodos para verificar la
confiabilidad
Test-retest:
Formas
equivalentes
Partición en
mitades
Métodos de covarianza de los
ítems
Acuerdo entre
examinadores
Confiabilidad y puntuaciones
individuales
El error estándar de medición se conceptualiza de manera diferente en el contexto de la teoría de
repuesta al ítem, adquiriendo un carácter condicional
Confiabilidad en la teoría de respuesta al ítem (TRI) y en los tests con referencia a criterio (TRC)
Nota:
Las pruebas construidas en base a la TRI también deben
asegurar la confiabilidad de sus puntuaciones.
El análisis de la consistencia interna desde la TCT se basa
en el análisis del funcionamiento de los ítems
Validez
. Fuentes de evidencia de
validez
Fuentes internas de
evidencia
Evidencia basada en el contenido del
test
Definición del dominio de conocimiento o comportamiento a
medir.
Identificación de expertos en ese
dominio
Juicio de los expertos acerca del grado en que el contenido del test es relevante y representativo del
dominio
Procedimiento estadístico para resumir los datos de la fase
precedente
Evidencia basada en la estructura interna del
test
Evidencia basada en el proceso de
respuesta
Fuentes externas de
evidencia
Evidencia
convergente-discriminante
Evidencia de las relaciones entre las puntuaciones del test y
criterios externos
Correlación bivariada con un
criterio
Correlación múltiple con un
criterio
Evidencia de las consecuencias de la aplicación de
tests
Utilidad de los tests en contextos de
clasificación
Propósitos de los
test:
1. Autoconocimiento
2.Clasificación
3.Evaluación de
programas de
intervención
4.Investigación
Generalización de la validez: el
meta-análisis
Nota:
El meta-análisis transforma los resultados estadísticos de investigaciones empíricas independientes a una métrica común,
provee una estimación simple de la fortaleza de la relación entre
determinadas variables y permite comprobar estadísticamente si
una serie de estudios.
Interpretación referida a
normas
Nota:
El resultado inicial de un test
es el puntaje bruto, directo u original que se obtiene por la sumatoria de las respuestas correctas
Muestra de
estandarización
Nota:
Cuando un test es susceptible de aplicación a grupos distintos y existen diferencias significativas entre ellos en la variable medida por el test, deben elaborarse baremos separados de modo que cada persona pueda ser comparada con su verdadero grupo de referencia.
Métodos de transformación de
puntuaciones
Nota:
Para interpretar comparativamente los resultados individuales de un test es necesario transformar las
puntuaciones directas en otras derivadas
Transformaciones
lineales
Una transformación es lineal cuando se obtiene una nueva escala de medición que respeta las
distancias entre las unidades de medida de la escala origina
Transformaciones no
lineales
Las transformaciones no lineales, a diferencia de las lineales, asumen una distribución a priori
(distribución normal, por ejemplo) que altera la forma de la distribución de los puntajes originales
Percentiles
Los percentiles expresan el porcentaje de personas, en un grupo de referencia, que queda por
debajo de una puntuación original determinada
Puntuación estándar normalizada
(zn)
Para facilitar la comparación de diferentes puntuaciones transformadas (puntajes z con percentiles,
por ejemplo), se suele recurrir a transformaciones no lineales que modifican la forma de
distribución de las puntuaciones originales, convirtiéndolas en una distribución normal.
Otros métodos de interpretación de
puntuaciones
Puntuaciones
ipsativas
Nota:
La interpretación referida a normas es la más utilizada, existen otras formas de interpretación de los puntajes originales de un test
Interpretación referida a
criterio
Nota:
Alternativa de interpretación de las puntuaciones consiste en compararlas con un criterio de logro u objetivo a
alcanzar, previamente especificado.
3. Construcción del
test
Nuestra exposición se concentrará en los métodos de construcción de tests propuestos por la
teoría clásica de los tests (TCT)
Definición del dominio
Nota:
un exhaustivo análisis conceptual del dominio o constructo a medir. Este análisis implica la selección y revisión de las teorías más relevantes, rigurosas y contemporáneas en relación con el constructo
que se pretende medir
Redacción de los
ítems
Redactar ítems congruentes con el objetivo de
medición
Evitar los ítems demasiados largos (de más de 20
vocablos
Evitar el uso de expresiones extremas (nunca, siempre,
todos).
Evitar las oraciones complejas con ambigüedades de
sentido
Evitar las frases con doble
negación
Utilizar el lenguaje más apropiado al nivel de maduración y educativo de la población meta de la
medición (Oesterlind, 1990).
Revisión de
expertos
Claridad semántica y corrección gramatical
Adecuación al nivel de comprensión de la población meta.
Congruencia con el constructo o dominio medido
Análisis factorial y de
ítems
Análisis
factorial
Análisis factorial exploratorio y confirmatorio
Tamaño de la
muestra
Factibilidad del análisis factorial
Métodos de extracción de factores
Número de factores a extraer
Rotación de factores
Interpretación de los factores
Algunas consideraciones finales
Análisis de ítems
ADAPTACIÓN DE TESTS A OTRAS CULTURAS
Por qué adaptar
tests:
El uso de un test en un contexto cultural diferente al original genera diversas dificultades. El idioma,
la familiaridad con los estímulos del test (ítems) y las diferentes características de las muestras de
estandarización son ejemplos de fuentes de posibles sesgos en la medición transcultural de
constructos psicológicos.
Existe sesgo en la medición cuando las diferencias individuales en las puntuaciones de un test no
reflejan las diferencias reales en un rasgo o habilidad
Fuentes de
sesgo
Sesgo de
constructo
Sesgo
metodológico
El sesgo de
muestra
El sesgo en el instrumento puede provenir de las caracte- rísticas del
test
sesgo metodológico es el de administración
Sesgo de
ítem
La influencia del
lenguaje
Nota:
demostró claramente cómo el idioma puede producir diferencias en el rendimiento en un test determinado y, por consiguiente, advierte sobre la inconveniencia de
utilizar baremos extranjeros
Métodos de
adaptación
Técnicas de traducción de un
test
Diseños experimentales para verificar la equivalencia de tests e ítems
Administración del test original y traducido a individuos bilingüe
Administración de la versión original del test y su traducción inversa a monolingües en el idioma original
Administración de la versión original a monolingües que hablan el idioma original y de la versión traducida a monolingües que hablan el idioma al que
ha sido traducido el test