Algunos los agrupan en: a) individuales o grupales; de ejecución o c)
basados en la teoría clásica o de respuesta al ítem. La clasificación
efectuada por Cronbach (1998) distinguió entre test de ejecución
máxima y medidas de ejecución o respuesta típica, según demande el
mayor rendimiento del examinado en sus respuestas (tests de
habilidades) o midan el comportamiento habitual sin requerir
respuestas correctas (inventarios de personalidad).
Test de ejecución máxima.
Demandan a los examinados, a que respondan de la forma
más eficiente que pueden frente a tareas problemáticas
miden diferencias individuales en el nivel de ejecución
máximo ante distintas tareas, cuando se intenta
realizarlas, aptitudes, habilidades e inteligencia.
Teoría de las inteligencias múltiples, estos test miden
preferentemente aptitudes relacionadas con los
requerimientos académicos de la cultura occidental.
En la actualidad, las escalas más utilizadas para la medición de
la inteligencia en nuestro medio son las elaboradas por David
Wechsler en 1939, con varias actualizaciones posteriores.
Test de Aptitudes Diferenciales (DAT), ofrece un
procedimiento integrado, científico y bien estandarizado
para medir las aptitudes de estudiantes de ambos sexos
para fines de orientación educacional y vocacional.
Test de comportamiento típico.
se evalúa el comportamiento habitual de los individuos, recurriendo
a distintas afirmaciones ante los cuales el examinado debe indicar su
nivel de acuerdo o agrado. comprenden las medidas de rasgos de
personalidad, intereses y actitudes, constructos afectivos y
motivacionales relacionados, como las creencias de autoeficacia.
ninguna respuesta puede ser calificada como correcta o incorrecta.
Escalas de autoeficacia: la teoría social cognitiva ha
destacado el papel de la autoeficacia, creencia en las propias
capacidades para realizar determinados cursos de acción.
Inventario de Intereses Vocacionales: han sido definidos como
perfiles de agrados y aversiones respecto a las actividades
relacionadas con carreras y ocupaciones. Nos ayudan a identificar
carreras u ocupaciones donde puede encontrar satisfacción.
Escalas de actitudes: las actitudes se refieren a predisposiciones
aprendidas para responder positiva o negativamente ante objetos
sociales particulares, es decir, tipos de personas, instituciones sociales
o situaciones. Las actitudes son tendencias individuales a reaccionar,
positiva o negativamente, frente a un valor social.
Inventario de rasgos de personalidad: El propósito
fundamental de medición de la personalidad es
describir a los individuos sobre la base de sus rasgos
de personalidad predominantes. Los rasgos de
personalidad se relacionan con la conducta típica de
las personas en su vida cotidiana, la personaliada
son tendencias afectivas básicas de una persona.
Inventario de habilidades sociales: definidas como el
conjunto de conductas que favorecen el desarrollo
social de la persona y por medio de las cuales esta
expresa sus sentimientos, actitudes, deseos,
opiniones o derechos de un modo adecuado a la
situación, respetando a los demás.
NORMAS TÉCNICAS
Su aplicación es importante en el
ámbito psicológico sobre todo clínico.
CONFIABILIAD: que tan constistente y
estable podría ser un instrumento de
medición de una prueba. Cuanto mayor sea
el error, menos confiables serán los
resultados en el proceso de medición.
exactitud o precisión de una medición, o el
grado en el cual las puntuaciones de un test
están libres de esos errores de medición.
Consistencia entre los puntajes de un test
obtenidos por los mismos individuos en
distintas ocasiones o entre diferentes conjunto
de ítems equivalentes (APA, 1999).
Según la teoría clásica de los test, la
Confiabilidad es una propiedad de las
puntuaciones del test, cuando este se
administra a una muestra específica y bajo
condiciones particulares (APA, 1999).
La confiabilidad de una prueba es definida
también como la consistencia de las puntuaciones
obtenidas por las mismas personas cuando se les
examina en distintas ocasiones con el mismo test,
con conjuntos equivalentes de reactivos o en
otras condiciones de examinación.
Ninguna prueba es un instrumento
perfectamente confiable, de ahí que
todas deban ser acompañadas por un
reporte de su confiabilidad.
Hay tantas variedades de
confiabilidad como condiciones que
afecten los resultados de la prueba
Factores que afectan
la confiabilidad
Dimensiones de la
confiabilidad
se relaciona con las diferentes
fuentes de error de medición y con
distintos métodos para identificarla
Métodos para verificar
la confiabilidad
Es necesario administrar el instrumento a una
muestra según el diseño de investigación
específico y, por otro lado, los datos que resulten
de tal aplicación deben ser analizados mediante
procedimientos apropiados.
Test–retest: consiste en administrar
un test en dos oportunidades a la
misma muestra de sujetos, con un
determinado intervalo entre las dos
administraciones, y calcular la
correlación entre los puntajes
obtenidos en la primer y segunda
vez.
Formas equivalentes: consiste en administrar dos formas
equivalentes de un test a un mismo grupo de individuos.
La administración de la segunda forma se
realiza transcurrida un tiempo a partir de la
administración de la primera forma, y posteriormente se
correlacionan los resultados obtenidos.
Partición en mitades: se administra el test en una ocasión a
una muestra de individuos y posteriormente se divide la
prueba en dos mitades comparables, obteniendo dos
puntuaciones para cada individuo. Finalmente se
correlacionan las puntuaciones correspondientes a ambas
mitades del test por miedo de un coeficiente de correlación.
Métodos de covarianza de los ítems: a partir de
una única aplicación del test a una muestra se
obtiene una estimación del grado de covarianza
de los ítems, utilizando como estadístico el
coeficiente alfa de Cronbach o la fórmula
alternativa de Kuder Richardson, cuando se
trabaja con ítems dicotómicos.
Acuerdo entre los examinadores: consiste
en administrar un test a una muestra, entregar los
resultados del test a un conjunto de jueces que los
puntuarán independientemente.
CONSTRUCCIÓN DE LOS TEST
los diversos tipos de test utilizan procedimientos de
construcción que difieren en algunos aspectos.
recomendaciones que ayuden a evitar
los errores más frecuentes:
A cada pregunta debe corresponderle una sola
respuesta. Las preguntas no deben formularse de forma
ambigua o dando lugar a varias respuestas válidas.
El contenido de la pregunta debe ser oportuno y
referirse sólo al objeto de nuestro estudio y a la
variable concreta que queremos investigar.
Las preguntas deberán formularse con
precisión debiendo tener controlado el
tipo de respuesta. Cada uno de los ítems
o preguntas debe evaluar un solo
aspecto o dimensión. Es conveniente
que no excedan de quince palabras.
La elaboración de las pruebas es un tema complejo que implica la aplicación de
principios establecidos; la obtención de una buena prueba no es una cuestión fortuita
sino la respuesta a diversos interrogantes como los que se describen a continuación:
Definición del dominio.
La construcción de un test requiere, un análisis conceptual del dominio o constructo a
medir, lo que implica la selección y revisión de las teorías más relevantes, rigurosas,
contemporáneas, en relación con el constructo que se pretende medir.
la construcción de una escala de medición de algún aspecto
del comportamiento humano requiere previamente un
exhaustivo análisis conceptual del dominio o rasgo a medir.
En la medición del rendimiento se pueden utilizar pruebas referidas
a criterios o referidas a normas. Los procedimientos de
construcción de las pruebas referidas a criterios difieren de
aquellos usados tradicionalmente en las pruebas de rendimiento.
En la construcción de una prueba con referencia a criterios, en cambio, no se realiza una tabla de especificaciones, sino que se
define y delimita el dominio de conductas correspondientes a cada objetivo. Para la especificación del dominio de conductas o
clase de tareas que el individuo debe realizar, está el esquema propuesto por Tornimbeni et al (2004):
Pautas para la Redacción de Items.
Revisión de expertos.
la mayoría de los autores recomiendan que los
ítems preliminares de un test sean revisados por
expertos en construcción de pruebas, en el
dominio o rasgo a medir y en el nivel de
comprensión de la población a la cual se apunta
con la prueba. Las tres características que los
expertos deben evaluar en cada ítem son:
Claridad semántica y corrección gramatical.
Adecuación de su dificultad al nivel educativo
y evolutivo de las personas.
Congruencia con el rasgo o dominio medido.
es el principal parámetro y se refiere al grado de consistencia
que debe existir entre un ítem particular y las metas
esenciales de la prueba dado que esto será un factor
posterior de confiabilidad y validez. A los jueces se les pide
que evalúen la calidad y consistencia de los ítems y se
descartan aquellos con puntuaciones medias más bajas y con
escaso grado de acuerdo, respectivamente.
Análisis factorial.
técnica estadística avanzada que permite
reducir las variables que representan un
constructo específico y que luego utiliza las
calificaciones de factores como variables
dependientes.
El análisis factorial es un método basado, por un lado, en el
concepto de coeficiente de correlación de Pearson y, por otro,
en el de unidad funcional, constituye en esencia un análisis
algebraico de las covariaciones cuya finalidad es poner al
descubierto el orden y la relación en que estas covariaciones
impliquen. La validación de un test se puede realizar con este
método a partir de datos exclusivamente experimentales.