Zusammenfassung der Ressource
PSICOMETRÍA.
- 1. CLASIFICACIÓN DE LOS
TEST.
- Test de ejecución máxima (inteligencia, aptitudes y habilidades). Demandan a los examinados, que
respondan de la forma más eficiente que pueden frente a tareas problemáticas.
- ¿Qué miden los test de ejecución
máxima?
- Miden diferencias individuales en el nivel de ejecución máximo ante distintas tareas, cuando se intenta
realizarlas (Nunnally, 1991). Esto significa que los desempeños solamente pueden medirse cuando las
personas están motivadas para realizar una tarea de la mejor manera posible. Se incluyen variables
relacionadas, tales como las aptitudes, las habilidades y la inteligencia.
- Un test que se considera un indicador adecuado de g es el de Matrices Progresivas de Raven (1993).
Las matrices de Raven se consideran las mejores pruebas de inteligencia general g no verbal. Estas
matrices miden un concepto muy general del funcionamiento intelectual.
- Para Raven la variable fundamental o rasgo latente según terminología contemporánea, es el
razonamiento analógico abstracto. Hay varias formas de matrices progresivas de Raven (MPR), que
incluyen a las matrices progresivas coloreadas (MPC), matrices progresivas estándar (MPE), y las
matrices progresivas avanzadas (MPA).
- Howard Gardner (1994, 1999) efectuó una crítica radical al modelo de inteligencia general con su
“Teoría de las inteligencias múltiples”. Para Gardner los test miden preferentemente aptitudes
relacionadas con los requerimientos académicos de la cultura occidental.
- Gardner afirma que existen diferentes tipos de inteligencia, que actúan de forma independiente y que
en cada individuo presentan combinaciones distintas entre sí que dan razón cómo las personas son
diferentes y adoptan roles diversos en la vida profesional.
- Las escalas más utilizadas para la medición de la inteligencia en nuestro medio son las elaboradas por
David Wechsler en 1939, con varias actualizaciones posteriores.
- La primera versión de la escala se publicó en 1939 con el nombre «Escala de Inteligencia Wechsler-
Bellevue». Posteriormente, se publicaron los formatos WPPSI para niños de 4-6 años y WISC para
edades comprendidas entre 6 y 16 años.
- Wechsler Intelligence Scale for Children-Revised (WISC-R), ha sido adaptada por TEA con el nombre
Escala de Wechsler para Niños Revisada (WISC-R). Su aplicación es individual y mide aspectos
cuantitativos y cualitativos. Ofrece puntuaciones típicas ponderadas por edades, para cada una de las
pruebas y cocientes intelectuales (CI), independientes para las escalas verbales, manipulativa y total.
- En las versiones actuales de las escalas de Wechsler los ítems están ordenados según los parámetros
de dificultad (Hogan, 2004).
- EL TEST DE APTITUDES DIFERENCIALES (DAT): Ofrece un procedimiento integrado, científico y bien
estandarizado para medir las aptitudes de estudiantes de ambos sexos para fines de orientación
educacional y vocacional. Representan un desarrollo lógico y constante progreso de la teoría y la
práctica de la medición psicológica. Otro ámbito relevante para el uso de los test de ejecución máxima
es la neuropsicología, que estudia las relaciones entre el cerebro y la conducta (Kolb y Wishaw, 1986).
- Test de comportamiento típico. En este tipo de test ninguna respuesta puede ser calificada como
correcta o incorrecta. Aquí se evalúa el comportamiento habitual de los individuos, recurriendo a
distintas afirmaciones ante los cuales el examinado debe indicar su nivel de acuerdo o agrado.
- Los test de respuesta típica comprenden las medidas de rasgos de personalidad, intereses y actitudes.
Así como de otros constructos afectivos y motivacionales relacionados, como las creencias de
autoeficacia (Cronbach, 1998).
- Los resultados de estos tests deben interpretarse con precaución y no debe ser el único criterio de
evaluación, utilizado para tomar decisiones clasificatorias o diagnósticas respecto a las personas.
- Escalas de autoeficacia: la teoría social cognitiva ha destacado el papel de la autoeficacia, percibida
entre las variables motivacionales y afectivas. Bandura (1997) define a la autoeficacia como la
creencia en las propias capacidades para realizar determinados cursos de acción.
- Inventario de Intereses Vocacionales: han sido definidos como perfiles de agrados y aversiones
respecto a las actividades relacionadas con carreras y ocupaciones. Los inventarios poco nos dicen
respecto al éxito académico u ocupacional que podrá alcanzar una persona, pero nos ayudan a
identificar carreras u ocupaciones donde puede encontrar satisfacción.
- Escalas de actitudes: las actitudes se refieren a predisposiciones aprendidas para responder positiva o
negativamente ante objetos sociales particulares, es decir, tipos de personas, instituciones sociales o
situaciones. Las actitudes son tendencias individuales a reaccionar, positiva o negativamente, frente a
un valor social.
- Inventario de rasgos de personalidad: la personalidad hace referencia a las tendencias afectivas
básicas de una persona. El propósito fundamental de medición de la personalidad es describir a los
individuos sobre la base de sus rasgos de personalidad predominantes. Los rasgos de personalidad se
relacionan con la conducta típica de las personas en su vida cotidiana, tales como el nivel de ansiedad
o amabilidad. Otros inventarios de personalidad de uso clínico miden un trastorno patológico
específico, como el Inventario de Depresión de Beck (1996).
- Inventario de habilidades sociales: otro desarrollo psicométrico contemporáneo es el de la medición
de habilidades sociales (HHSS). Las HHSS han sido definidas como el conjunto de conductas que
favorecen el desarrollo social de la persona y por medio de las cuales esta expresa sus sentimientos,
actitudes, deseos, opiniones o derechos de un modo adecuado a la situación, respetando la expresión
de esas conductas en los demás.
- 2. NORMAS TÉCNICAS.
- La confiabilidad puede entenderse como la exactitud o precisión de una medición, o el grado en el cual
las puntuaciones de un test están libres de esos errores de medición. Para la Asociación Americana de
Psicología, la confiabilidad significa la consistencia entre los puntajes de un test obtenidos por los
mismos individuos en distintas ocasiones o entre diferentes conjunto de ítems equivalentes (APA,
1999).
- Los diferentes métodos utilizados para evaluar la confiabilidad, utilizan el coeficiente de correlación
como estadístico fundamental. La confiabilidad no es una característica del test en sí mismo, según la
teoría clásica de los test, sino una propiedad de las puntuaciones del test, cuando este se administra a
una muestra específica y bajo condiciones particulares (APA, 1999).
- La confiabilidad de una prueba es definida también como la consistencia de las puntuaciones
obtenidas por las mismas personas cuando se les examina en distintas ocasiones con el mismo test,
con conjuntos equivalentes de reactivos o en otras condiciones de examinación.
- Ninguna prueba es un instrumento perfectamente confiable, de ahí que todas deban ser acompañadas
por un reporte de su confiabilidad. También es necesario especificar las características de la muestra
normativa, ya que la confiabilidad declarada caracteriza a la prueba cuando se aplica en condiciones
normales a personas similares a las que conformar la muestra normativa u original.
- Factores que afectan la confiabilidad.
- Dimensiones de la confiabilidad: Estabilidad, consistencia interna y Confiabilidad inter-examinadores.
- Test–retest: este método consiste en administrar un test en dos oportunidades a la misma muestra de
sujetos, con un determinado intervalo entre las dos administraciones, y calcular la correlación entre
los puntajes obtenidos en la primer y segunda vez.
- Formas equivalentes: consiste en administrar dos formas equivalentes de un test a un mismo grupo
de individuos. En el caso de que este método se utilice para verificar la estabilidad, la administración
de la segunda forma se realiza transcurrida un tiempo a partir de la administración de la primera
forma, y posteriormente se correlacionan los resultados obtenidos.
- Partición en mitades: se administra el test en una ocasión a una muestra de individuos y
posteriormente se divide la prueba en dos mitades comparables, obteniendo de esta manera dos
puntuaciones para cada individuo de la muestra. Finalmente se correlacionan las puntuaciones
correspondientes a ambas mitades del test por miedo de un coeficiente de correlación.
- Métodos de covarianza de los ítems: a partir de una única aplicación del test a una muestra se obtiene
una estimación del grado de covarianza de los ítems, utilizando como estadístico el coeficiente alfa de
Cronbach o la fórmula alternativa de Kuder Richardson, cuando se trabaja con ítems dicotómicos.
- Acuerdo entre los examinadores: el método consiste en administrar un test a una muestra, entregar
los resultados del test a un conjunto de jueces que los puntuarán independientemente.
- 3. CONSTRUCCIÓN DE LOS TEST.
- Delimitación del test.
- a. A cada pregunta debe corresponderle una sola respuesta. Las preguntas no deben formularse de
forma ambigua o dando lugar a varias respuestas válidas.
- b. El contenido de la pregunta debe ser oportuno y referirse sólo al objeto de nuestro estudio y a la
variable concreta que queremos investigar.
- c. Las preguntas deberán formularse con precisión debiendo tener controlado el tipo de respuesta.
Cada uno de los ítems o preguntas debe evaluar un solo aspecto o dimensión. Es conveniente que no
excedan de quince palabras.
- Las preguntas pueden clasificarse en abiertas y cerradas. Son dos tipos de pregunta en las que lo que
se indaga tiene que ver con la libertad de respuesta deseada.
- Definición del objetivo: se establece cuál o cuáles serán los objetivos que se evaluarán a través de la
prueba, por ejemplo, la habilidad de “comprensión”, que incluye aquellas conductas o respuestas que
se refieren únicamente a una comprensión de los mensajes literales contenidos en la comunicación.
- Descripción del objetivo: se define en términos de conductas observables el o los objetivos a ser
evaluados. En el ejemplo anterior se especificaría un objetivo de la habilidad de comprensión tal como
“ser capaz de analizar el propósito del autor y su punto de vista examinando una comunicación
escrita”.
- Especificación de las características de la situación de evaluación: se especifican todos aquellos
aspectos a tener en cuenta en la situación de evaluación, por ejemplo, en un texto de divulgación
científica, seleccionar el párrafo e identificar la oración donde se expresa la intención del autor.
- Características de la respuesta: se especifica cuál es la respuesta que se espera del sujeto, en este
caso, que seleccione de manera correcta el párrafo y la oración correspondiente.
- Redacción de los ítems.
- Según Tornimbeni et al. (2004) existen pautas convencionales para la redacción de ítems de prueba.
Con las siguientes recomendaciones: redactar ítems congruentes con el objetivo de medición y evitar
los ítems demasiado largos (de más de 20 vocablos), las oraciones complejas con ambigüedades de
sentido, las frases con dobles negaciones, el uso de expresiones extremas (nunca, siempre, todos) y
utilizar el lenguaje más apropiado al nivel de maduración y educativo de la población (Osterlind,
1990).
- Para Nunnally (1991) los dos errores más comunes en la redacción de ítems son: a) ambigüedad
(preguntas difusas que admiten varias respuestas) y b) trivialidad (centrarse en aspectos poco
importantes del rasgo o dominio en cuestión).
- Existen formatos de selección de respuesta y de construcción de respuesta, los primeros facilitan la
calificación automatizada y pueden aplicarse con facilidad a gran cantidad de evaluados. El formato
de selección de respuesta presenta una elección de respuestas y requiere la selección de una
alternativa. Existen tres tipos: los ítems de opción múltiple, los ítems de relación y los ítems de
verdadero/falso.
- Un reactivo de opción múltiple consta de tres elementos un enunciado o base del ítem, una alternativa
u opción correcta o clave y varias alternativas u opciones incorrectas llamadas distractores.
- Revisión de expertos.
- Es trascendente que los ítems preliminares sean revisados por jueces expertos. Tal como lo explica
Tornimbeni et al. (2004), la mayoría de los autores recomiendan que los ítems preliminares de un test
sean revisados por expertos en construcción de pruebas, en el dominio o rasgo a medir y en el nivel
de comprensión de la población a la cual se apunta con la prueba.
- Las tres características que los expertos deben evaluar en cada ítem son:
- a. Claridad semántica y corrección gramatical. b. Adecuación de su dificultad al nivel educativo y
evolutivo de las personas. c. Congruencia con el rasgo o dominio medido.
- Este último ítem es el principal parámetro y se refiere al grado de consistencia que debe existir entre
un ítem particular y las metas esenciales de la prueba dado que esto será un factor posterior de
confiabilidad y validez (Oesterlind, 1990). A los jueces se les pide que evalúen la calidad y consistencia
de los ítems y se descartan aquellos con puntuaciones medias más bajas y con escaso grado de
acuerdo, respectivamente. Se recomienda que los ítems seleccionados sean aquellos en que, al
menos, un 60% de los jueces coinciden (Herrera Rojas, 1993). Es útil también incluir preguntas que
demanden información cualitativa sobre los ítems lo que puede facilitar un mejoramiento en el
fracaso de algunos de ellos.
- Análisis factorial y de los
ítems.
- El Análisis factorial, es una técnica estadística avanzada que permite reducir las variables que
representan un constructo específico y que luego utiliza las calificaciones de factores como variables
dependientes. Spearman (1923) fue el primero en aplicar la técnica del análisis factorial para
investigar la estructura de la inteligencia y también para identificar las diferencias individuales a
través de los tests de inteligencia. A partir de la aplicación del análisis factorial.
- El análisis factorial es un método basado, por un lado, en el concepto de coeficiente de correlación de
Pearson y, por otro, en el de unidad funcional, constituye en esencia un análisis algebraico de las
covariaciones cuya finalidad es poner al descubierto el orden y la relación en que estas covariaciones
impliquen. La validación de un test se puede realizar con este método a partir de datos
exclusivamente experimentales. El análisis factorial es además el único método que ha permitido
construir, desde la perspectiva experimental, lo que es la psicología de las aptitudes.