Zusammenfassung der Ressource
Evaluación e investigación educativa.
Martínez Rizo,F y Santos
del Real, A. (2009)
- 1.1. Antecedentes de la evaluación
de aprendizajes en gran escala
- Los procedimientos tradicionales de evaluación, hoy todavía vigentes,
incluían las preguntas a responder de viva voz; la valoración de su
capacidad lectora escuchándolos leer en voz alta; la observación de su
desempeño cotidiano, individual o en grupo, por ejemplo pasando al
pizarrón, o revisando las tareas que debían hacerse en casa.
- En la medida en que llegaron alas escuelas niños de sectores menos
favorecidos, con la expansión del sistema educativo, aumentó también
la heterogeneidad de su nivel de rendimiento, y los estándares de
evaluación implícitos manejados por los docentes se diversificaron.
- Las metodologías de enseñanza, sin embargo, no se diversificaron en la misma medida para
atender las necesidades de cada grupo de alumnos, y los recursos que se dieron a las
escuelas, en lugar de jugar un papel compensatorio o de discriminación positiva,
contribuyeron a perpetuar las desigualdades, al ser menores para las escuelas que atienden
a los alumnos que tienen condiciones más desfavorables para el aprendizaje en el hogar.
- Surgió así la necesidad de desarrollar procedimientos que
permitieran medir el aprovechamiento escolar en forma
comparable en contextos diversos.
- Estados Unidos antes que en la mayor parte
del mundo (desde mediados del siglo XIX)
- pruebas de ortografía,
lectura y aritmética
- Durante la primera mitad del siglo XX
- se desarrolló la tecnología para construir instrumentos de
medición que permitan obtener resultados válidos y
confiables, dando lugar a la Teoría Clásica de las Pruebas
- las pruebas con referencia a un dominio o criterio, los
modelos de respuesta al reactivo, la teoría de la
generalizabilidad, las técnicas de equiparación, los diseños
matriciales, el uso de preguntas de respuesta construida, las
pruebas adaptativas por computadora, entre otros avances.
- También desde principios de la segunda mitad del siglo XX surgieron las
evaluaciones en gran escala en el plano internacional, con el desarrollo de las
primeras evaluaciones de matemáticas y luego de ciencias y otras áreas por parte de
la International Association for the Assessment of Educational Achievement (IEA).
- En nuestro país, con algunos antecedentes en educación superior en décadas
anteriores, fue sobre todo desde la de 1990 cuando este tipo de evaluaciones
comenzó a cobrar fuerza en el SEM, con las pruebas del Factor
Aprovechamiento Escolar del programa de estímulos de Carrera Magisterial y
las evaluaciones de los programas compensatorios apoyados por el BM.
- Por la misma época, el primer estudio del Laboratorio Latinoamericano
de Evaluación de la Calidad Educativa y, en forma incompleta, en el
Tercer Estudio Internacional de Matemáticas y Ciencias de la IEA, y
luego sobre todo con las pruebas PISA, que la OCDE, decidió emprender
en 1997, y cuya primera aplicación tuvo lugar en 2000.
- 1.2. Sentido, propósitos y principios de las
evaluaciones en gran escala
- Evaluaciones para acreditación y/o certificación.
- Evaluaciones para ordenar individuos o instituciones
- Evaluaciones para tomar decisiones blandas.
- Evaluaciones para la toma de decisiones institucionales duras.
- Evaluaciones para otorgar incentivos y/o sanciones individuales
- Evaluaciones para la rendición de cuentas
- 1.3. Implicaciones del propósito para el diseño de una evaluación
- Pruebas de selección: Las pruebas que se aplican a
los aspirantes a entrar a una carrera o institución,
implican las siguientes características:
- Atender la dimensión
predictiva de la validez
- Privilegiar habilidades
y no conocimientos
- No incluir preguntas de
dificultad muy baja y muy alta
- Pruebas de aprovechamiento: para ver en qué
medida manejan los conocimientos y las habilidades
estipuladas por los planes y programas de estudio
- Atender la dimensión concurrente de la validez
- Privilegiar contenidos alineados al currículo
- Incluir preguntas de todos los grados de dificultad
- ENLACE
- para que los maestros y los padres de familia de
alumnos pudieran tener una información sobre el
grado en que cada niño estaba alcanzando un nivel de
aprendizaje aceptable y para que se pudieran atender
las necesidades de apoyo de cada uno oportunamente
- el desconocimiento de los alcances y límites de las pruebas ENLACE ha hecho que
sus resultados se utilicen para propósitos para los que no son adecuados
- para valorar la calidad de una escuela solamente con
base en el puntaje promedio obtenido por sus alumnos
- aún más inadecuado, para valorar el desempeño de los maestros
- No se pretende negar que estos resultados, usados con cautela y junto con otros elementos, pueden
ser indicadores interesantes que contribuyan a formarse una idea adecuada de la calidad de
escuelas y maestros, pero no en la forma simplista en que está ocurriendo.
- que los maestros enseñen para la pruebas
- que algunas escuelas usen los resultados para campañas mercadotécnicas sin sustento sólido
- EXCALE
- informar sobre el aprendizaje que logran los alumnos del
sistema de educación básica como conjunto, no cada uno ni
cada escuela, así como identificar los factores más
importantes que favorecen o inhiben el aprendizaje, para
ofrecer elementos para las decisiones de política educativa.
- Muestrales
- Matriciales
- Criteriales
- Alineadas al currículo
- Con
- aplicaciones rigurosamente controladas
- preguntas cerradas y abiertas
- cuestionarios de contexto
- reportes de resultados que incluyen análisis complejos
- aplicaciones a un solo grado cada año, conformando un ciclo de cuatro años
- LLECE
- comparar el nivel de rendimiento de alumnos de educación primaria de los países de la región.
- PERCE
- El estudio implicó el desarrollo y aplicación a muestras
nacionales de pruebas de rendimiento en dos áreas:
lengua nacional (español o portugués) y matemáticas
- SERCE
- matemáticas, lenguaje (lectura y escritura) y
ciencias naturales (optativa) y se aplicó a
alumnos de 3° y 6° grados de primaria.
- PISA
- ofrecer un diagnóstico del sistema educativo o subsistemas como tales, para diseño de políticas, y
no dar resultados por alumno o por escuela
- representa el esfuerzo internacional más completo y riguroso realizado hasta la fecha para evaluar
el desempeño de los estudiantes y recabar información sobre los factores –individuales, familiares y
escolares—que pueden contribuir a explicar las diferencias de dicho desempeño
- los resultados se presentan principalmente de dos maneras: a) mediante la puntuación obtenida en
promedio por los estudiantes de un país o entidad y b) mediante los porcentajes de alumnos en cada
uno de varios niveles de desempeño.
- Los niveles de desempeño permiten juicios en relación con los niveles deseables, en términos de
adecuado o inadecuado, y no de mejor o peor. También se hacen otros análisis para explorar cómo
varían los resultados entre países y en cada uno; diferencias de resultados entre tipos de escuelas; y
la relación de los resultados con características de los alumnos, sus familias y las escuelas, que se
recogen mediante cuestionarios que se aplican junto con las pruebas.
- 2. La investigación sobre evaluación
- En primer lugar pueden mencionarse investigaciones sobre la forma misma en que se llevan a cabo
las evaluaciones, para tener elementos sólidos para apreciar objetivamente sus alcances y
limitaciones.
- En segundo lugar, investigaciones sobre la forma en que se difunden los resultados, sobre el grado
en que llegan a los destinatarios y, sobre todo, el grado en que son interpretados correctamente por
ellos.
- En tercer lugar, y derivados de lo anterior, estudios sobre el grado en que los resultados son
utilizados por los destinatarios para emprender acciones con base en ellos, y sobre la forma en que
esto se hace
- 3. Conclusión: reflexiones sobre el potencial de la investigación evaluativa
- 3.1. Evaluación en grande y pequeña escala
- En una perspectiva, las pruebas se conciben como la herramienta fundamental para evaluar la
calidad de la educación, por encima de otros medios, en especial de las evaluaciones que hacen los
maestros mismos, a los que se considera incapaces de hacer evaluaciones suficientemente
confiables
- Las pruebas pueden verse también como un medio entre otros, que puede aportar elementos
valiosos sobre algunos aspectos de la calidad educativa, pero siempre incompletos e insuficientes y
que, por lo tanto, es necesario que sus resultados se complementen con otros elementos, en
particular con los aportados por los maestros, cuyo papel se considera insustituible.
- De quienes experimentan tal insatisfacción, algunos tienen una visión simplista tanto de las causas
de la situación como de la forma de valorarla y corregirla.
- Los diagnósticos no toman en cuenta los diversos factores de las escuelas y su contexto que influyen
en la calidad
- Los medios de valorar ésta se reducen a la aplicación de pruebas de rendimiento, sin distinguir su
enfoque y nivel técnico
- Las estrategias para remediar la situación se reducen a asignar recursos a las escuelas según los
resultados de sus alumnos en las pruebas.
- opone a la postura que reduce y simplifica la evaluación educativa, identificándola con las pruebas
en gran escala
- las pruebas en gran escala como un medio útil para complementar el trabajo
de los maestros, pero no como un sustituto del mismo.
- Evaluar exige algo más: comparar el resultado de la medición con un punto de referencia que establezca lo
que se debería saber, para llegar a un juicio sobre lo adecuado o inadecuado del aprendizaje.