Evaluación e investigación educativa. Martínez Rizo,F y Santos del Real, A. (2009)

1.1. Antecedentes de la evaluación de aprendizajes en gran escala
1. Los procedimientos tradicionales de evaluación, hoy todavía vigentes, incluían las preguntas a responder de viva voz; la valoración de su capacidad lectora escuchándolos leer en voz alta; la observación de su desempeño cotidiano, individual o en grupo, por ejemplo pasando al pizarrón, o revisando las tareas que debían hacerse en casa.
2. En la medida en que llegaron alas escuelas niños de sectores menos favorecidos, con la expansión del sistema educativo, aumentó también la heterogeneidad de su nivel de rendimiento, y los estándares de evaluación implícitos manejados por los docentes se diversificaron.
3. Las metodologías de enseñanza, sin embargo, no se diversificaron en la misma medida para atender las necesidades de cada grupo de alumnos, y los recursos que se dieron a las escuelas, en lugar de jugar un papel compensatorio o de discriminación positiva, contribuyeron a perpetuar las desigualdades, al ser menores para las escuelas que atienden a los alumnos que tienen condiciones más desfavorables para el aprendizaje en el hogar.
  1. Surgió así la necesidad de desarrollar procedimientos que permitieran medir el aprovechamiento escolar en forma comparable en contextos diversos.
    1. Estados Unidos antes que en la mayor parte del mundo (desde mediados del siglo XIX)
      1. pruebas de ortografía, lectura y aritmética
      2. Durante la primera mitad del siglo XX
        se desarrolló la tecnología para construir instrumentos de medición que permitan obtener resultados válidos y confiables, dando lugar a la Teoría Clásica de las Pruebas
        las pruebas con referencia a un dominio o criterio, los modelos de respuesta al reactivo, la teoría de la generalizabilidad, las técnicas de equiparación, los diseños matriciales, el uso de preguntas de respuesta construida, las pruebas adaptativas por computadora, entre otros avances.
        También desde principios de la segunda mitad del siglo XX surgieron las evaluaciones en gran escala en el plano internacional, con el desarrollo de las primeras evaluaciones de matemáticas y luego de ciencias y otras áreas por parte de la International Association for the Assessment of Educational Achievement (IEA).
  2. En nuestro país, con algunos antecedentes en educación superior en décadas anteriores, fue sobre todo desde la de 1990 cuando este tipo de evaluaciones comenzó a cobrar fuerza en el SEM, con las pruebas del Factor Aprovechamiento Escolar del programa de estímulos de Carrera Magisterial y las evaluaciones de los programas compensatorios apoyados por el BM.
    1. Por la misma época, el primer estudio del Laboratorio Latinoamericano de Evaluación de la Calidad Educativa y, en forma incompleta, en el Tercer Estudio Internacional de Matemáticas y Ciencias de la IEA, y luego sobre todo con las pruebas PISA, que la OCDE, decidió emprender en 1997, y cuya primera aplicación tuvo lugar en 2000.
1.2. Sentido, propósitos y principios de las evaluaciones en gran escala
1. Evaluaciones para acreditación y/o certificación.
2. Evaluaciones para ordenar individuos o instituciones
3. Evaluaciones para tomar decisiones blandas.
4. Evaluaciones para la toma de decisiones institucionales duras.
5. Evaluaciones para otorgar incentivos y/o sanciones individuales
6. Evaluaciones para la rendición de cuentas
1.3. Implicaciones del propósito para el diseño de una evaluación
1. Pruebas de selección: Las pruebas que se aplican a los aspirantes a entrar a una carrera o institución, implican las siguientes características:
  1. Atender la dimensión predictiva de la validez
  2. Privilegiar habilidades y no conocimientos
  3. No incluir preguntas de dificultad muy baja y muy alta
2. Pruebas de aprovechamiento: para ver en qué medida manejan los conocimientos y las habilidades estipuladas por los planes y programas de estudio
  1. Atender la dimensión concurrente de la validez
  2. Privilegiar contenidos alineados al currículo
  3. Incluir preguntas de todos los grados de dificultad
3. ENLACE
  1. para que los maestros y los padres de familia de alumnos pudieran tener una información sobre el grado en que cada niño estaba alcanzando un nivel de aprendizaje aceptable y para que se pudieran atender las necesidades de apoyo de cada uno oportunamente
    1. el desconocimiento de los alcances y límites de las pruebas ENLACE ha hecho que sus resultados se utilicen para propósitos para los que no son adecuados
      1. para valorar la calidad de una escuela solamente con base en el puntaje promedio obtenido por sus alumnos
      2. aún más inadecuado, para valorar el desempeño de los maestros
      3. No se pretende negar que estos resultados, usados con cautela y junto con otros elementos, pueden ser indicadores interesantes que contribuyan a formarse una idea adecuada de la calidad de escuelas y maestros, pero no en la forma simplista en que está ocurriendo.
      4. que los maestros enseñen para la pruebas
      5. que algunas escuelas usen los resultados para campañas mercadotécnicas sin sustento sólido
4. EXCALE
  1. informar sobre el aprendizaje que logran los alumnos del sistema de educación básica como conjunto, no cada uno ni cada escuela, así como identificar los factores más importantes que favorecen o inhiben el aprendizaje, para ofrecer elementos para las decisiones de política educativa.
  2. Muestrales
  3. Matriciales
  4. Criteriales
  5. Alineadas al currículo
  6. Con
    1. aplicaciones rigurosamente controladas
    2. preguntas cerradas y abiertas
    3. cuestionarios de contexto
    4. reportes de resultados que incluyen análisis complejos
    5. aplicaciones a un solo grado cada año, conformando un ciclo de cuatro años
5. LLECE
  1. comparar el nivel de rendimiento de alumnos de educación primaria de los países de la región.
    1. PERCE
      1. El estudio implicó el desarrollo y aplicación a muestras nacionales de pruebas de rendimiento en dos áreas: lengua nacional (español o portugués) y matemáticas
    2. SERCE
      1. matemáticas, lenguaje (lectura y escritura) y ciencias naturales (optativa) y se aplicó a alumnos de 3° y 6° grados de primaria.
6. PISA
  1. ofrecer un diagnóstico del sistema educativo o subsistemas como tales, para diseño de políticas, y no dar resultados por alumno o por escuela
  2. representa el esfuerzo internacional más completo y riguroso realizado hasta la fecha para evaluar el desempeño de los estudiantes y recabar información sobre los factores –individuales, familiares y escolares—que pueden contribuir a explicar las diferencias de dicho desempeño
  3. los resultados se presentan principalmente de dos maneras: a) mediante la puntuación obtenida en promedio por los estudiantes de un país o entidad y b) mediante los porcentajes de alumnos en cada uno de varios niveles de desempeño.
    1. Los niveles de desempeño permiten juicios en relación con los niveles deseables, en términos de adecuado o inadecuado, y no de mejor o peor. También se hacen otros análisis para explorar cómo varían los resultados entre países y en cada uno; diferencias de resultados entre tipos de escuelas; y la relación de los resultados con características de los alumnos, sus familias y las escuelas, que se recogen mediante cuestionarios que se aplican junto con las pruebas.
2. La investigación sobre evaluación
1. En primer lugar pueden mencionarse investigaciones sobre la forma misma en que se llevan a cabo las evaluaciones, para tener elementos sólidos para apreciar objetivamente sus alcances y limitaciones.
2. En segundo lugar, investigaciones sobre la forma en que se difunden los resultados, sobre el grado en que llegan a los destinatarios y, sobre todo, el grado en que son interpretados correctamente por ellos.
3. En tercer lugar, y derivados de lo anterior, estudios sobre el grado en que los resultados son utilizados por los destinatarios para emprender acciones con base en ellos, y sobre la forma en que esto se hace
3. Conclusión: reflexiones sobre el potencial de la investigación evaluativa
1. 3.1. Evaluación en grande y pequeña escala
  1. En una perspectiva, las pruebas se conciben como la herramienta fundamental para evaluar la calidad de la educación, por encima de otros medios, en especial de las evaluaciones que hacen los maestros mismos, a los que se considera incapaces de hacer evaluaciones suficientemente confiables
  2. Las pruebas pueden verse también como un medio entre otros, que puede aportar elementos valiosos sobre algunos aspectos de la calidad educativa, pero siempre incompletos e insuficientes y que, por lo tanto, es necesario que sus resultados se complementen con otros elementos, en particular con los aportados por los maestros, cuyo papel se considera insustituible.
  3. De quienes experimentan tal insatisfacción, algunos tienen una visión simplista tanto de las causas de la situación como de la forma de valorarla y corregirla.
    1. Los diagnósticos no toman en cuenta los diversos factores de las escuelas y su contexto que influyen en la calidad
    2. Los medios de valorar ésta se reducen a la aplicación de pruebas de rendimiento, sin distinguir su enfoque y nivel técnico
    3. Las estrategias para remediar la situación se reducen a asignar recursos a las escuelas según los resultados de sus alumnos en las pruebas.
2. opone a la postura que reduce y simplifica la evaluación educativa, identificándola con las pruebas en gran escala
3. las pruebas en gran escala como un medio útil para complementar el trabajo de los maestros, pero no como un sustituto del mismo.
4. Evaluar exige algo más: comparar el resultado de la medición con un punto de referencia que establezca lo que se debería saber, para llegar a un juicio sobre lo adecuado o inadecuado del aprendizaje.

Nächster

Evaluación e investigación educativa. Martínez Rizo,F y Santos del Real, A. (2009)

Beschreibung

Zusammenfassung der Ressource

ähnlicher Inhalt

	Erstellt von dragon.rojo.618 vor fast 10 Jahre