Hasselhorn - Diagnostik und Evaluation

Beschreibung

Psychologie Karteikarten am Hasselhorn - Diagnostik und Evaluation, erstellt von Anna Backes am 07/08/2017.
Anna Backes
Karteikarten von Anna Backes, aktualisiert more than 1 year ago
Anna Backes
Erstellt von Anna Backes vor etwa 7 Jahre
22
1

Zusammenfassung der Ressource

Frage Antworten
Diagnostizieren = Tätigkeit des Beurteilens und Bewertens = Prozess der Diagnose Qualitätssicherung durch Bereitstellung geeigneter diagnostischer Werkzeuge
Diagnostische Werkzeuge Standardisierte Testverfahren, strukturierte Interviews, Checklisten, Verhaltensbeobachtungen
Diagnostische Expertise Kompetenz, eine Person zutreffend zu beurteilen > basale Kompetenz der Lehrenden!
Pygmalion-Effekt Phänomen, das den Schüler durch induzierte Leistungserwartungen aufblühen lässt
Diagnose =Bewertung bisher erbrachter Leistungen (Zensur) = bewertende Schlussfolgerung über eine Person/Sache/Institution im Rahmen eines vorgegebenen Systems/Katalogs
Prognose = Vorhersage/Einschätzung einer zukünftigen Entwicklung von Personen/Sachverhalten > erweist sich erst in Zukunft als richtig/falsch
Test = Systematisch & routinemäßig einsetzbares Verfahren zur Messung definierter Ausschnitte menschlichen Verhaltens > Feststellung des Ausprägungsgrades einer Eigenschaft / Vorhersage zukünftigen Verhaltens
Standardisierter Test (Definition) = Test bei dessen Entwicklung und Anwendung gewisse Standards einzuhalten sind > erhöht Objektivität > minimiert Fehleranfälligkeit > normiert an repräsentativen Stichproben
Standardisierter Test (Voraussetzungen) 1. Formelle Festlegung der Art der Testdurchführung/Testauswertung 2. Festlegung von Bewertungsnormen 3. Weitere Gütemerkmale
Konstruktion eines Schulleistungstests 1. Lernzielanalyse 2. Generieren von Testaufgaben a) Vorerprobung b) erste Testdurchführung c) Aufgaben- und Testanalyse d) Testvalidierung e) Testeichung
1. Lernzielanalyse (Schulleistungstest) Was soll geprüft werden? Festlegung der Items Wissen, Verstehen, Anwenden
2. Generieren von Testaufgaben (Schulleistungstest) Items sollen repräsentative Auswahl der im Unterricht verwendeten Lernaufgaben sein Zeit: Speed-Test / Power-Test
a) Vorerprobung (Schulleistungstest) - mit einigen Personen - Verständlichkeit/Eindeutigkeit der Aufgabenformulierungen prüfen - Durchführungspraktikabilität
b) Erste Testdurchführung (Schulleistungstest) - kleine Stichprobe (dreistellig) - Angemessenheit und Schwierigkeit der Aufgaben und Instruktionen
c) Aufgaben- und Testanalyse (Schulleistungstest) - Aufgabenschwierigkeit (Pi) - Trennschärfe - Aufgaben von leicht nach schwer anordnen (Motivation)
Aufgabenschwierigkeit (Pi) - gibt in Prozent an, wie viele Personen die Aufgabe richtig gelöst haben - mittlere Schwierigkeit wünschenswert: (Pi = 20 bis Pi = 80)
Trennschärfe = Indikator für Güte des Tests (>.30) - wird als Korrelationskoeffizient (r) angegeben -1: Fehlkonstruktion 0: wenig aussagekräftig (wird von starken und schwachen SuS gelöst) +1: anzusteben, Item erfasst etw. ähnliches wie Gesamttest
d) Testvalidierung (Schulleistungstest) = Normierung durch große repräsentative Stichprobe > Bewertungsnormen für Interpretation der Testwerte gewinnen (Prozentrangnormen)
Prozentrang = Gibt an, wie viel Prozent der Personen von der Eichstichprobe gleich viele oder weniger Testitems richtig gelöst haben - mittlerer Leistungsbereich: PRN differenzieren sehr stark - Extrembereiche: selbst größere Prozentränge machen kaum noch einen Unterschied
Prozentrangnormen = Vergleich der Abweichung eines individuellen Wertes vom Durchschnitt des Kollektivs >Zusammenfassung von Rohwerten zu Rohwertklassen Person hat Prozentrangnorm 40: ihre Leistung übertrifft 40 % der Vergleichsgruppe / 60 % der Vergleichsgruppe schneiden besser ab
Häufigkeitsverteilung absolute Häufigkeit = Anzahl der Personen, die einen bestimmten Testwert erreichen relative Häufigkeit = Prozentzahl der Personen, die einen bestimmten Testwert erreichen kumulative Häufigkeit = aufsummierte Häufigkeiten bis zu einem bestimmten Testwert
Maße der zentralen Tendenz Median Mittelwert Modalwert (Modus)
Maße der Variabilität Spannweite (Variationsbreite) Standardabweichung (s) = Summe der Abweichung aller Einzelwerte vom Gesamtmittelwert Varianz (s²)
Rohwert = Anzahl der richtig gelösten Aufgaben > zusammen mit dem Normwert lässt sich Position einer Person in Bezug auf Gesamtheit bestimmen
Normwerte z-Werte, IQ-Werte, T-Werte > normalverteilt > Vielfache der Standartabweichung > ineinander überführbar (Lineartransformation)
z-Werte Mittelwert 0 SD 1
IQ-Werte Mittelwert 100 SD 15
T-Werte Mittelwert 50 SD 10
Beobachteter Wert Schätzung des wahren Wertes
Wahrer Wert = stellt das Leistungsvermögen einer Person punktgenau dar > Beurteilung der Güte des beobachten Wertes durch Festlegung von (Vertrauens-)/Konfidenzintervallen
Vertrauens- / Konfidenzintervall = gibt Bereich an, innerhalb dessen mit festgelegter Irrtumswahrscheinlichkeit das wahre Leistungsvermögen einer Person liegt > wird umso kleiner, je weniger messfehlerbehaftet der Test / je kleiner die Irrtumswahrscheinlichkeit
Gütekriterien für diagnostisches Urteil Objektivität Reliabilität Validität Normierung Nebengütekriterien
Objektivität = Urteil ist unbeeinflusst wenn alle zum gleichen Ergebnis kommen Durchführungsobjektivität (standardisiert) Auswertungsobjektivität (Multiple Choice) Interpretationsobjektivität (Rohwert in Normwert umgewandelt)
Reliabilität (Definition und Axiome) = Zuverlässigkeit, Messgenauigkeit 1. Existenzaxiom: wahrer Wert (W) 2. Verknüpfungsaxiom: W + F (Fehlerwert) = X (beobachteter Wert) 3. Fehleraxiom: Messfehler treten zufällig auf und sind unabhängig von W > rWF = 0
Reliabilitätsbestimmung (Methoden) = Anteil der Varianz der wahren Werte wird an der Varianz der beobachteten Werte geschätzt Retest Paralleltest Interne Konsistenz
Retest-Reliabilität Verfahren wird nach wenigen Tagen/ Wochen wiederholt Einfachste Methode zur Genauigkeitsbestimmung Test-Retest-Korrelation wird als Reliabilitätskoeffizient interpretiert
Paralleltest-Reliabilität mind. zwei gleiche, parallele Testvarianten > Eine Gruppe erhält beide Testvarianten zur Bearbeitung > Korrelation bestimmt das Ausmaß der Übereinstimmung (Äquivalenz) Erhaltene Korrelationskoeffizient = Schätzwert für Reliabilität
Interne Konsistenz (Testhalbierungsmethode) Test besteht aus 2 gleichlangen Teilen > Beide Teile beanspruchen, das gleiche, zu beurteilende Merkmal einer Person zu messen > Korrelation zwischen beiden Teilen wird ermittelt (Testlänge wird berücksichtigt)
Interne Konsistenz (Homogenitätskoeffizient) = Testverfahren, bei dem jedes Item das gleiche, zu beurteilende Merkmal einer Person zu messen beansprucht > einzelne Aufgaben messen das gleiche (homogen)
Interne Konsistenz (Cronbachs Alpha Koeffizient)) = Koeffizient basiert auf der Korrelation aller Testteile untereinander > Verbreitetes Maß zur Bestimmung der inneren Konsistenz > Strenge Reliabilitätsprüfung durch Abschätzung der unteren Grenze der Messgenauigkeit
Validität = Gültigkeit > wie gut (Genauigkeit) wird genau jenes Merkmal erfasst, dass das Verfahren zu messen beansprucht Inhaltsvalidität Kriteriumsvalidität
Inhaltsvalidität - der zu beurteilende Bereich wird optimal repräsentiert - Bereich gilt als inhaltsvalide, wenn alle Experten der gleichen Meinung bezüglich der Eignung eines Tests zur Merkmalsmessung sind
Kriteriumsvalidität = von einem Testergebnis kann auf ein für diagnostische Entscheidungen relevantes Kriterium (Schulfähigkeit) geschlossen werden > Größere Überzeugungskraft als Inhaltsvalidität - Cronbach unterteilt Art der empirischen Validität in: 1. Konkurrente Validität: Zeitgleich erfasstes Kriterium 2. Prognotische Validität: zeitlich später beobachtbares Kriterium
Normierung Ist erfüllt, wenn zur Relativierung individueller Testergebnisse, Normen einer def. Population, anhand der Daten einer repräsentativen Eichstichprobe vorliegen
Nebengütekriterien Ökonomie: Kosten & Aufwand Nützlichkeit: Praktischer Bedarf Zumutbarkeit: Belastung der Person Unverfälschbarkeit: Durchschaubarkeit Fairness: Gleichberechtigung aller Personen
Bezugsnormen = Grundlage für die Bewertung einer gezeigten Leistung Soziale Individuelle Sachliche
Soziale Bezugsnorm Bewertung einer individuellen Leistung im Vergleich zu den Leistungen anderer + dauerhaft starke / schwache SuS werden erkennbar - allg. Lernzuwachs wird nicht beachtet
Individuelle Bezugsnorm Vergleich mit den individuellen Leistungen die zuvor gezeigt wurden + mehr Hoffnung auf Erfolg / Lernfreude + geringere Prüfungsangst + realistisches Zielsetzungsverhalten - nicht hilfreich für Selektionsentscheidungen
Sachliche Bezugsnorm Bewertung bezieht sich auf einen inhaltlich verankerten Leistungsstandard bestimmte Mindestkompetenzen sind erforderlich
Beobachtungsfehler - entstehen durch begrenztes Vermögen oder fehlenden guten Willen (geringe Sorgfalt, Müdigkeit, ...) > Objektivität des Urteils leidet
Milde-Effekt Beurteilungsfehler zu positives beurteilen durch positive Voreingenommenheit
Großzügigkeitsfehler Beurteilungsfehler alle werden günstiger Beurteilt, da der Bezug zur Ursache verloren gegangen ist
Halo- / Hof-Effekt Beurteilungsfehler Urteil wird von einer Eigenschaft negativ oder positiv beeinflusst bzw. verzerrt
Logischer Fehler Beurteilungsfehler Subtile Variante des Hof-Effekts; Fälschliche Annahme über den Zusammenhang zweier Merkmale
Tendenz zur Mitte Beurteilungsfehler meiden extremer Urteile, nur mittlere Bewertungen
Tendenz zu extremen Urteilen Beurteilungsfehler mittlere Bewertungen werden vermieden, Beurteiler überhöhen Unterschiede zw. Personen und verwenden Extrempunkte der Bewertungsskala
Komponenten der Urteilsgenauigkeit (Schrader & Helmke) 1. Niveaukomponente: Tendenz Klassenniveau eher zu über-/ unterschätzen 2. Differenzierungskomponente: Tendenz Streuung der SuS-Leistungen zu über/ -unterschätzen 3. Vergleichskomponente: unzutreffende Einschätzung der relativen Leistungsposition der einzelnen SuS innerhalb der Klasse
Welche Wirkungen haben Lehrerurteile? - Wertende Rückmeldung zu einer persönlichen Leistung geben - Sehr selbstwertrelevant - Erheblicher Einfluss auf Lernweise der SuS - Einfluss auf Lernmotivation
Beurteilungen müssen ... ... sich an einem individuellen Bezugsmaßstab orientieren ... zeitnah erfolgen ... so vermittelt werden, dass sie nicht entmutigen
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Klinische Psychologie Teil 1
Lisa Mariá Hchil
Klinische Psychologie Teil 2
Lisa Mariá Hchil
Eriksons Modell psychosexueller und psychosozialer Entwicklung im Kindes-, Jugend- und Erwachsenenalter
Lena S.
Allgemeine Psychologie
CharlotteSc
Pädagogik Abitur 2016: Freud
Lena S.
Gedächtnis
Nicole Girard
M1, Kurs 2: Einführung in die Forschungsmethoden - Unit 1 - Psychologie als eine empirische Wissenschaft: Warum brauchen wir Forschungsmethoden?
Chris Tho
Pädagogik Abitur 2016: Freud
Lena S.
Kapitel 1: Was macht Psychologie einzigartig?
bence-bartos
Biopsychologie (offizielle Fragen)
workitout4yourself
EC - Entwicklungspsychologie II - ultimativ
Lilly Payer