Statistik ...
... hilft uns, Studien zu konzipieren, mit denen wir inhaltliche Fragen beantworten können
... dient zum Selbstzweck
... kann die Berücksichtigung Komplexität in Zusammenhängen nicht ermöglichen
... hilft uns, zu korrekten und genrealisierbaren wissenschaftlichen Aussagen zu gelangen
... ist abhängig von normativen Vorstellungen
... leistet keine Interpretation von Befunden
... kann auch missbraucht werden
Welche Aussagen zur Statistik stimmen?
Hypothesen werden erst nach der Durchführung statistischer Analyse aufgestellt
Mit den Daten dürfen nicht alle möglichen Analysen durchgeführt werden, bis sich ein plausibles "signifikantes" Ergebnis zeigt
Fälle/Variablen ausschließen bzw. Kontrollvariablen aufnehmen/ausschließen, bis sich das erwartete Ergebnis zeigt
Das Prüfen einer Hypothese anhand derselben Daten, die für die Formulierung der Hypothese verwendet wurden
Lagemaße ...
... geben einen ersten Eindruck über die zentrale Tendenz
... verdichten die Verteilung und fokussieren ein spezifisches Merkmal/herausstechende Ausprägung
... geben Auskunft der Abweichung der Daten vom Mittelwert an
... geben an, wie sich die Daten in Hinblick auf die verschiedenen Ausprägungen eines Merkmals verteilen
Streuungsmaß ...
... gibt einen ersten Eindruck über die zentrale Tendenz
... verdichtet die Verteilung und fokussiert ein spezifisches Merkmal/herausstechende Ausprägung
... gibt an, wie sich die Daten in Hinblick auf die verschiedenen Ausprägungen eines Merkmals verteilen
... gibt Auskunft der Abweichung der Daten vom Mittelwert an
Die Urliste ist die sortierte Gesamtheit/Liste aller erhobenen Daten.
Wie oft tritt eine Ausprägung i des Merkmals X in einer Stichprobe mit dem Umfang N auf?
relative Häufigkeit
absolute Häufigkeit
Die Statistische Verteilung ist die Gesamtheit aller Merkmalsausprägungen eines Merkmals in einer Stichprobe/GG
Wie kann die Gruppenmitte M(j) berechnet werden?
M(j) = 0,5 * (obere Grenze - untere Grenze)
M(j) = 0,5 * (obere Grenze + untere Grenze)
M(j) = (obere Grenze + untere Grenze) /2
M(j) = (obere Grenze - untere Grenze) /2
Welche Regeln gibt es bei der Gruppenbildung?
jede Ausprägung muss einer Klasse zugeordnet werden können
jede Ausprägung sollte mehreren Klassen zugeordnet werden können
optimal: 5-10 Gruppen
optimal: 1-5 Gruppen
Gruppenbreite möglichst konstant halten
Randklassen sollten gering besetzt werden
offene Klassen sind nicht schlimm, da sie später sowieso noch voll werden
Histogramm ...
... stellt Häufigkeiten in einzelnen Klassen flächengetreu dar
... Fläche = (Höhe + Breite) *2
... Fläche = Höhe * Breite
... für unterschiedliche Gruppenbreiten gilt eine andere Formel
Menschen äußern sich weniger wahrscheinlich in öffentlichen Situationen, wenn Mehrheitsmeinung gegen sie ist.
Verteilungen können ... sein
univariant
monovariant
bivariant
multivariant
duvariant
lovariant
Verteilungskennwerte
deskriptive Statistik
induktive Statistik
Maßzahlen für bereits erhobene Daten (Stichproben)
Maßzahlen für Grundgesamtheit
Streuungsmaße
Quartile
Standardabweichung
Modus
Median
Mittelwert
Varianz
Bereich
Minimum und Maximum
am häufigsten auftretender Wert
50% kleiner und 50% größer als Modus
VT: + schnell und einfach zu ermitteln, was ist Typisch
NT: - nicht sehr informationsreich, wenig aussagekräftig
NT: - ist ein Streuungsmaß
durchschnittliche Ausprägung aller Werte
50% kleiner, 50% größer als Median
Daten müssen nicht geordnet werden
bei geraden Zahlen keine "echte" Mitte, nur "rechnerische" Mitte zwischen beiden mittleren Zahlen
Wert, der am häufigsten vorkommt
empfindlich gegenüber Ausreißern
50% kleiner, 50% größer als Mittelwert
besonders geeignet für nominal- und ordinalskalierten Daten
nur bei intervallskalierte Daten möglich
Ordinal
Lageregeln:
Symmetrisch: Mittelwert = Median = Modus
Symmetrisch: Mittelwert ≠ Median ≠ Modus
Linkssteil/rechtsschief: Mittelwert > Median > Modus
Linksschief/rechtssteil: Mittelwert > Median > Modus
Linkssteil/rechtsschief: Mittelwert < Median < Modus
Linksschief/rechtssteil: Mittelwert < Median < Modus
Kurtosis
Positive Kurtosis: hellblau
Positive Kurtosis: rosa
Negative Kurtosis: lila
Normalverteilung: rosa
Normalverteilung: lila
Extreme Kurtosis: hellblau
Spannweite
Ausreißer: weiter als 1,5 Quartilsabstände vom 1. bzw. 4. Quartil entfernt
Ausreißer: weiter als 1,5 Quartilsabstände vom 1. bzw. 3. Quartil entfernt
Extremwerte: weiter als 3 Quartilsabstände vom 1. bzw. 3. Quartil entfernt
Extremwerte: weiter als 3 Quartilsabstände vom 1. bzw. 4. Quartil entfernt
Spannweite R = Xmax - Xmin
durchschnittliche Streuung der Ausprägung vom Merkmal um Mittelwert
mittlere quadratische Abweichung von Merkmalwert vom arithmetischen Mittel (Mittelwert)
Standardisierung
Verteilung wird in eine "neue" Verteilung transformiert
Mittelwert = 0
Mittelwert = 1
Standardabweichung = 1
Standardabweichung = 0
Man verändert den Maßstab
man verändert die Schiefe/Kurtosis
Z-Transformation: man nimmt jeden Wert und zieht davon den Mittelwert ab und teilt diesen durch die Standardabweichung
nicht jede Normalverteilung lässt sich durch die Z-Transformation in Standardnormalverteilung transformieren
SPSS
Statistical Product and Service Solution
Statistical Program and Service Solution
Software zur Verwaltung und statischer Auswertung von Daten
maßgeschneidert für Anforderungen der empirischen Sozialforschung
Datensatz (.sav) - Ausgabedatei (.spv) - Syntaxdatei (.sps)
Datensatz (.dav) - Ausgabedatei (.dpv) - Syntaxdatei (.dps)