die deskriptive Statistik "beschreibtende Statistik" tut genau das - die beschreibt Daten in einer Weise, die sie für die schließende Statistik nutzbar macht. Grob gesagt "übersetzt" sie gesammelte Daten in verwertbare Zahlen.
Population/Grundgesamtheit
Nota:
Alle theoretischen oder tatsächlichen Träger des untersuchten Merkmals
Stichprobe
Nota:
Repräsentative Auswahl an Merkmalsträgern aus der Grundgesamtheit
Merkmalsträger
Nota:
Z.b Personen, Produkte, Tiere etc.
Merkmal
Nota:
Was genau wollen wir untersuchen? Alter, Einkommen, Größe, Durchmesser, Geschwindigkeit, Entfernung, Reaktionszeit etc.?
Merkmalsausprägung
Nota:
"wieviel" von dem Merkmal ist da. z.b. wie hoch ist das Einkommen? Wie alt ist der Mensch? Ist er männlich oder weiblich? Liegt eine Vorerkrankung vor oder nicht? Welche Farbe hat das Objekt? Wie groß ist es?
Daten erheben
Nota:
Z.b durch Befragung, Beobachtung, Messung etc.
Daten
aufbereiten
Nota:
Um sie statistisch verwerten zu können, z.b Häufigkeit auszählen bei nominalen Merkmalen
Lage- und
Streumaße
bestimmen
Nota:
Wie verteilen sich die erhobenen Werte? Liegen sie alle auf einer linearen Geraden? Gibt es Ausreißer? Gibt es "Muster" oder Auffälligkeiten die schon durch die Streuung oder Verteilung auffallen und näher untersucht werden können?
Korrelation
Nota:
Hängen verschiedene Merkmale (scheinbar) zusammen? Gibt es Wechselwirkungen? Gibt es zwischen Merkmal x und Merkmal y überhaupt irgendeinen Zusammenhang? VORSICHT: Korrelation ist keine Kausalität. Nur weil sich zwei Merkmale scheinbar zusammenhängend verhändern, müssen sie sich nicht gegenseitig beeinflussen. Der Einfluss kann z.B. auch von einem dritten Faktor kommen, den wir gar nicht untersucht haben oder der Zusammenhang nur scheinbar sein (Scheinkorrelation)
Regression
-> schließende Statistik
Standardabweichung, Varianz,
Mittelwerte, Median etc.
bestimmen
Nota:
Diese Rechenschritte braucht man später immer wieder einmal: Bestimmen der Standardabweichung s, der Varianz s², der Mittelwerte sowohl aus der Urliste als auch aus Häufigkeiten, später auch aus Klassen etc., Medianwert, Modalwert u.s.w.
Metrisch
Nota:
"mathematisch", Zahlen mit denen sich direkt rechnen lässt, Intervalle etc. wie z.B. Geschwindigkeit, Umfang, Alter, Anzahl, Gewicht
Nominal
Nota:
Merkmale, die mathematisch erst einmal nicht verwertbar sind, weil sie keinen direkten "Wert" transportieren wie z.B. (Haar-)Farben, Namen, Religionszugehörigkeit, Geschlecht, Parteipräferenz etc.
Ordinal
Nota:
Merkmale die eine "natürlich Ordnung" bilden wie z.B. Noten, militärische Ränge, Schulabschlüsse etc.
Warum ist das wichtig?
Nota:
Wie ein Merkmal skaliert ist ist ggf. ausschlaggebend dafür , wie und was man damit statistisch anstellen kann. Manche Merkmale, insbesondere nominalskalierte, müssen erst einmal in Zahlen "verwandelt" werden, zum Beispiel indem man ihre Häufigkeit auszählt. Vorher lässt sich damit nicht rechnen.
diskret oder stetig
Nota:
Ein Merkmal kann diskret oder stetig sein. Das ist wichtig, weil man mit diskreten Merkmalen ggf. andere Rechenwege beschreiten muss als mit stetigen Merkmalen.
diskret = eine abzählbare, endliche Anzahl an möglichen Merkmalswerten (Klassiker: Noten 1, 2, 3, 4, 5, 6)
stetig = überabzählbar/unendlich viele mögliche Merkmalswerte (Klassiker: Größe eines Menschen, Temperatur etc.)