Zusammenfassung der Ressource
Grundlagen deskriptive Statistik
Anmerkungen:
- die deskriptive Statistik "beschreibtende Statistik" tut genau das - die beschreibt Daten in einer Weise, die sie für die schließende Statistik nutzbar macht. Grob gesagt "übersetzt" sie gesammelte Daten in verwertbare Zahlen.
- Population/Grundgesamtheit
Anmerkungen:
- Alle theoretischen oder tatsächlichen Träger des untersuchten Merkmals
- Stichprobe
Anmerkungen:
- Repräsentative Auswahl an Merkmalsträgern aus der Grundgesamtheit
- Merkmalsträger
Anmerkungen:
- Z.b Personen, Produkte, Tiere etc.
- Merkmal
Anmerkungen:
- Was genau wollen wir untersuchen? Alter, Einkommen, Größe, Durchmesser, Geschwindigkeit, Entfernung, Reaktionszeit etc.?
- Merkmalsausprägung
Anmerkungen:
- "wieviel" von dem Merkmal ist da. z.b. wie hoch ist das Einkommen? Wie alt ist der Mensch? Ist er männlich oder weiblich? Liegt eine Vorerkrankung vor oder nicht? Welche Farbe hat das Objekt? Wie groß ist es?
- Daten erheben
Anmerkungen:
- Z.b durch Befragung, Beobachtung, Messung etc.
- Daten
aufbereiten
Anmerkungen:
- Um sie statistisch verwerten zu können, z.b Häufigkeit auszählen bei nominalen Merkmalen
- Lage- und
Streumaße
bestimmen
Anmerkungen:
- Wie verteilen sich die erhobenen Werte? Liegen sie alle auf einer linearen Geraden? Gibt es Ausreißer? Gibt es "Muster" oder Auffälligkeiten die schon durch die Streuung oder Verteilung auffallen und näher untersucht werden können?
- Korrelation
Anmerkungen:
- Hängen verschiedene Merkmale (scheinbar) zusammen? Gibt es Wechselwirkungen? Gibt es zwischen Merkmal x und Merkmal y überhaupt irgendeinen Zusammenhang? VORSICHT: Korrelation ist keine Kausalität. Nur weil sich zwei Merkmale scheinbar zusammenhängend verhändern, müssen sie sich nicht gegenseitig beeinflussen. Der Einfluss kann z.B. auch von einem dritten Faktor kommen, den wir gar nicht untersucht haben oder der Zusammenhang nur scheinbar sein (Scheinkorrelation)
- Regression
- -> schließende Statistik
- Standardabweichung, Varianz,
Mittelwerte, Median etc.
bestimmen
Anmerkungen:
- Diese Rechenschritte braucht man später immer wieder einmal: Bestimmen der Standardabweichung s, der Varianz s², der Mittelwerte sowohl aus der Urliste als auch aus Häufigkeiten, später auch aus Klassen etc., Medianwert, Modalwert u.s.w.
- Metrisch
Anmerkungen:
- "mathematisch", Zahlen mit denen sich direkt rechnen lässt, Intervalle etc. wie z.B. Geschwindigkeit, Umfang, Alter, Anzahl, Gewicht
- Nominal
Anmerkungen:
- Merkmale, die mathematisch erst einmal nicht verwertbar sind, weil sie keinen direkten "Wert" transportieren wie z.B. (Haar-)Farben, Namen, Religionszugehörigkeit, Geschlecht, Parteipräferenz etc.
- Ordinal
Anmerkungen:
- Merkmale die eine "natürlich Ordnung" bilden wie z.B. Noten, militärische Ränge, Schulabschlüsse etc.
- Warum ist das wichtig?
Anmerkungen:
- Wie ein Merkmal skaliert ist ist ggf. ausschlaggebend dafür , wie und was man damit statistisch anstellen kann. Manche Merkmale, insbesondere nominalskalierte, müssen erst einmal in Zahlen "verwandelt" werden, zum Beispiel indem man ihre Häufigkeit auszählt. Vorher lässt sich damit nicht rechnen.
- diskret oder stetig
Anmerkungen:
- Ein Merkmal kann diskret oder stetig sein. Das ist wichtig, weil man mit diskreten Merkmalen ggf. andere Rechenwege beschreiten muss als mit stetigen Merkmalen.
diskret = eine abzählbare, endliche Anzahl an möglichen Merkmalswerten (Klassiker: Noten 1, 2, 3, 4, 5, 6)
stetig = überabzählbar/unendlich viele mögliche Merkmalswerte (Klassiker: Größe eines Menschen, Temperatur etc.)