Question | Answer |
Grundgesamtheit | Menge gleichartiger Objekte, an denen (mindestens) eine Eigenschaft untersucht werden soll GG genau definieren, d.h. räumlich und zeitlich abgrenzen |
Merkmal (Variable) | die zu untersuchende Eigenschaft |
(Merkmals-)Ausprägung | Werte, die das Merkmal annehmen kann |
Untersuchungseinheit | ein Objekt aus der Grundgesamtheit |
Stichprobe | Teilmenge der Grundgesamtheit, an denen das/die Merkmal(e) gemessen werden |
nominal | mögliche Mermalsausprägung; Skalenmaß; keine natürliche Reihenfolge der Skalenwerte, z.B. Parteien, Berufe, Familienstand, Farben |
ordinal | mögliche Merkmalsausprägung; Skalenmaß; Rangfolge vorhanden, aber keine Zahlenverhältnisse oder Abstände interpretierbar, z.B. Platzierungen, Schulnoten, Rankings |
kardinal (metrisch) | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen --> diskret/stetig |
diskret | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen; nur endlich viele verschiedene Ausprägungen möglich, z.B. Anzahl, Alter |
stetig | mögliche Merkmalsausprägung; Skalenmaß; Skala der reellen Zahlen; beliebige Ausprägungen in einem bestimmten Bereich möglich, z.B. Länge, Gewicht, Zeit, Kapital Bemerkung: Alle gemessenen Daten sind streng genommen diskret (endliche Messgenauigkeit), werden aber streng mmodelliert |
Mittelwert (arithmetisches Mittel) | |
order statistics | x von (k)=k-te Ordnungsstatisik |
Median |
Image:
Formel_Median (image/png)
|
Median | tatsächlicher mittlerer Wert der Stichprobe; Eindimensionales Maß; Median ist wesentlich weniger anfällig für Fehler in den Daten (Robustheit) Schreibweisen: "Der Median beträgt..." "Die durchschnittliche Körpergröße beträgt..." "Die mediane körpergröße beträgt..." !!! nicht: "Die mittlere Körpergröße beträgt..:" !!! |
Hodges-Lehmann-Mittelwert | Eindimensionales Maß; der Median der Mittelwerte aller Paare von Beobachtungen |
gewichtetes arithmetisches Mittel |
Image:
gew_arit_mittel (image/png)
|
gewichtetes arithmetisches Mittel | Eindimensionales Maß ...ist sinnvoll, wenn die Daten selbst Mittelwerte von unterschiedlich großen Gruppen sind |
Geometrisches Mittel |
Image:
geom_mittel (image/png)
|
geometrisches Mittel | Eindimensionales Maß ...ist sinnvoll für positive Werte, z.B. Wachstumsraten |
harmonisches Mittel | Eindimensionales Maß ...ist sinnvoll, z.B. für Geschwindigkeiten |
harmonisches Mittel |
Image:
harm_mittel (image/png)
|
Modalwert | Eindimensionales Maß (der am häufigsten auftretende Wert) ...ist sinnvoll bei nominalen, ordinalen Skalen, oder diskret verteilten Merkmalen mit wenig verschiedenen möglichen Ausprägungen, z.B. Schulnoten |
Mittelwert (arithmetisches Mittel) | Eindimensionales Maß |
Standardabweichung | Streuungsmaß; (am häufigsten verwendet) |
Standardabweichung |
Image:
standardabwe (image/png)
|
Varianz | Streuungsmaß; Maß für die mittlere quadratische Abweichung vom Mittelwert |
Varianz |
Image:
varianz (image/png)
|
Ginis mittlere Differenz | Streuungsmaß; Mittelwert aller paarweisen Abstände der Daten |
Median der absoluten Abstände (vom Median) | Streuungsmaß; (ähnlich wie Median sehr gute Robustheitseigenschaften) |
Interquartilsabstand | Streuungsmaß; |
Histogramm | graphische Zusammenfassung eindimensionaler Daten; Klassen werden entlang der x-Achse aufgetragen; über jeder Klasse wird eine Säule gezeichnet (keine Lücke zwischen den Säulen); die Höhe der Säule gibt Anzahl der Beobachtungen in der Klasse an für stetige Merkmale (oder diskreten mit vielen Ausprägungen) |
Klassenbreite | graphische Zusammenfassung eindimensionaler Daten; ...nach Sturges ...nach Scott ...nach Freedman & Diaconis |
Balkendiagramm | graphische Zusammenfassung eindimensionaler Daten; für Merkmale mit wenigen Ausprägungen (nominal, ordinal, diskret) |
Boxplot | graphische Zusammenfassung eindimensionaler Daten; ...fasst viele Kenngrößen und Charakteristiken eines Datensatzes zusammen (Median, oberes u. unteres Quartil, IDA) ...macht Ausreißer, Symmetrie/Schiefe, Wölbung deutlich wird häufig verwendet, um Datensätze miteinander zu vergleichen |
Lineare Regression | zweidimensionaler Datensatz; ein Merkmal hängt ungefähr (im Mittel) linear von einem anderen ab |
Korrelationskoeffizient | zweidimensionaler Datensatz; |
Kovarianz | Maß für die Abhängigkeit zweier Merkmale, ist aber alleine wenig aussagekräftig, denn sie hängt von der Streuung ab |
Want to create your own Flashcards for free with GoConqr? Learn more.