Pregunta 1
Pregunta
Der Begriff Statistik:
-kommt von "Status" (lat.) "der Staat"
-"statista" (lat.) der Staatsmann
Pregunta 2
Pregunta
Wozu braucht man Statistik?
Respuesta
-
Die Statistik hilft uns, Studien zu konzipieren, mit denen wir inhaltliche Fragen beantworten können.
-
Die Statistik ist ein Selbstzweck.
-
Die Statistik ist Mittel zum Zweck, kein Selbstzweck.
-
Die Statistik ermöglicht es, Komplexität in Zusammenhängen zu berücksichtigen
-
Die Statistik hilft uns, zu korrekten und generalisierbaren wissenschaftlichen Aussagen zu gelangen!
-
Die Statistik ist abhängig von normativen Vorstellungen
-
Die Statisitk ist unabhängig von normativen Vorstellungen, was wir gut oder schlecht finden.
-
Statistik leistet keine Interpretation der Befunde
-
Statistik kann auch missbraucht werden
-
Statistik kann niemalls missbraucht werden
Pregunta 3
Pregunta
Gemäß der Theorie der Schweigespirale äußern sich Menschen weniger wahrscheinlich in öffentlichen Sitatuionen, wenn sie die Mehrheitsmeinung gegen sich sehen. Dies führt zu einem Spiraleffekt.
Pregunta 4
Pregunta
Die Theorie der Schweigespirale stammt von Noelle-Neuman, 1975
Pregunta 5
Pregunta
Hypothesen sollen bei der Statistik erst nach der Durchführung statistischer Analysen aufgestellt werden
Pregunta 6
Pregunta
Ein "DON´T" der Statistik ist es mit den Daten alle möglichen statistischen Analysen durchzuführen, bis sich ein halbwegs plausibles "signifikantes" Ergebnis zeigt
Pregunta 7
Pregunta
Es gibt deskriptive und induktive Statistik
Pregunta 8
Pregunta
Deskriptive und induktive Statistik!
Respuesta
-
Deskriptiv: beschreibende Statistik, ordnen, beschreibem von Daten und Zahlen mit z.B. Tabellen
-
Deskriptiv: schließende Statistik, Rückschlüsse von meinen erhobenen Daten (Stichproben) auf die Grundgesamtheit
-
Induktiv:beschreibende Statistik, ordnen, beschreibem von Daten und Zahlen mit z.B. Tabellen
-
Induktiv: schließende Statistik, Rückschlüsse von meinen erhobenen Daten (Stichproben) auf die Grundgesamtheit
Pregunta 9
Pregunta
Univariate, bivariate und multivariate Statistik!
Respuesta
-
univariate: Beschreibung einer einzelnen Variable z.B. Nutzung von Facebook
-
bivariate: Beschreibung eines Zusammenhanges zwischen 2 Variaten, z.B. Nutzung von Facebook und das Glauben von Fehlinformationen, wie hängt das zusammen?
-
multivariate: Beschreibung des Zusammenhanges von mehr als 2 Variaten, z.B. Wie erklärt sich das Glauben von Fehlinformationen in Abhängigkeit von verschiedenen Mediennutzungsquellen, des Vorwissens und der politischen Verbindung
Pregunta 10
Pregunta
Prädiktor Variable die etwas vorhersagt
Pregunta 11
Pregunta
Abhängige Variable: die von etwas abhängt z.B. Glauben von Fehlinformationen
Pregunta 12
Pregunta
Urliste ist eine sortierte Urliste z.B. nach Größe sortiert
Pregunta 13
Pregunta
Wie viel Menschen in Ö haben Angst sich mit Corona zu infizieren und wie stark weichen die Personen vom Mittelwert ab
ist ein typischces Beispiel fur ein Lagemaß
Pregunta 14
Pregunta
Haben Menschen Angst oder nicht vor Corona?
ist ein typisches Beispiel für eine Verteilung
Pregunta 15
Pregunta
Wie oft tritt eine Ausprägung i des Merkmals X in einer Stichprobe mit dem Umfang N auf?
ist die absolute Häufigkeit (fi)
Pregunta 16
Pregunta
Wie oft tritt eine Ausprägung i des Merkmals X im Verhältnis zur Gesamtstichproobe mit dem Umfang N auf?
ist die relative Häufigkeit (pi)
Pregunta 17
Pregunta
Regeln bei der Häufigkeitsverteilung (=Gruppenbildung)!!!
Respuesta
-
jede Ausprägung muss genau einer Klasse zugeordnet werden
-
jede Ausprägung muss mehr als einer Klasse zugeordnet werden
-
in der Regel sind 5-10 Gruppen ideal
-
in der Regel sind 6-12 Gruppen ideal
-
offene Klassen möglichst bevorzugen
-
offene Klassen möglichst vermeiden
-
Randklassen sollten gering besetzt sein
-
Möglichst Gruppenbreite konstant halten
Pregunta 18
Pregunta
Maßzahlen für bereits erhobene Daten (Stichproben) nennen wir Verteilungskennwerte (deskriptive Statistik)
Pregunta 19
Pregunta
Maßzahlen für die Grundgesamtheit nennen wir Verteilungsparameter (induktive Statistik)
Pregunta 20
Pregunta
Lagemaße geben Auskunft darüber, wie sich die Daten um den Schwerpunkt (Zentrum/zentrale Tendenz) verteilen = Wie unterschiedlich sind die Messwerte
Pregunta 21
Pregunta
Der Modus (auch Modalwert) ist der Wert einer Verteilung, der am häufigsten auftritt
Pregunta 22
Respuesta
-
Vorteil: schnell und einfach zu ermitteln, was ist typisch
-
Nachteil: sehr aufwendig zu ermitteln
-
Nachteil: nicht sehr informationsreich, wenig aussagekräftig (z.B. zwei Werte haben die gleiche Häufigkeit, Aussagekraft ist beschränkt)
-
Vorteil: hohe Aussagekraft, liefert viel Informationen über Daten
Pregunta 23
Pregunta
Der Modus ist ein Lagemaß
Pregunta 24
Respuesta
-
auch Md, x med
-
teilt die Verteilung in zwei gleich große Hälften
-
50% der Werte sind kleiner und 50% der Werte sind größer als der Median
-
ungruppierte Daten: Daten müssen zunächste der Größe nach geordnet werden, Dann ist der Median bei ungeraden Zahlen die Ausprägung des "mittleren" Wertes
-
Bei 9 Werten, ist der 5. Wert der Median
-
Z.B.
2,6, 12,15,16,20,22,30,35
ist 16 der Median
-
Bei geradem n gibt es keine echte Mitte, Der Median liegt dann genau in der rechnerischen Mitte zwischen den beiden Werten, die der Mitte der Verteilung am nächsten kommen.
-
bei 10 Werten liegt der Median zwischen dem 5. und dem 6. Wert
-
z.B.
2, 6, 12, 15, 16, 20, 23, 30, 35, 40
der Wert zwischen 16 und 20 ist der Median, also 18 ist der Median
Pregunta 25
Pregunta
Der Mittelwert, Durschnittswert oder Schwerpunkt der Verteilung ist die durchschnittliche Ausprägung aller Were
Pregunta 26
Respuesta
-
Nachteil: wenig stabil, andere Stichprobe = anderer Mittelwert
-
nur bei intervallskalierten Daten möglich
-
bei ordinalen und nominalskalierten Daten macht der Mittelwert keinen Sinn mehr
-
Mittelwert macht sowohl bei intervallskalierten, als auch bei ordinalen und nominalskalierten Daten Sinn
-
ist sehr empfindlich gegenüber Ausreißern
-
Ausreißer spielen fast keine Rolle
-
ein Ausreißer wäre z.B. jemand hatte 1000 Partner
Pregunta 27
Pregunta
Ein Säulendiagramm eignet sich nicht für die Darstellung von absoluten und relativen Häufigkeiten
Pregunta 28
Pregunta
Ein Balkendiagramm benutzt man bei relativen Häufigkeiten, bei sehr vielen Ausprägungen (Kategorien), sind solche Diagramme aber nicht aussagekräftig
Pregunta 29
Pregunta
Ein Kreisdiagramm, auch Tortendiagramm genannt hat ein Problem:
zu viele Ausprägungen = nicht mehr gut lesbar, desto größer die Fläche, desto häufiger tritt es auf, Prozentangaben nötig, da sonst sehr schwer zu interpretieren
Pregunta 30
Pregunta
Eine Randklasse wäre z.B. niedrigste oder höchste Einkommensgrenze
Pregunta 31
Pregunta
Zentrale Tendenz= wie viele Gipfel hat eine Verteilung?
Pregunta 32
Pregunta
Schiefe (Beschreibungsmöglichkeiten von Verteilungen)!
Respuesta
-
Maß für die Symmetrie der Verteilung
-
Maß für die Asymmetrie der Verteilung
-
Die Schiefe einer symmetrischen Verteilung hat den Wert null
-
Die Schiefe einer symmetrischen Verteilung hat den Wert eins
-
jede Verteilung die nicht symmetrisch ist heißt automatiscch schiefe Verteilung
-
linksschief, rechtsschief
Pregunta 33
Pregunta
Wölbung (Kurtosis) (Beschreibungsmöglichkeiten von Verteilungen)!
Respuesta
-
Ein Maß dafür, wie sich die Beobachtungen, um einen zentralen Punkt gruppieren
-
z.B. schmalgipflig/breitgipflig
-
wie spitz/gestaucht ist eine Verteilung?
Pregunta 34
Pregunta
Schiefe = 0 ist eine symmetrische Schiefe
Pregunta 35
Pregunta
Schiefe kleiner 0 = rechtssteile Verteilung
Schiefe größer 0 = linksseitige Verteilung
Pregunta 36
Pregunta
Die Kurtosis ist bei einer Normalverteilung niemals 0
Pregunta 37
Pregunta
positive Kurtosis: gruppieren sich stark um den Mittelwert, auch schmalgipflig genannt
negative Kurtosis: gruppieren sich die Beobachtungen weniger dicht, also breitgipflig zusammen
Pregunta 38
Pregunta
Spannweite/Range
Respuesta
-
Differenz vom größten und kleinsten vorkommenden Wert
-
Vorteil: schnell und einfach
-
Nachteil: aufwendig
-
Nachteil: sehr empfindlich gegenüber Ausreißern, informationsarm
-
Vorteil: kaum empfindlich gegenüber Ausreißern, viel Informationen
-
wichtig um zu überprüfen: Kann das stimmen?
Pregunta 39
Pregunta
Interquartilbreite/Interquartilabstand!
Respuesta
-
mittlere 50 %
-
man bestimmt sie indem man das dritte Quartil minus das erste Quartil rechnet
-
man bestimmt sie indem man das dritte Quartil plus das erste Quartil rechnet
-
Vorteil: wenig empfindlich gegenüber Ausreißern
-
Nachteil: ist sehr empfindlich gegenüber Ausreißern
-
Nachteil: informationsarm und nur sinnvoll für metrische Daten
-
Vorteil: viel Informatonen und für alle Daten möglich (intervall, metrisch, ordinal...)
Pregunta 40
Pregunta
Ausreißer sind Daten die mehr als 1,5 Interquartilabstände vom ersten bzw.. dritten Quartil entfernt liegen
Pregunta 41
Pregunta
Extremwerte sind extremer als Ausreißer, da sie 3 Interquartilsabstände vom ersten bzw. dritten Quartil entfernt liegen
Pregunta 42
Pregunta 43
Pregunta
Die Standardabweichung und Varianz sind beide unempfindlich gegenüber Ausreißern
Pregunta 44
Pregunta
Tim hat in der Prüfung an der Uni Wien 620 Punkte, Mia hat in Innsbruck 640 Punkte
ist Mia wirklich besser, wenn wir wissen das die Prüfungen unterschiedlich schwer waren?
ist ein typisches Beispiel für eine Standardisierung
Pregunta 45
Pregunta
Was lässt sich zusammenfassend also bisher sagen?
Respuesta
-
Häufigkeitsverteilungen lassen sich immer durch ihre Lage auf der Merkmalsachse (Lagemaße) und ihre Streuung (Streuungsmaße) kennzeichnen
-
Häufigkeitsverteilungen lassen sich immer durch ihre Lage auf der Merkmalsachse (Streuungsmaße) und ihre Streuung (Lagemaße) kennzeichnen
-
in Forschungsarbeiten werden meist Mittelwert und Standardabweichung angegeben
-
in Forschungsarbeiten werden meist Mittelwert, Varianz und Standardabweichung angegeben
-
Verteilungen können nur asymmetrisch sein
-
Verteilungen können symmetrisch oder schief sein, sie können unimodal, bimodal und multimodal sein
-
Variablen, die in der Population normalverteilt sind, lassen sich mit Mittelwert und Standardabweichung sinnvoll repräsentieren
-
z-Werte haben einen Mittelwert von 1 und eine SD von 0
-
z-Werte haben einen Mittelwert von 0 und eine SD von 1
Pregunta 46
Pregunta
Quartile, Standardabweichung, Varianz, Bereich, Maximum und Minim = Lagemaße
Pregunta 47
Pregunta
Grundlagen der Inferenzstatistik
Respuesta
-
induktive Statistik: wir unterscheiden zwischen der Menge aller Merkmalsträger und Teilmengen davon
-
Die Menge aller Merkmalsträger = Grundgesamtheit/Population
-
Teilmengen = Stichproben (Sample, Auswahl)
-
Die korrspondierenden Kennwerte der Grundgesamtheit = Parameter
-
Stichprobe muss für Grundgesamtheit repräsentativ sein
Pregunta 48
Pregunta
im eindimensionalen Fall schätzt die induktive Statistik die wahren, aber unbekannten Werte in der Grundgesamtheit -> darum wird von Testen gesprochen
Pregunta 49
Pregunta
Die Grundlage der induktiven Statistik ist die Wahrscheinlichkeitstheorie
Pregunta 50
Pregunta
Das Gesetz der großen Zahlen...
In einer Zufallsstichprobe...
Respuesta
-
liegt das arithmetische Mittel...
-
für große n....
-
mit hoher Wahrscheinlichkeit...
-
sehr nahe beim Mittelwert der Grundgesamtheit.
-
Das gilt umso eher, je größer n ist
Pregunta 51
Pregunta
Bei Punktschätzungen muss das Merkmal in der Grundgesamtheit stets normalverteilt sein
Pregunta 52
Pregunta
Bei Punktschätzung schätzt man einen einzigen Wert
Pregunta 53
Pregunta
Ich möchte wissen, vie viele Studierende in Wien aus NÖ kommen, bei der Stichprobe finde ich heraus das 22 Studenten von 100 aus NÖ kommen, jetzt schätze ich also das in ganz Wien der Anteil an Studenten aus NÖ 22% beträgt. Aber die Wahrscheinlichkeit ist hoch das meine Stichprobe nicht dieser Schätzung (=Grundgesamtheit) entspricht....
Dieses ist ein typisches Beispiel für eine Punktschätzung
Pregunta 54
Pregunta
Wir unterscheiden drei inferenzstatistische Maße!
Respuesta
-
Standardfehler
-
Konfidenzintervalle
-
Signifikanztests
-
Punktschätzung
-
Intervallschätzung
-
Z-Test
-
Normalverteilung
Pregunta 55
Pregunta
Der Standardfehler sagt etwas über die Verlässlichkeit der Parameterschätzung
Pregunta 56
Pregunta
Konfidenzintervalle...sagen etwas über die Verlässlichkeit der Parameterschätzung als Intervall
Pregunta 57
Pregunta
Wir wollen ermitteln, ob die TV Nutzung von Jungen und Mädchen sich unterscheiden, man befragt je 100 Mädchen und Jungen, dann bekommt man einen Mittelwert und man will wissen gehören sie zur gleichen Population. Wenn die TV Nutzung sich unterscheidet, dann gehören sie zu verschiedenen Grundgesamtheiten.
ist ein typisches Beispiel für die Inferenzstatistik
Pregunta 58
Pregunta
Was passiert beim Signifikanztest bei der Ablehunung bzw. Beibehaltung der Nullhypothese?
Respuesta
-
Ablehnung der Nullhypothese:
-H0 wird abgelehnt, wenn die aus der Stichprobe gebildete Prüfgröße in den Ablehnbereich K fällt
-
Beibehaltung der Nullhypothese:
-H0 wird abgelehnt, wenn die aus der Stichprobe gebildete Prüfgröße in den Ablehnbereich K fällt
-
Ablehung der Nullhypothese:
-H0 wird beibehlaten, wenn die aus der Stichprobe gebildete Prüfgröße in den Annahmebreich fällt
-
Beibehaltung der Nullhypothese:
-H0 wird beibehlaten, wenn die aus der Stichprobe gebildete Prüfgröße in den Annahmebreich fällt
Pregunta 59
Pregunta
Der P-Wert bezeichnet die Wahrscheinlichkeit für das gefundene Ergebnis unter der Annahme da in der Population H0 gilt.
Pregunta 60
Pregunta
In der Sozialforschung hat sich eine Irrtumswahrscheinlichkeit von alpha= 1% eingebürgert
Pregunta 61
Pregunta
Signifikanz hat nichts mit Bedeutsamkeit zu tun
Pregunta 62
Pregunta
mit größerer Stichprobe steigt die Wahrscheinlichkeit das auch kleine Effekte signifikant werden
Pregunta 63
Pregunta
wenn man sich für die H1 entscheidet und die H0 ablehnt, kann es sein das man einen Beta Fehler eingeht
Pregunta 64
Pregunta
Nonparametrische Tests legen keine Bedingungen fest über Parameter derjenigen Population, aus der die Stichprobe gezogen wurde (z.B. Normalverteilung)
Pregunta 65
Pregunta
eine Nullhypothese in einem Signifikanztest wäre z.B.
"verrichtete Hausarbeit von Männern und Frauen pro Woche",
dabei wäre die Nullhypothese das beide gleich viel Hausarbeit verrichten und die beiden Gruppen nicht voneinander abweichen
Pregunta 66
Respuesta
-
=Ablehnungsgrenze
-
=Annehmgrenze
-
muss kleiner als 0,1 sein
-
muss kleiner als 0,5 sein
-
man kann daran ablesen ob es ein signifikantes oder nicht signifikantes Ergebnis ist