Frage 1
Frage
Der Begriff Statistik:
-kommt von "Status" (lat.) "der Staat"
-"statista" (lat.) der Staatsmann
Frage 2
Frage
Wozu braucht man Statistik?
Antworten
-
Die Statistik hilft uns, Studien zu konzipieren, mit denen wir inhaltliche Fragen beantworten können.
-
Die Statistik ist ein Selbstzweck.
-
Die Statistik ist Mittel zum Zweck, kein Selbstzweck.
-
Die Statistik ermöglicht es, Komplexität in Zusammenhängen zu berücksichtigen
-
Die Statistik hilft uns, zu korrekten und generalisierbaren wissenschaftlichen Aussagen zu gelangen!
-
Die Statistik ist abhängig von normativen Vorstellungen
-
Die Statisitk ist unabhängig von normativen Vorstellungen, was wir gut oder schlecht finden.
-
Statistik leistet keine Interpretation der Befunde
-
Statistik kann auch missbraucht werden
-
Statistik kann niemalls missbraucht werden
Frage 3
Frage
Gemäß der Theorie der Schweigespirale äußern sich Menschen weniger wahrscheinlich in öffentlichen Sitatuionen, wenn sie die Mehrheitsmeinung gegen sich sehen. Dies führt zu einem Spiraleffekt.
Frage 4
Frage
Die Theorie der Schweigespirale stammt von Noelle-Neuman, 1975
Frage 5
Frage
Hypothesen sollen bei der Statistik erst nach der Durchführung statistischer Analysen aufgestellt werden
Frage 6
Frage
Ein "DON´T" der Statistik ist es mit den Daten alle möglichen statistischen Analysen durchzuführen, bis sich ein halbwegs plausibles "signifikantes" Ergebnis zeigt
Frage 7
Frage
Es gibt deskriptive und induktive Statistik
Frage 8
Frage
Deskriptive und induktive Statistik!
Antworten
-
Deskriptiv: beschreibende Statistik, ordnen, beschreibem von Daten und Zahlen mit z.B. Tabellen
-
Deskriptiv: schließende Statistik, Rückschlüsse von meinen erhobenen Daten (Stichproben) auf die Grundgesamtheit
-
Induktiv:beschreibende Statistik, ordnen, beschreibem von Daten und Zahlen mit z.B. Tabellen
-
Induktiv: schließende Statistik, Rückschlüsse von meinen erhobenen Daten (Stichproben) auf die Grundgesamtheit
Frage 9
Frage
Univariate, bivariate und multivariate Statistik!
Antworten
-
univariate: Beschreibung einer einzelnen Variable z.B. Nutzung von Facebook
-
bivariate: Beschreibung eines Zusammenhanges zwischen 2 Variaten, z.B. Nutzung von Facebook und das Glauben von Fehlinformationen, wie hängt das zusammen?
-
multivariate: Beschreibung des Zusammenhanges von mehr als 2 Variaten, z.B. Wie erklärt sich das Glauben von Fehlinformationen in Abhängigkeit von verschiedenen Mediennutzungsquellen, des Vorwissens und der politischen Verbindung
Frage 10
Frage
Prädiktor Variable die etwas vorhersagt
Frage 11
Frage
Abhängige Variable: die von etwas abhängt z.B. Glauben von Fehlinformationen
Frage 12
Frage
Urliste ist eine sortierte Urliste z.B. nach Größe sortiert
Frage 13
Frage
Wie viel Menschen in Ö haben Angst sich mit Corona zu infizieren und wie stark weichen die Personen vom Mittelwert ab
ist ein typischces Beispiel fur ein Lagemaß
Frage 14
Frage
Haben Menschen Angst oder nicht vor Corona?
ist ein typisches Beispiel für eine Verteilung
Frage 15
Frage
Wie oft tritt eine Ausprägung i des Merkmals X in einer Stichprobe mit dem Umfang N auf?
ist die absolute Häufigkeit (fi)
Frage 16
Frage
Wie oft tritt eine Ausprägung i des Merkmals X im Verhältnis zur Gesamtstichproobe mit dem Umfang N auf?
ist die relative Häufigkeit (pi)
Frage 17
Frage
Regeln bei der Häufigkeitsverteilung (=Gruppenbildung)!!!
Antworten
-
jede Ausprägung muss genau einer Klasse zugeordnet werden
-
jede Ausprägung muss mehr als einer Klasse zugeordnet werden
-
in der Regel sind 5-10 Gruppen ideal
-
in der Regel sind 6-12 Gruppen ideal
-
offene Klassen möglichst bevorzugen
-
offene Klassen möglichst vermeiden
-
Randklassen sollten gering besetzt sein
-
Möglichst Gruppenbreite konstant halten
Frage 18
Frage
Maßzahlen für bereits erhobene Daten (Stichproben) nennen wir Verteilungskennwerte (deskriptive Statistik)
Frage 19
Frage
Maßzahlen für die Grundgesamtheit nennen wir Verteilungsparameter (induktive Statistik)
Frage 20
Frage
Lagemaße geben Auskunft darüber, wie sich die Daten um den Schwerpunkt (Zentrum/zentrale Tendenz) verteilen = Wie unterschiedlich sind die Messwerte
Frage 21
Frage
Der Modus (auch Modalwert) ist der Wert einer Verteilung, der am häufigsten auftritt
Frage 22
Antworten
-
Vorteil: schnell und einfach zu ermitteln, was ist typisch
-
Nachteil: sehr aufwendig zu ermitteln
-
Nachteil: nicht sehr informationsreich, wenig aussagekräftig (z.B. zwei Werte haben die gleiche Häufigkeit, Aussagekraft ist beschränkt)
-
Vorteil: hohe Aussagekraft, liefert viel Informationen über Daten
Frage 23
Frage
Der Modus ist ein Lagemaß
Frage 24
Antworten
-
auch Md, x med
-
teilt die Verteilung in zwei gleich große Hälften
-
50% der Werte sind kleiner und 50% der Werte sind größer als der Median
-
ungruppierte Daten: Daten müssen zunächste der Größe nach geordnet werden, Dann ist der Median bei ungeraden Zahlen die Ausprägung des "mittleren" Wertes
-
Bei 9 Werten, ist der 5. Wert der Median
-
Z.B.
2,6, 12,15,16,20,22,30,35
ist 16 der Median
-
Bei geradem n gibt es keine echte Mitte, Der Median liegt dann genau in der rechnerischen Mitte zwischen den beiden Werten, die der Mitte der Verteilung am nächsten kommen.
-
bei 10 Werten liegt der Median zwischen dem 5. und dem 6. Wert
-
z.B.
2, 6, 12, 15, 16, 20, 23, 30, 35, 40
der Wert zwischen 16 und 20 ist der Median, also 18 ist der Median
Frage 25
Frage
Der Mittelwert, Durschnittswert oder Schwerpunkt der Verteilung ist die durchschnittliche Ausprägung aller Were
Frage 26
Antworten
-
Nachteil: wenig stabil, andere Stichprobe = anderer Mittelwert
-
nur bei intervallskalierten Daten möglich
-
bei ordinalen und nominalskalierten Daten macht der Mittelwert keinen Sinn mehr
-
Mittelwert macht sowohl bei intervallskalierten, als auch bei ordinalen und nominalskalierten Daten Sinn
-
ist sehr empfindlich gegenüber Ausreißern
-
Ausreißer spielen fast keine Rolle
-
ein Ausreißer wäre z.B. jemand hatte 1000 Partner
Frage 27
Frage
Ein Säulendiagramm eignet sich nicht für die Darstellung von absoluten und relativen Häufigkeiten
Frage 28
Frage
Ein Balkendiagramm benutzt man bei relativen Häufigkeiten, bei sehr vielen Ausprägungen (Kategorien), sind solche Diagramme aber nicht aussagekräftig
Frage 29
Frage
Ein Kreisdiagramm, auch Tortendiagramm genannt hat ein Problem:
zu viele Ausprägungen = nicht mehr gut lesbar, desto größer die Fläche, desto häufiger tritt es auf, Prozentangaben nötig, da sonst sehr schwer zu interpretieren
Frage 30
Frage
Eine Randklasse wäre z.B. niedrigste oder höchste Einkommensgrenze
Frage 31
Frage
Zentrale Tendenz= wie viele Gipfel hat eine Verteilung?
Frage 32
Frage
Schiefe (Beschreibungsmöglichkeiten von Verteilungen)!
Antworten
-
Maß für die Symmetrie der Verteilung
-
Maß für die Asymmetrie der Verteilung
-
Die Schiefe einer symmetrischen Verteilung hat den Wert null
-
Die Schiefe einer symmetrischen Verteilung hat den Wert eins
-
jede Verteilung die nicht symmetrisch ist heißt automatiscch schiefe Verteilung
-
linksschief, rechtsschief
Frage 33
Frage
Wölbung (Kurtosis) (Beschreibungsmöglichkeiten von Verteilungen)!
Antworten
-
Ein Maß dafür, wie sich die Beobachtungen, um einen zentralen Punkt gruppieren
-
z.B. schmalgipflig/breitgipflig
-
wie spitz/gestaucht ist eine Verteilung?
Frage 34
Frage
Schiefe = 0 ist eine symmetrische Schiefe
Frage 35
Frage
Schiefe kleiner 0 = rechtssteile Verteilung
Schiefe größer 0 = linksseitige Verteilung
Frage 36
Frage
Die Kurtosis ist bei einer Normalverteilung niemals 0
Frage 37
Frage
positive Kurtosis: gruppieren sich stark um den Mittelwert, auch schmalgipflig genannt
negative Kurtosis: gruppieren sich die Beobachtungen weniger dicht, also breitgipflig zusammen
Frage 38
Antworten
-
Differenz vom größten und kleinsten vorkommenden Wert
-
Vorteil: schnell und einfach
-
Nachteil: aufwendig
-
Nachteil: sehr empfindlich gegenüber Ausreißern, informationsarm
-
Vorteil: kaum empfindlich gegenüber Ausreißern, viel Informationen
-
wichtig um zu überprüfen: Kann das stimmen?
Frage 39
Frage
Interquartilbreite/Interquartilabstand!
Antworten
-
mittlere 50 %
-
man bestimmt sie indem man das dritte Quartil minus das erste Quartil rechnet
-
man bestimmt sie indem man das dritte Quartil plus das erste Quartil rechnet
-
Vorteil: wenig empfindlich gegenüber Ausreißern
-
Nachteil: ist sehr empfindlich gegenüber Ausreißern
-
Nachteil: informationsarm und nur sinnvoll für metrische Daten
-
Vorteil: viel Informatonen und für alle Daten möglich (intervall, metrisch, ordinal...)
Frage 40
Frage
Ausreißer sind Daten die mehr als 1,5 Interquartilabstände vom ersten bzw.. dritten Quartil entfernt liegen
Frage 41
Frage
Extremwerte sind extremer als Ausreißer, da sie 3 Interquartilsabstände vom ersten bzw. dritten Quartil entfernt liegen
Frage 42
Frage 43
Frage
Die Standardabweichung und Varianz sind beide unempfindlich gegenüber Ausreißern
Frage 44
Frage
Tim hat in der Prüfung an der Uni Wien 620 Punkte, Mia hat in Innsbruck 640 Punkte
ist Mia wirklich besser, wenn wir wissen das die Prüfungen unterschiedlich schwer waren?
ist ein typisches Beispiel für eine Standardisierung
Frage 45
Frage
Was lässt sich zusammenfassend also bisher sagen?
Antworten
-
Häufigkeitsverteilungen lassen sich immer durch ihre Lage auf der Merkmalsachse (Lagemaße) und ihre Streuung (Streuungsmaße) kennzeichnen
-
Häufigkeitsverteilungen lassen sich immer durch ihre Lage auf der Merkmalsachse (Streuungsmaße) und ihre Streuung (Lagemaße) kennzeichnen
-
in Forschungsarbeiten werden meist Mittelwert und Standardabweichung angegeben
-
in Forschungsarbeiten werden meist Mittelwert, Varianz und Standardabweichung angegeben
-
Verteilungen können nur asymmetrisch sein
-
Verteilungen können symmetrisch oder schief sein, sie können unimodal, bimodal und multimodal sein
-
Variablen, die in der Population normalverteilt sind, lassen sich mit Mittelwert und Standardabweichung sinnvoll repräsentieren
-
z-Werte haben einen Mittelwert von 1 und eine SD von 0
-
z-Werte haben einen Mittelwert von 0 und eine SD von 1
Frage 46
Frage
Quartile, Standardabweichung, Varianz, Bereich, Maximum und Minim = Lagemaße
Frage 47
Frage
Grundlagen der Inferenzstatistik
Antworten
-
induktive Statistik: wir unterscheiden zwischen der Menge aller Merkmalsträger und Teilmengen davon
-
Die Menge aller Merkmalsträger = Grundgesamtheit/Population
-
Teilmengen = Stichproben (Sample, Auswahl)
-
Die korrspondierenden Kennwerte der Grundgesamtheit = Parameter
-
Stichprobe muss für Grundgesamtheit repräsentativ sein
Frage 48
Frage
im eindimensionalen Fall schätzt die induktive Statistik die wahren, aber unbekannten Werte in der Grundgesamtheit -> darum wird von Testen gesprochen
Frage 49
Frage
Die Grundlage der induktiven Statistik ist die Wahrscheinlichkeitstheorie
Frage 50
Frage
Das Gesetz der großen Zahlen...
In einer Zufallsstichprobe...
Antworten
-
liegt das arithmetische Mittel...
-
für große n....
-
mit hoher Wahrscheinlichkeit...
-
sehr nahe beim Mittelwert der Grundgesamtheit.
-
Das gilt umso eher, je größer n ist
Frage 51
Frage
Bei Punktschätzungen muss das Merkmal in der Grundgesamtheit stets normalverteilt sein
Frage 52
Frage
Bei Punktschätzung schätzt man einen einzigen Wert
Frage 53
Frage
Ich möchte wissen, vie viele Studierende in Wien aus NÖ kommen, bei der Stichprobe finde ich heraus das 22 Studenten von 100 aus NÖ kommen, jetzt schätze ich also das in ganz Wien der Anteil an Studenten aus NÖ 22% beträgt. Aber die Wahrscheinlichkeit ist hoch das meine Stichprobe nicht dieser Schätzung (=Grundgesamtheit) entspricht....
Dieses ist ein typisches Beispiel für eine Punktschätzung
Frage 54
Frage
Wir unterscheiden drei inferenzstatistische Maße!
Antworten
-
Standardfehler
-
Konfidenzintervalle
-
Signifikanztests
-
Punktschätzung
-
Intervallschätzung
-
Z-Test
-
Normalverteilung
Frage 55
Frage
Der Standardfehler sagt etwas über die Verlässlichkeit der Parameterschätzung
Frage 56
Frage
Konfidenzintervalle...sagen etwas über die Verlässlichkeit der Parameterschätzung als Intervall
Frage 57
Frage
Wir wollen ermitteln, ob die TV Nutzung von Jungen und Mädchen sich unterscheiden, man befragt je 100 Mädchen und Jungen, dann bekommt man einen Mittelwert und man will wissen gehören sie zur gleichen Population. Wenn die TV Nutzung sich unterscheidet, dann gehören sie zu verschiedenen Grundgesamtheiten.
ist ein typisches Beispiel für die Inferenzstatistik
Frage 58
Frage
Was passiert beim Signifikanztest bei der Ablehunung bzw. Beibehaltung der Nullhypothese?
Antworten
-
Ablehnung der Nullhypothese:
-H0 wird abgelehnt, wenn die aus der Stichprobe gebildete Prüfgröße in den Ablehnbereich K fällt
-
Beibehaltung der Nullhypothese:
-H0 wird abgelehnt, wenn die aus der Stichprobe gebildete Prüfgröße in den Ablehnbereich K fällt
-
Ablehung der Nullhypothese:
-H0 wird beibehlaten, wenn die aus der Stichprobe gebildete Prüfgröße in den Annahmebreich fällt
-
Beibehaltung der Nullhypothese:
-H0 wird beibehlaten, wenn die aus der Stichprobe gebildete Prüfgröße in den Annahmebreich fällt
Frage 59
Frage
Der P-Wert bezeichnet die Wahrscheinlichkeit für das gefundene Ergebnis unter der Annahme da in der Population H0 gilt.
Frage 60
Frage
In der Sozialforschung hat sich eine Irrtumswahrscheinlichkeit von alpha= 1% eingebürgert
Frage 61
Frage
Signifikanz hat nichts mit Bedeutsamkeit zu tun
Frage 62
Frage
mit größerer Stichprobe steigt die Wahrscheinlichkeit das auch kleine Effekte signifikant werden
Frage 63
Frage
wenn man sich für die H1 entscheidet und die H0 ablehnt, kann es sein das man einen Beta Fehler eingeht
Frage 64
Frage
Nonparametrische Tests legen keine Bedingungen fest über Parameter derjenigen Population, aus der die Stichprobe gezogen wurde (z.B. Normalverteilung)
Frage 65
Frage
eine Nullhypothese in einem Signifikanztest wäre z.B.
"verrichtete Hausarbeit von Männern und Frauen pro Woche",
dabei wäre die Nullhypothese das beide gleich viel Hausarbeit verrichten und die beiden Gruppen nicht voneinander abweichen
Frage 66
Antworten
-
=Ablehnungsgrenze
-
=Annehmgrenze
-
muss kleiner als 0,1 sein
-
muss kleiner als 0,5 sein
-
man kann daran ablesen ob es ein signifikantes oder nicht signifikantes Ergebnis ist