Created by Anna Stammen
almost 9 years ago
|
||
Question | Answer |
Statistik im privaten Alltag, in Politik und Gesellschaft | junge Wissenschaft, die alle Lebensbereiche durchdringt - Soziologie - Psychologie - Medizin -Wirtschaft - fachübergreifend |
Welches Jahr wurde zum internationalen Jahr der Statistik ausgerufen? | 2013 |
Aufgaben der Statistik | - Planung der Datenerhebung - Beschreibung und Visualisierung der Befunde - Identifikation von Auffälligkeiten - Ableitung von Schlüssen |
Teilbereiche der Statistik | - beschreibende (deskriptive) Statistik - schließende (induktive) Statistik |
beschreibende Statistik | - numerische + grafische Verfahren zur Charakterisierung + Präsentation von Daten - explorative Datenanalyse geht aus ihr hervor |
Was ist das Ziel der beschreibenden Statistik ? | Reduktion der Informationsfülle durch Aggregation auf wenige Kenngrößen |
schließende Statistik | - zieht Schlussfolgerungen aus Daten - Beschreibung der Schlussfolgerungen durch Wahrscheinlichkeitsrechnung - Schätzen von Modellparametern und Hypothesentest |
Welcher Teilbereich der Statistik wird am meisten verwendet? | beschreibende Statistik |
Was ist das angestrebte Lernziel? | Methodenkompetenz (passive und aktive) |
Was ist passive Methodenkompetenz? | - Kenntnis alternativer Möglichkeiten der Auswertung und Präsentation - Fähigkeit, statistische Informationen zu interpretieren |
Was ist aktive Methodenkompetenz? | - Handlungskompetenz - Fähigkeit, im Alltag Entscheidungen empirisch zu fundieren und nachvollziehbar zu kommunizieren |
Statistische Einheiten oder Merkmalsträger | - an ihnen werden Daten erhoben - Objekte, auf die sich die Untersuchungen beziehen (Personen, Bauteile, Tiere) |
Grundgesamtheit | - klar abgegrenzt - die Menge aller für Fragestellung interessanten statistischen Einheiten - ggf. aufgeteilt in Teilmengen |
Merkmale oder Variablen | - Eigenschaften statistischer Einheiten - werden in Großbuchstaben angegeben |
Merkmalsausprägungen | - mögliche Werte, die ein Merkmal annehmen kann - in Kleinbuchstaben |
Stichprobe | - Teilmenge der Grundgesamtheit |
Urwerte, Primärdaten, Rohdaten | beobachtete Werte für ein Merkmal |
Urliste | alle Urwerte in Listenform |
Zufallsvariable | wenn Ausprägung eines Merkmals als Zufallsvorgang interpretiert wird |
Realisierung | Ausprägung einer Zufallsvariablen |
Stichprobenvariablen | die Ausprägungen aller Elemente einer Stichprobe |
Welche Merkmale können auftreten? | - diskrete Merkmale : endlich viele, eindeutige Abstände, z.B. Anzahl Semester, Familienstand - stetige Merkmale : Zwischenwerte sind möglich, z.B. Zeit, Länge, Gewicht |
Nominalskala | Merkmalsausprägungen als Namen, z.B. Studienfach, keine natürliche Rangordnung |
Ordinalskala | - natürliche Rangordnung, z.B. Schulnoten |
Verhältnisskala | hat einen Nullpunkt, z.B. Geschwindigkeit |
Intervallskala | ohne Nullpunkt, z.B. Temperatur in C° |
Absolutskala | hat Nullpunkt und eine natürliche Einheit, z.B. Anzahl der Fachsemester |
Typen der Merkmalsausprägungen | - qualitatives Merkmal : Ausprägungen sind Kategorien, drückt Andersartigkeit aus, Nominal- oder Ordinalskaliert - quantitatives Merkmal : echte Zahlen, drücken Intensität aus, metrisch skaliert |
Operationalisierung von Merkmalen | - Festlegung von Messanweisungen - Objektivität. Reliabilität, Validität müssen gewährleistet sein |
manifeste Variablen | - direkt beobachtbar, z.B. Alter |
latente Variablen | - nicht direkt beobachtbar, z.B. Intelligenz |
Datenerhebung | Gewinnung von Daten |
Erhebungsdesign | Planung der Datengewinnung |
Primärerhebung | Daten werden eigens für Untersuchungsziel gewonnen |
Sekundärerhebung | Daten existieren schon |
Tertiärerhebung | aus Datenaggregaten existierender Daten |
Arten der Datenerhebung | - Befragung (mündlich/schriftlich) - Beobachtung - Experiment - Querschnittstudien (Ausprägung eines Merkmals an verschiedenen Merkmalsträgern zu einem Zeitpunkt) - Längsschnittstudien (ein Merkmal anhand mehrerer Merkmalsträger im Zeitverlauf) - Panel Studie (Kombination aus Quer- und Längsschnitt) |
Auswahlpopulation | Population die aus der Stichprobe gezogen wird |
undercoverage | einige Elemente der Grundgesamtheit fehlen in der Auswahlpopulation |
overcoverage | einige Elemente in Auswahlpopulation sind zuviel, gehören nicht zur Grundgesamtheit |
Zufallsstichprobe | jedes Elemente hat die gleiche Chance in die Stichprobe zu kommen |
Inferenzschluss | Rückschuss der Eigenschaften von der Stichprobe auf die Grundgesamtheit |
Auswahlbias | systematische Stichprobenverzerrung |
einfache Zufallsstichprobe | Stichprobenauswahl zufällig und so geplant, dass jede Teilmenge der Grundgesamtheit dieselbe Auswahlwahrscheinlichkeit hat (z.B. Lottozahlen) |
geschichtete Zufallsauswahl | - Zerlegung der Grundgesamtheit in Teilgesamtheiten, die sich nicht überlappen - Aus jeder Schicht werden Zufallsstichproben gezogen - Kenntnis der Schichtungsvariablen erforderlich - zweistufiges Auswahlverfahren : - Schichtung festlegen - proportionale Zufallsauswahl treffen |
proportional geschichtete Stichprobe | fester Anteil entnommener Elemente pro Schicht, der proportional zum Schichtumfang ist |
disproportional geschichtete Stichprobe | wenn Schichten zu dünn besetzt sind, werden mehr Elemente gezogen |
Klumpen | - natürliche Aufteilung der Grundgesamtheit (z.B. Schulklassen) - Zufallsstichprobe aus Menge der Klumpen - Untersuchung aller Elemente der gewählten Klumpen |
Quotenauswahl | - Stichprobe mit Quotenvorgabe (z.B. Geschlecht, Alter) - Ziel: verkleinertes Abbild der Grundgesamtheit |
amtliche Statistik | - Statistisches Bundesamt - Statistische Landesämter - Kommunale Statistikämter |
nicht amtliche Statistik | - private Institute für Markt- und Meinungsforschung - Wirtschaftsforschungsinstitute |
univariate Urliste | - Erhebung von Merkmalsausprägungen für ein Merkmal X an n Merkmalsträgern - Werte können mehrfach auftreten - je genauer die Messung stetiger Merkmale, desto weniger häufig treten Werte mehrfach auf |
gruppierte Daten | Zerlegung der Datenmenge in Teilintervalle |
absolute Häufigkeit | - Häufigkeit einer Ausprägung oder Klassenbesetzung hi = h(ai) i = 1, 2, ...., k |
relative Häufigkeit | - als Prozentwerte angebbar - Absolute Häufigkeit / Anzahl Messwerte fi = f(ai) = h(ai) / n i = 1, 2, ...., k |
empirische Verteilung | - grafische Darstellungsformen : - Kreisdiagramm - Stabdiagramm - Säulen- oder Balkendiagramm - Histogramm |
absolute kumulierte Häufigskeitsverteilung | - wenn man für einen beliebigen reellen Wert x die Anzahl der Beobachtungen ermittelt, die x nicht überschreiten - H(x) |
relative kumulierte Häufigkeitsverteilung | wenn man H(x) durch den Umfang n des Datensatzes dividiert F(x) = H(x) / n |
Lagemaße | Zentrum, Schwerpunkt, Streuung, Schiefe |
Modalwert Xmod | - Merkmalsausprägung mit größter Häufigkeit - wenn zwei gleiche größte Ausprägungen, dann gibt es zwei Modalwerte - robust gegen Ausreißer |
Median Xmed | - mind. Ordinalskala - robust gegen Ausreißer - der mittlere Wert eines geordnet vorliegenden Datensatzes - bei n gerade: Mittelwert der beiden zentralen Werte |
Mittelwert, arithmetisches Mittel | - metrische Skala - hohe Sensitivität gegen Ausreißern - Summe aller Daten/Anzahl der Daten - alle Daten sind gleich gesichtet |
geometrisches Mittel | - Veränderungsraten als Datengrundlage - zur Quantifizierung von Wachstumsraten, Lernzuwächsen etc. |
gewichtetes arithmetisches Mittel | - jeder Wert wird mit einem Gewichtungsfaktor versehen |
getrimmtes arithmetisches Mittel | - Randdaten bleiben unberücksichtigt - robuster gegen Ausreißer |
Streuungsmaße | - Streuung innerhalb eines Datensatzes - metrische Skalierung |
Spannweite R | - Daten aufsteigend sortiert - größter Wert - kleinster Wert - R: x(n) - x(1) - geringe Robustheit |
Varianz s^2 | - einzelne Abweichungen vom Mittelwert im Quadrat summieren und durch Anzahl teilen - daraus folgt die Standardabweichung s als Wurzel der Varianz |
korrigierte Varianz s^2 | - durch n-1 statt durch n teilen - hat günstigere Eigenschaften - daraus resultiert die korrigierte Standardabweichung s* |
p-Quantil Xp | Q- Anteil p ist kleiner oder gleich - Anteil 1-p ist größer oder gleich - bei Median ist p = 0,5 - bei Quartilen : p = 0,25, 0,75 |
Quartilsabstand Q | - Q: = X0,75 - X0,25 Dezile D1, D2, D3, ... = X0,1, X0,2, X0,3 .... Median ist also D5 |
asymmetrische Verteilung | - über Dezime erkennbar - erstes Indiz: Nichtübereinstimmung von Median und Mittelwert |
Boxplot | - grafische Darstellung zur Beurteilung einer empirischen Verteilung - fünf Charakteristika: 1. 2 Extremwerte 2. Differenz = Spannweite 3. Quartile X0,25 und X0,75 4. Median X0,5 |
Vierfeldertafel | - für zwei binäre Merkmale - lässt sich in Baumdiagramm übertragen |
Was bedeutet bivariat? | bivariat = zwei Merkmale |
Kontingenztabellen | - Darstellung der Häufigkeiten von bivariaten Merkmalen - zeigt empirische Verteilung der beiden Merkmale - Randverteilungen sind Zeilen / Spaltensummen - Randverteilungen = Häufigkeitsverteilungen der Einzelmerkmale |
Bedingte Häufigkeiten | - Verknüpfung von gemeinsamen Häufigkeiten mit den Randhäufigkeiten - so sind Zusammenhänge erkennbar - Einzelelement der Bedingung/Randhäufigkeit = bedingt relative Häufigkeit |
Zufallsvorgang | Prozess, der zu einem von mehreren Ergebnissen führt, die sich gegenseitig ausschließen |
Elementarereignisse | - die möglichen Ergebnisse des Prozesses - Omega ist die Ergebnismenge - nicht weiter zerlegbare Ergebnisse |
Ereignis A | - Teilmenge A von Omega |
Sicheres Ereignis | - Menge Omega definiert sicheres Ereignis - dagegen Komplementärereignis ist unmögliches Ereignis |
Schnittmengen | - aus Teilmenge von Omega, z.B. wenn A und B realisiert sind |
Vereinigungsmenge | A U B, wenn eines der Ereignisse A oder B eintritt |
Venn-Diagramme | zur Veranschaulichung zusammengesetzter Ereignisse |
endliche Ergebnismenge | - z.B. einfacher Münzwurf als Zufallsvorgang - Omega (Zahl,Kopf) -> sicheres Ereignis |
unendliche Ergebnismenge | - z.B. Lotto : wie viel Spiele sind erforderlich, bis 6 richtige erreicht sind? - Ergebnismenge reicht von 1 - unendlich |
Zufallsexperiment - Voraussetzungen | - kontrollierte Bedingungen - wiederholbar unter gleichbleibenden Bedingungen - z.B. Ziehung der Lottozahlen |
Wahrscheinlichkeit | - für Auftreten eines Ereignisses A - egal ob Zufallsprozess unter kontrollierten oder nicht kontrollierten Bedingungen - Maßzahl ist P (A) (probability) - objektive Quantifizierung in Statistik - Bewertung der Chance für das Eintreten eines Ereignisses |
Axiome von Kolmogoroff | - Bedingungen für P (A): - K1: Nicht-Negativitätsbedingung P(A)>0 -K2: Normierung der Ergebnismenge P (Omega) = 1 -K3: Additivität der Wahrscheinlichkeit disjunkter Ereignisse |
Bedingungen für Laplace Experimente | - L1: Ergebnismenge ist endlich - L2: Wahrscheinlichkeiten für n Elementarereignisse sind alle gleich groß - z.B. Münzwürfe, Würfeln, Roulette |
Urnenmodell | - zur Herleitung zentraler Ergebnisse für Zufallsvorgänge mit endlicher Ergebnismenge - N= durchnummerierte Kugeln = Grundgesamtheit - Auswahl der Kugeln entspricht Stichprobe des Umfangs n - mit Zurücklegen oder ohne |
Bedingte Wahrscheinlichkeiten | - es gibt Vorabinformationen (Bedingungen ) - P (AIB) ist Wahrscheinlichkeit von A unter der Bedingung B |
Trägermenge | alle Werte/Ausprägungen einer Zufallsvariablen X die X annehmen kann |
Wahrscheinlichkeitsfunktion | - ordnet jeder Ausprägung xi eine Eintrittswahrscheinlichkeit pi zu - wird auf Null gesetzt für alle x außerhalb der Trägermenge, damit ist die Funktion für alle reellen Zahlen erklärt |
diskrete Gleichverteilung | - wenn alle Ausprägungen gleiche Eintrittswahrscheinlichkeit p haben - z.B. fairer Würfel hat p = 1/6 für alle x |
theoretische Verteilungsfunktion | - monoton wachsende Treppenfunktion - Aufaddieren der pi - im Experiment nähert sich relative Häufigkeit der Funktion an |
Bernoulli-Verteilung | - wenn Zufallsvariable X nur zwei Ausprägungen hat - z.B. Münzwurf - dann ist p1=p und p2=1-p |
Erwartungswert | - Schwerpunkt der Verteilung der diskreten Zufallsvariablen - Gewichtung über Eintrittswahrscheinlichkeiten der einzelnen Ausprägungen |
Want to create your own Flashcards for free with GoConqr? Learn more.