|
|
Created by Anna Stammen
almost 10 years ago
|
|
| Question | Answer |
| Statistik im privaten Alltag, in Politik und Gesellschaft | junge Wissenschaft, die alle Lebensbereiche durchdringt - Soziologie - Psychologie - Medizin -Wirtschaft - fachübergreifend |
| Welches Jahr wurde zum internationalen Jahr der Statistik ausgerufen? | 2013 |
| Aufgaben der Statistik | - Planung der Datenerhebung - Beschreibung und Visualisierung der Befunde - Identifikation von Auffälligkeiten - Ableitung von Schlüssen |
| Teilbereiche der Statistik | - beschreibende (deskriptive) Statistik - schließende (induktive) Statistik |
| beschreibende Statistik | - numerische + grafische Verfahren zur Charakterisierung + Präsentation von Daten - explorative Datenanalyse geht aus ihr hervor |
| Was ist das Ziel der beschreibenden Statistik ? | Reduktion der Informationsfülle durch Aggregation auf wenige Kenngrößen |
| schließende Statistik | - zieht Schlussfolgerungen aus Daten - Beschreibung der Schlussfolgerungen durch Wahrscheinlichkeitsrechnung - Schätzen von Modellparametern und Hypothesentest |
| Welcher Teilbereich der Statistik wird am meisten verwendet? | beschreibende Statistik |
| Was ist das angestrebte Lernziel? | Methodenkompetenz (passive und aktive) |
| Was ist passive Methodenkompetenz? | - Kenntnis alternativer Möglichkeiten der Auswertung und Präsentation - Fähigkeit, statistische Informationen zu interpretieren |
| Was ist aktive Methodenkompetenz? | - Handlungskompetenz - Fähigkeit, im Alltag Entscheidungen empirisch zu fundieren und nachvollziehbar zu kommunizieren |
| Statistische Einheiten oder Merkmalsträger | - an ihnen werden Daten erhoben - Objekte, auf die sich die Untersuchungen beziehen (Personen, Bauteile, Tiere) |
| Grundgesamtheit | - klar abgegrenzt - die Menge aller für Fragestellung interessanten statistischen Einheiten - ggf. aufgeteilt in Teilmengen |
| Merkmale oder Variablen | - Eigenschaften statistischer Einheiten - werden in Großbuchstaben angegeben |
| Merkmalsausprägungen | - mögliche Werte, die ein Merkmal annehmen kann - in Kleinbuchstaben |
| Stichprobe | - Teilmenge der Grundgesamtheit |
| Urwerte, Primärdaten, Rohdaten | beobachtete Werte für ein Merkmal |
| Urliste | alle Urwerte in Listenform |
| Zufallsvariable | wenn Ausprägung eines Merkmals als Zufallsvorgang interpretiert wird |
| Realisierung | Ausprägung einer Zufallsvariablen |
| Stichprobenvariablen | die Ausprägungen aller Elemente einer Stichprobe |
| Welche Merkmale können auftreten? | - diskrete Merkmale : endlich viele, eindeutige Abstände, z.B. Anzahl Semester, Familienstand - stetige Merkmale : Zwischenwerte sind möglich, z.B. Zeit, Länge, Gewicht |
| Nominalskala | Merkmalsausprägungen als Namen, z.B. Studienfach, keine natürliche Rangordnung |
| Ordinalskala | - natürliche Rangordnung, z.B. Schulnoten |
| Verhältnisskala | hat einen Nullpunkt, z.B. Geschwindigkeit |
| Intervallskala | ohne Nullpunkt, z.B. Temperatur in C° |
| Absolutskala | hat Nullpunkt und eine natürliche Einheit, z.B. Anzahl der Fachsemester |
| Typen der Merkmalsausprägungen | - qualitatives Merkmal : Ausprägungen sind Kategorien, drückt Andersartigkeit aus, Nominal- oder Ordinalskaliert - quantitatives Merkmal : echte Zahlen, drücken Intensität aus, metrisch skaliert |
| Operationalisierung von Merkmalen | - Festlegung von Messanweisungen - Objektivität. Reliabilität, Validität müssen gewährleistet sein |
| manifeste Variablen | - direkt beobachtbar, z.B. Alter |
| latente Variablen | - nicht direkt beobachtbar, z.B. Intelligenz |
| Datenerhebung | Gewinnung von Daten |
| Erhebungsdesign | Planung der Datengewinnung |
| Primärerhebung | Daten werden eigens für Untersuchungsziel gewonnen |
| Sekundärerhebung | Daten existieren schon |
| Tertiärerhebung | aus Datenaggregaten existierender Daten |
| Arten der Datenerhebung | - Befragung (mündlich/schriftlich) - Beobachtung - Experiment - Querschnittstudien (Ausprägung eines Merkmals an verschiedenen Merkmalsträgern zu einem Zeitpunkt) - Längsschnittstudien (ein Merkmal anhand mehrerer Merkmalsträger im Zeitverlauf) - Panel Studie (Kombination aus Quer- und Längsschnitt) |
| Auswahlpopulation | Population die aus der Stichprobe gezogen wird |
| undercoverage | einige Elemente der Grundgesamtheit fehlen in der Auswahlpopulation |
| overcoverage | einige Elemente in Auswahlpopulation sind zuviel, gehören nicht zur Grundgesamtheit |
| Zufallsstichprobe | jedes Elemente hat die gleiche Chance in die Stichprobe zu kommen |
| Inferenzschluss | Rückschuss der Eigenschaften von der Stichprobe auf die Grundgesamtheit |
| Auswahlbias | systematische Stichprobenverzerrung |
| einfache Zufallsstichprobe | Stichprobenauswahl zufällig und so geplant, dass jede Teilmenge der Grundgesamtheit dieselbe Auswahlwahrscheinlichkeit hat (z.B. Lottozahlen) |
| geschichtete Zufallsauswahl | - Zerlegung der Grundgesamtheit in Teilgesamtheiten, die sich nicht überlappen - Aus jeder Schicht werden Zufallsstichproben gezogen - Kenntnis der Schichtungsvariablen erforderlich - zweistufiges Auswahlverfahren : - Schichtung festlegen - proportionale Zufallsauswahl treffen |
| proportional geschichtete Stichprobe | fester Anteil entnommener Elemente pro Schicht, der proportional zum Schichtumfang ist |
| disproportional geschichtete Stichprobe | wenn Schichten zu dünn besetzt sind, werden mehr Elemente gezogen |
| Klumpen | - natürliche Aufteilung der Grundgesamtheit (z.B. Schulklassen) - Zufallsstichprobe aus Menge der Klumpen - Untersuchung aller Elemente der gewählten Klumpen |
| Quotenauswahl | - Stichprobe mit Quotenvorgabe (z.B. Geschlecht, Alter) - Ziel: verkleinertes Abbild der Grundgesamtheit |
| amtliche Statistik | - Statistisches Bundesamt - Statistische Landesämter - Kommunale Statistikämter |
| nicht amtliche Statistik | - private Institute für Markt- und Meinungsforschung - Wirtschaftsforschungsinstitute |
| univariate Urliste | - Erhebung von Merkmalsausprägungen für ein Merkmal X an n Merkmalsträgern - Werte können mehrfach auftreten - je genauer die Messung stetiger Merkmale, desto weniger häufig treten Werte mehrfach auf |
| gruppierte Daten | Zerlegung der Datenmenge in Teilintervalle |
| absolute Häufigkeit | - Häufigkeit einer Ausprägung oder Klassenbesetzung hi = h(ai) i = 1, 2, ...., k |
| relative Häufigkeit | - als Prozentwerte angebbar - Absolute Häufigkeit / Anzahl Messwerte fi = f(ai) = h(ai) / n i = 1, 2, ...., k |
| empirische Verteilung | - grafische Darstellungsformen : - Kreisdiagramm - Stabdiagramm - Säulen- oder Balkendiagramm - Histogramm |
| absolute kumulierte Häufigskeitsverteilung | - wenn man für einen beliebigen reellen Wert x die Anzahl der Beobachtungen ermittelt, die x nicht überschreiten - H(x) |
| relative kumulierte Häufigkeitsverteilung | wenn man H(x) durch den Umfang n des Datensatzes dividiert F(x) = H(x) / n |
| Lagemaße | Zentrum, Schwerpunkt, Streuung, Schiefe |
| Modalwert Xmod | - Merkmalsausprägung mit größter Häufigkeit - wenn zwei gleiche größte Ausprägungen, dann gibt es zwei Modalwerte - robust gegen Ausreißer |
| Median Xmed | - mind. Ordinalskala - robust gegen Ausreißer - der mittlere Wert eines geordnet vorliegenden Datensatzes - bei n gerade: Mittelwert der beiden zentralen Werte |
| Mittelwert, arithmetisches Mittel | - metrische Skala - hohe Sensitivität gegen Ausreißern - Summe aller Daten/Anzahl der Daten - alle Daten sind gleich gesichtet |
| geometrisches Mittel | - Veränderungsraten als Datengrundlage - zur Quantifizierung von Wachstumsraten, Lernzuwächsen etc. |
| gewichtetes arithmetisches Mittel | - jeder Wert wird mit einem Gewichtungsfaktor versehen |
| getrimmtes arithmetisches Mittel | - Randdaten bleiben unberücksichtigt - robuster gegen Ausreißer |
| Streuungsmaße | - Streuung innerhalb eines Datensatzes - metrische Skalierung |
| Spannweite R | - Daten aufsteigend sortiert - größter Wert - kleinster Wert - R: x(n) - x(1) - geringe Robustheit |
| Varianz s^2 | - einzelne Abweichungen vom Mittelwert im Quadrat summieren und durch Anzahl teilen - daraus folgt die Standardabweichung s als Wurzel der Varianz |
| korrigierte Varianz s^2 | - durch n-1 statt durch n teilen - hat günstigere Eigenschaften - daraus resultiert die korrigierte Standardabweichung s* |
| p-Quantil Xp | Q- Anteil p ist kleiner oder gleich - Anteil 1-p ist größer oder gleich - bei Median ist p = 0,5 - bei Quartilen : p = 0,25, 0,75 |
| Quartilsabstand Q | - Q: = X0,75 - X0,25 Dezile D1, D2, D3, ... = X0,1, X0,2, X0,3 .... Median ist also D5 |
| asymmetrische Verteilung | - über Dezime erkennbar - erstes Indiz: Nichtübereinstimmung von Median und Mittelwert |
| Boxplot | - grafische Darstellung zur Beurteilung einer empirischen Verteilung - fünf Charakteristika: 1. 2 Extremwerte 2. Differenz = Spannweite 3. Quartile X0,25 und X0,75 4. Median X0,5 |
| Vierfeldertafel | - für zwei binäre Merkmale - lässt sich in Baumdiagramm übertragen |
| Was bedeutet bivariat? | bivariat = zwei Merkmale |
| Kontingenztabellen | - Darstellung der Häufigkeiten von bivariaten Merkmalen - zeigt empirische Verteilung der beiden Merkmale - Randverteilungen sind Zeilen / Spaltensummen - Randverteilungen = Häufigkeitsverteilungen der Einzelmerkmale |
| Bedingte Häufigkeiten | - Verknüpfung von gemeinsamen Häufigkeiten mit den Randhäufigkeiten - so sind Zusammenhänge erkennbar - Einzelelement der Bedingung/Randhäufigkeit = bedingt relative Häufigkeit |
| Zufallsvorgang | Prozess, der zu einem von mehreren Ergebnissen führt, die sich gegenseitig ausschließen |
| Elementarereignisse | - die möglichen Ergebnisse des Prozesses - Omega ist die Ergebnismenge - nicht weiter zerlegbare Ergebnisse |
| Ereignis A | - Teilmenge A von Omega |
| Sicheres Ereignis | - Menge Omega definiert sicheres Ereignis - dagegen Komplementärereignis ist unmögliches Ereignis |
| Schnittmengen | - aus Teilmenge von Omega, z.B. wenn A und B realisiert sind |
| Vereinigungsmenge | A U B, wenn eines der Ereignisse A oder B eintritt |
| Venn-Diagramme | zur Veranschaulichung zusammengesetzter Ereignisse |
| endliche Ergebnismenge | - z.B. einfacher Münzwurf als Zufallsvorgang - Omega (Zahl,Kopf) -> sicheres Ereignis |
| unendliche Ergebnismenge | - z.B. Lotto : wie viel Spiele sind erforderlich, bis 6 richtige erreicht sind? - Ergebnismenge reicht von 1 - unendlich |
| Zufallsexperiment - Voraussetzungen | - kontrollierte Bedingungen - wiederholbar unter gleichbleibenden Bedingungen - z.B. Ziehung der Lottozahlen |
| Wahrscheinlichkeit | - für Auftreten eines Ereignisses A - egal ob Zufallsprozess unter kontrollierten oder nicht kontrollierten Bedingungen - Maßzahl ist P (A) (probability) - objektive Quantifizierung in Statistik - Bewertung der Chance für das Eintreten eines Ereignisses |
| Axiome von Kolmogoroff | - Bedingungen für P (A): - K1: Nicht-Negativitätsbedingung P(A)>0 -K2: Normierung der Ergebnismenge P (Omega) = 1 -K3: Additivität der Wahrscheinlichkeit disjunkter Ereignisse |
| Bedingungen für Laplace Experimente | - L1: Ergebnismenge ist endlich - L2: Wahrscheinlichkeiten für n Elementarereignisse sind alle gleich groß - z.B. Münzwürfe, Würfeln, Roulette |
| Urnenmodell | - zur Herleitung zentraler Ergebnisse für Zufallsvorgänge mit endlicher Ergebnismenge - N= durchnummerierte Kugeln = Grundgesamtheit - Auswahl der Kugeln entspricht Stichprobe des Umfangs n - mit Zurücklegen oder ohne |
| Bedingte Wahrscheinlichkeiten | - es gibt Vorabinformationen (Bedingungen ) - P (AIB) ist Wahrscheinlichkeit von A unter der Bedingung B |
| Trägermenge | alle Werte/Ausprägungen einer Zufallsvariablen X die X annehmen kann |
| Wahrscheinlichkeitsfunktion | - ordnet jeder Ausprägung xi eine Eintrittswahrscheinlichkeit pi zu - wird auf Null gesetzt für alle x außerhalb der Trägermenge, damit ist die Funktion für alle reellen Zahlen erklärt |
| diskrete Gleichverteilung | - wenn alle Ausprägungen gleiche Eintrittswahrscheinlichkeit p haben - z.B. fairer Würfel hat p = 1/6 für alle x |
| theoretische Verteilungsfunktion | - monoton wachsende Treppenfunktion - Aufaddieren der pi - im Experiment nähert sich relative Häufigkeit der Funktion an |
| Bernoulli-Verteilung | - wenn Zufallsvariable X nur zwei Ausprägungen hat - z.B. Münzwurf - dann ist p1=p und p2=1-p |
| Erwartungswert | - Schwerpunkt der Verteilung der diskreten Zufallsvariablen - Gewichtung über Eintrittswahrscheinlichkeiten der einzelnen Ausprägungen |
Want to create your own Flashcards for free with GoConqr? Learn more.