Created by Bastian Chaumet
over 7 years ago
|
||
Question | Answer |
Nennen Sie die fünf Arbeitsschritte bei der Aufbereitung von Daten | Prüfen der Analytik Entfernung überbestimmter Größen Entfernung von Parametern mit zu wenigen qualifizierenden Objekten Substituierung der Werte kleiner Nachweisgrenze Univariate Kenngrößen Ausreißertest |
Aus welchen Gründen wird eine Regressionsanalyse durchgeführt? | Beziehungen zwischen abhängigen und unabhängigen variablen herstellen Sie wird insbesondere verwendet, wenn Zusammenhänge quantitativ zu beschreiben oder Werte der abhängigen Variablen zu prognostizieren sind |
Was ist die einfache Regression (Formel)? | Y= b0 + b1 * X |
Was sind Residuen? | Abweichungen von Regression ek = Yk-`Yk Nicht erklärte abweichungen |
Was ist eine Multiple Regression (Formel)? | Yˆ = b + b ⋅ X + b ⋅ X +...+ b ⋅ X +...+ b ⋅ X |
Gesamtabweichung | = erklärte Abweichung + Residuum |
Gesamtstreuung | = summe aller quadrierten Gesamtabweichungen einer Beobachtung, Gesamtstreuung= erklärte Streuung + nicht erklärte Streuung |
Bestimmtheitsmaß | |
Abbildung mit Abweichungen | |
Beschreiben Sie das Vorgehen beim F-Test? | Berechnung des empirischen F-Wertes Vorgabe eines Signifikanzniveaus Auffinden des theoretischen F-Wertes Vergleich des empirischen mit dem theoretrischen F-Wert |
Nennen Sie die Formel für den empirischen Wert? Was gibt dieser an? | |
Was ist eine Distanzmatrix und was gibt diese an? | - Ergebnisse der Proximitätsmaße werden in der Distanzmatrix festgehalten. - Beschreibt die Ähnlichkeit oder Unähnlichkeit zwischen Objekten oder Mengen von Objekten. - Wird als Zhalenwert festgehalten. Umso ähnlicher jer größer der Wert des Ähnlichkeitsmaßes oder je kleiner der Wert des Distanzmaßes |
Welche Distanzmaße gibt es? Erklären Sie diese kurz! | Ähnlichkeit – Unähnlichkeit s.o. |
Nennen Sie die Formel für die Ähnlichkeits- und Unähnlichkeitsmatrix nach Jaccard! | S= a/ a+b+c |
Was ist das Ziel der Clusteranalyse? Worin besteht der Unterschied zur Faktorenanalyse? | Bildung bzw. Identifizierung von Gruppen, die untereinander möglichst ähnlich und zu anderen Gruppen möglichst unterschiedlich sind; in Bezug auf alle untersuchten Variablen gleichzeitig. Die Faktorenanalyse ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen vieler verschiedener manifester Variablen auf wenige zugrunde liegende latente Variablen zu schließen. |
Welche Verfahren der Gruppenbildung gibt es? | hierarchisch partitionierend graphentheoretisch optimierend |
Wie können diese weiter unterschieden werden? | |
Welche agglomerierenden Clusterverfahren gibt es? | Single Linkage Complete Linkage Ward Avergae Linkage Centroid Median |
Single Linkage Clusterverfahren | nearest neighbour Clusterbildung mittels Auswertung der Distanzmatrix Fusionierung von Objekten mit geringster Distanz nur das Objekt mit geringsten Distanz wird innerhalb des Clusters betrachtet |
Complete Linkage Clusterverfahren | furthest neighbour Fusionierung von Objekten mit geringster Distanz nur das Objekt mit größter Distanz wird innerhalb des Clusters betrachtet eher kleine Gruppen |
Average Linkage Clusterverfahren | Mittel zwischen beiden Extrema Single und Complete Linkage Proximitäts-/ Distanzmaß ist der mittlere Abstand zwischen allen Paaren der beteiligten Cluster |
Zentroid Clusterverfahren | Zu empfehlen wenn Merkmale mind. intervallskalliert sind Für mehrfach besetzte Cluster wird arith. Mittelzentrum berechnet |
Ward Clusterverfahren | Varianzkriterium wird zur Fusionierung herangezogen Fusionierung von Objekten die die Varianz der neuen Gruppe am wenigsten erhöhen Bildung eher gleichgroßer Gruppen |
+- Clusterverfahren | |
Beschreiben Sie das Vorgehen bei der hierarchischen Clusteranalyse! | 1. Wahl des Proximitätsmaßes 2. Wahl des Fusionierungsalgorhytmus 3. Bestimmung der Anzahl von Clustern anhand des Varianzkriteriums |
Was ist die Diskriminanzanalyse? Worin unterscheidet diese sich von der Clusteranalyse? | Methode der multivariaten Statistik, um über eine Raumtransformation eine gute Darstellung von Merkmalen zu Erreichen. Im Unterschied zur Clusteranalyse ist die Diskriminanzanalyse kein exploratives, sondern ein konfirmatorisches Verfahren. |
Geben Sie die Allgemeinform der Diskriminanzfunktion an und erklären Sie die Parameter! | |
Woraus setzt sich das Diskriminanzkriterium zusammen (Formel)? | erklärte/ nicht erklärte Streuung |
Nennen Sie die Formel des kanonischen Korrelationskoeffizienten! | c=Wurzel(Gamma/1+Gamma) c=Wurzel(erklärte /Gesamtstreuung |
Was gibt Wilks' Lambda an und wie steht er in Verbindung mit dem kan. Korrelationkoeff.? | Lambda lässt sich in eine probabilistische Variable transformieren, die Wahrscheinlichkeitsaussagen über die Unterschiedlichkeit von Gruppen erlaubt. Statistische überprüfung der Diskriminanzfunktion |
Wilks Lambda und kanonischer Koeff | c^2+lambda=1 |
Geben Sie die Formel für die Transformation nach Chi² an! | |
Multivariate lineare Regression | Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrer unabhängiger Variablen auf eine metrische abhängige Variable |
Schritte Multivariate lineare Regression | 1 Formulierung des Modells 2 Schätzung der Regressionsfunktion 3 Prüfung der Regressionsfunktion |
r>=1 | positive Konstante |
r=1 | City Block Metrik L1 Norm |
r=2 | euklidische Distanz L2 Norm |
Euklidische Distanz | quadrierte Differenzen werden addiert Aus ihrer Summe wird Quadratwurzel gezogen |
City Block Metrik | Bei Clusterung von Standorten Bildet Diff von jeder Eigenschaft eines Objektpaares und addiert die abs Differenzwerte |
Ward Verfahren | für jede beliebige Zusammenfassung von 2 Clustern wird die Gesamtvarianz berechnet und exakt die Zusammenfassung gewählt |
Dendrogramm | je früher sich Cluster vereinen, desto ähnlicher sind sie Lange Äste zeigen einen großen Unterschied zwischen Clustern an |
Vorraussetzung Diskriminanzanalyse | Metrisch skalierte Merkmalsvariablen Normalverteilung der Daten kein Element darf gleichzeitig in mehreren Gruppen sein Stichproben mind doppelt so groß wie Anzahl Merkmalsvariablen Merkmalsvariablen> Anzahl Gruppen |
Want to create your own Flashcards for free with GoConqr? Learn more.