Kroos

Beschreibung

Multivariate Statistik Karteikarten am Kroos, erstellt von Bastian Chaumet am 25/03/2017.
Bastian  Chaumet
Karteikarten von Bastian Chaumet, aktualisiert more than 1 year ago
Bastian  Chaumet
Erstellt von Bastian Chaumet vor mehr als 7 Jahre
5
0

Zusammenfassung der Ressource

Frage Antworten
Nennen Sie die fünf Arbeitsschritte bei der Aufbereitung von Daten Prüfen der Analytik Entfernung überbestimmter Größen Entfernung von Parametern mit zu wenigen qualifizierenden Objekten Substituierung der Werte kleiner Nachweisgrenze Univariate Kenngrößen Ausreißertest
Aus welchen Gründen wird eine Regressionsanalyse durchgeführt?  Beziehungen zwischen abhängigen und unabhängigen variablen herstellen  Sie wird insbesondere verwendet, wenn Zusammenhänge quantitativ zu beschreiben oder Werte der abhängigen Variablen zu prognostizieren sind
Was ist die einfache Regression (Formel)? Y= b0 + b1 * X
Was sind Residuen?  Abweichungen von Regression ek = Yk-`Yk Nicht erklärte abweichungen
Was ist eine Multiple Regression (Formel)? Yˆ = b + b ⋅ X + b ⋅ X +...+ b ⋅ X +...+ b ⋅ X
Gesamtabweichung = erklärte Abweichung + Residuum
Gesamtstreuung = summe aller quadrierten Gesamtabweichungen einer Beobachtung, Gesamtstreuung= erklärte Streuung + nicht erklärte Streuung
Bestimmtheitsmaß
Abbildung mit Abweichungen
Beschreiben Sie das Vorgehen beim F-Test? Berechnung des empirischen F-Wertes Vorgabe eines Signifikanzniveaus Auffinden des theoretischen F-Wertes Vergleich des empirischen mit dem theoretrischen F-Wert
Nennen Sie die Formel für den empirischen Wert? Was gibt dieser an?
Was ist eine Distanzmatrix und was gibt diese an? - Ergebnisse der Proximitätsmaße werden in der Distanzmatrix festgehalten. - Beschreibt die Ähnlichkeit oder Unähnlichkeit zwischen Objekten oder Mengen von Objekten. - Wird als Zhalenwert festgehalten. Umso ähnlicher jer größer der Wert des Ähnlichkeitsmaßes oder je kleiner der Wert des Distanzmaßes
Welche Distanzmaße gibt es? Erklären Sie diese kurz! Ähnlichkeit – Unähnlichkeit s.o.
Nennen Sie die Formel für die Ähnlichkeits- und Unähnlichkeitsmatrix nach Jaccard! S= a/ a+b+c
Was ist das Ziel der Clusteranalyse? Worin besteht der Unterschied zur Faktorenanalyse? Bildung bzw. Identifizierung von Gruppen, die untereinander möglichst ähnlich und zu anderen Gruppen möglichst unterschiedlich sind; in Bezug auf alle untersuchten Variablen gleichzeitig. Die Faktorenanalyse ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen vieler verschiedener manifester Variablen auf wenige zugrunde liegende latente Variablen zu schließen.
Welche Verfahren der Gruppenbildung gibt es? hierarchisch partitionierend graphentheoretisch optimierend
Wie können diese weiter unterschieden werden?
Welche agglomerierenden Clusterverfahren gibt es? Single Linkage Complete Linkage Ward Avergae Linkage Centroid Median
Single Linkage Clusterverfahren nearest neighbour Clusterbildung mittels Auswertung der Distanzmatrix Fusionierung von Objekten mit geringster Distanz nur das Objekt mit geringsten Distanz wird innerhalb des Clusters betrachtet
Complete Linkage Clusterverfahren furthest neighbour Fusionierung von Objekten mit geringster Distanz nur das Objekt mit größter Distanz wird innerhalb des Clusters betrachtet eher kleine Gruppen
Average Linkage Clusterverfahren Mittel zwischen beiden Extrema Single und Complete Linkage Proximitäts-/ Distanzmaß ist der mittlere Abstand zwischen allen Paaren der beteiligten Cluster
Zentroid Clusterverfahren Zu empfehlen wenn Merkmale mind. intervallskalliert sind Für mehrfach besetzte Cluster wird arith. Mittelzentrum berechnet
Ward Clusterverfahren Varianzkriterium wird zur Fusionierung herangezogen Fusionierung von Objekten die die Varianz der neuen Gruppe am wenigsten erhöhen Bildung eher gleichgroßer Gruppen
+- Clusterverfahren
Beschreiben Sie das Vorgehen bei der hierarchischen Clusteranalyse! 1. Wahl des Proximitätsmaßes 2. Wahl des Fusionierungsalgorhytmus 3. Bestimmung der Anzahl von Clustern anhand des Varianzkriteriums
Was ist die Diskriminanzanalyse? Worin unterscheidet diese sich von der Clusteranalyse? Methode der multivariaten Statistik, um über eine Raumtransformation eine gute Darstellung von Merkmalen zu Erreichen. Im Unterschied zur Clusteranalyse ist die Diskriminanzanalyse kein exploratives, sondern ein konfirmatorisches Verfahren.
Geben Sie die Allgemeinform der Diskriminanzfunktion an und erklären Sie die Parameter!
Woraus setzt sich das Diskriminanzkriterium zusammen (Formel)? erklärte/ nicht erklärte Streuung
Nennen Sie die Formel des kanonischen Korrelationskoeffizienten! c=Wurzel(Gamma/1+Gamma) c=Wurzel(erklärte /Gesamtstreuung
Was gibt Wilks' Lambda an und wie steht er in Verbindung mit dem kan. Korrelationkoeff.? Lambda lässt sich in eine probabilistische Variable transformieren, die Wahrscheinlichkeitsaussagen über die Unterschiedlichkeit von Gruppen erlaubt. Statistische überprüfung der Diskriminanzfunktion
Wilks Lambda und kanonischer Koeff c^2+lambda=1
Geben Sie die Formel für die Transformation nach Chi² an!
Multivariate lineare Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrer unabhängiger Variablen auf eine metrische abhängige Variable
Schritte Multivariate lineare Regression 1 Formulierung des Modells 2 Schätzung der Regressionsfunktion 3 Prüfung der Regressionsfunktion
r>=1 positive Konstante
r=1 City Block Metrik L1 Norm
r=2 euklidische Distanz L2 Norm
Euklidische Distanz quadrierte Differenzen werden addiert Aus ihrer Summe wird Quadratwurzel gezogen
City Block Metrik Bei Clusterung von Standorten Bildet Diff von jeder Eigenschaft eines Objektpaares und addiert die abs Differenzwerte
Ward Verfahren für jede beliebige Zusammenfassung von 2 Clustern wird die Gesamtvarianz berechnet und exakt die Zusammenfassung gewählt
Dendrogramm je früher sich Cluster vereinen, desto ähnlicher sind sie Lange Äste zeigen einen großen Unterschied zwischen Clustern an
Vorraussetzung Diskriminanzanalyse Metrisch skalierte Merkmalsvariablen Normalverteilung der Daten kein Element darf gleichzeitig in mehreren Gruppen sein Stichproben mind doppelt so groß wie Anzahl Merkmalsvariablen Merkmalsvariablen> Anzahl Gruppen
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Physik Formeln
AntonS
Zeiten Englisch
anna.grillborzer0656
Analytische Geometrie
sonnenblume1997
Gedichtsanalyse und Interpretation
Laura Overhoff
Klimawandel
raphbey
Oxford Academic Word List Sub1
torsten fab
Fachinformatiker AE
Marie Mirschel
GESKO A PR WS 2018/19
Caroline Hannah
Vetie Para Morphologie
Kristin E
Vetie - Ts & spe. E. - 2021
Christopher Groß