Created by Stephanie Klupp
almost 9 years ago
|
||
Question | Answer |
Was is Zweck/Ziel einer Logistischen Regression? Welche Skalierungen haben die Zielvariable und die Prädiktorenvariabeln? | Vorhersage einer nominalen Variable durch intervallskalierte und/oder nominale Prädiktoren |
Was ist der Unterschied zwischen der Diskriminanzanalyse und der Logistischen Regression? | Logisitische Regression: hat eine kleine Power, ist weniger streng, hat keine Verteilungsvoraussetzung (weniger Anspruchsvoll), kann auch nominale Prädiktoren verwenden |
Man muss der Verhältnis von Anzahl Fällen und Anzahl Prädiktoren beachten. Was ist das Problem? Wie kann man dieses Lösen? | Problem: Overfitting Lösung: Katergorien zusammenfassen oder unwichtige Prädiktoren eleminieren |
Was ist der Unterschied zwischen P(Wahrscheinlichkeit) und Odds? | P = Wahrscheinlichkeit für den Prädiktor (Anzahl krank / Anzahl gesamt) = 0 < A < 1 Odds = Chance für den Prädiktor (Anzahl krank / Anzahl gesund) = 0 < A |
Wie sieht die Gleichung aus? Und deren logarithmische Umformung? | ln(odds) = B0 + B1*X1 + B2*X2 odds = e^B0 + e^B1*X1 + e^B2*X2 |
Was passiert wenn X1 um 1 zunimmt? (X1 + 1) | ln(odds) ändert sich additiv um B1 Odds ändert sich multiplikativ um e^B1 |
Was bedeutet B? | B0 = Y-Achsenabschnitt, wirkt sich auf die Höhe der Wahrscheinlichkeit aus Bi ist der Indikator wie Wichtig X1 ist, wirkt sich auf die Steigung aus |
Was passiert wenn B1 = 0? Was passiert wenn B1 + 1? | ln(odds) ändert sich additiv um 0 Odds ändert sich multiplikativ um e^0 = 1 => keine Veränderung B1+1 => erhöht die Steigung und Wichtigkeit von X |
Was ist -2 Log likelihood? | - Devianz - Wie gut die Modellanpassung ist - Wird mit Chiquadrat verglichen - Ziel: je kleiner desto besser |
Was ist Nagelkerke R^2? | - Pseudo R Statistik - Mass für den Anteil erklärter Varianz - Wie gut die Variable die Odds vorhersagt - Eindeutiger als Cox-Snell-R^2 - Ziel: R^2 > 0.5 (sehr gut) > 0.4 (gut) > 0.2 (akzeptable) |
Tabelle Realität vs. Vorhergesagt | Vorhergesagt: Realität: Krank Gesund Krank R + F- Gesund F+ R- |
Was zeigt die ROC Kurve? | Zusammenhang zwischen Sensitivität (Anzahl R+ / Anzahl Krank) (Ziel: möglichst gross) & 1-Spezifizität (Anzahl F+ / Anzahl Gesund) (Ziel: möglichst klein) - Ziel: Area under the curve > Zufall (0.5) |
Tabelle Variables in the Equation: Interpretation der Effekte von nominalen vs. intervallskalierten Daten: | Nominal: - B Unterschied zur Referenzkategorie (meistens die kleinste) - Betrachung der Referenzkategorie von Wald & Signifikanz Intervall: - Vorsichtig wegen der Skalierung - Aufnahme ins Modell -> Wichtigkeit |
Want to create your own Flashcards for free with GoConqr? Learn more.