4. Logistische Regression

Beschreibung

Statistik Statistik (Regressionsanalytische Verfahren) Karteikarten am 4. Logistische Regression, erstellt von Stephanie Klupp am 17/12/2015.
Stephanie Klupp
Karteikarten von Stephanie Klupp, aktualisiert more than 1 year ago
Stephanie Klupp
Erstellt von Stephanie Klupp vor fast 9 Jahre
33
2

Zusammenfassung der Ressource

Frage Antworten
Was is Zweck/Ziel einer Logistischen Regression? Welche Skalierungen haben die Zielvariable und die Prädiktorenvariabeln? Vorhersage einer nominalen Variable durch intervallskalierte und/oder nominale Prädiktoren
Was ist der Unterschied zwischen der Diskriminanzanalyse und der Logistischen Regression? Logisitische Regression: hat eine kleine Power, ist weniger streng, hat keine Verteilungsvoraussetzung (weniger Anspruchsvoll), kann auch nominale Prädiktoren verwenden
Man muss der Verhältnis von Anzahl Fällen und Anzahl Prädiktoren beachten. Was ist das Problem? Wie kann man dieses Lösen? Problem: Overfitting Lösung: Katergorien zusammenfassen oder unwichtige Prädiktoren eleminieren
Was ist der Unterschied zwischen P(Wahrscheinlichkeit) und Odds? P = Wahrscheinlichkeit für den Prädiktor (Anzahl krank / Anzahl gesamt) = 0 < A < 1 Odds = Chance für den Prädiktor (Anzahl krank / Anzahl gesund) = 0 < A
Wie sieht die Gleichung aus? Und deren logarithmische Umformung? ln(odds) = B0 + B1*X1 + B2*X2 odds = e^B0 + e^B1*X1 + e^B2*X2
Was passiert wenn X1 um 1 zunimmt? (X1 + 1) ln(odds) ändert sich additiv um B1 Odds ändert sich multiplikativ um e^B1
Was bedeutet B? B0 = Y-Achsenabschnitt, wirkt sich auf die Höhe der Wahrscheinlichkeit aus Bi ist der Indikator wie Wichtig X1 ist, wirkt sich auf die Steigung aus
Was passiert wenn B1 = 0? Was passiert wenn B1 + 1? ln(odds) ändert sich additiv um 0 Odds ändert sich multiplikativ um e^0 = 1 => keine Veränderung B1+1 => erhöht die Steigung und Wichtigkeit von X
Was ist -2 Log likelihood? - Devianz - Wie gut die Modellanpassung ist - Wird mit Chiquadrat verglichen - Ziel: je kleiner desto besser
Was ist Nagelkerke R^2? - Pseudo R Statistik - Mass für den Anteil erklärter Varianz - Wie gut die Variable die Odds vorhersagt - Eindeutiger als Cox-Snell-R^2 - Ziel: R^2 > 0.5 (sehr gut) > 0.4 (gut) > 0.2 (akzeptable)
Tabelle Realität vs. Vorhergesagt Vorhergesagt: Realität: Krank Gesund Krank R + F- Gesund F+ R-
Was zeigt die ROC Kurve? Zusammenhang zwischen Sensitivität (Anzahl R+ / Anzahl Krank) (Ziel: möglichst gross) & 1-Spezifizität (Anzahl F+ / Anzahl Gesund) (Ziel: möglichst klein) - Ziel: Area under the curve > Zufall (0.5)
Tabelle Variables in the Equation: Interpretation der Effekte von nominalen vs. intervallskalierten Daten: Nominal: - B Unterschied zur Referenzkategorie (meistens die kleinste) - Betrachung der Referenzkategorie von Wald & Signifikanz Intervall: - Vorsichtig wegen der Skalierung - Aufnahme ins Modell -> Wichtigkeit
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Statistik Theorie
Clara Vanessa
Sachversicherungen
Christine Zehnder
METH STADA SS 2019
Caroline Hannah
Haftpflichtversicherungen
Christine Zehnder
Unfallversicherung
Christine Zehnder
Statistik und Differenzialgleichungen
barbara91
Statistik
vemi1994
beschreibende Statistik
birburlue
Statistik
Lily Lightman
Qualitative Methoden
kibo1337
Erfassung von Zusammenhängen: 4-Felder Tafeln
menes