To tylko jedna z 2 stron tej notatki. Zaloguj się aby zobaczyć ten dokument.
Zobacz
całą notatkę
ĆWICZENIE 6 REGRESJA NIELINIOWA Cel Zapoznanie z modelem regresji nieliniowej. Wykonanie przykładowych obliczeń dotyczących modelu regresji nieliniowej dla danych dyskretnych ze szczególnym uwzględnieniem poprawnej interpretacji wyników. Wprowadzenie teoretyczne Regresja nieliniowa jest w pewnym sensie podobna do regresji liniowej. Podstawową różnicę stanowi tutaj fakt, że zmienna objaśniana nie jest zmienną ciągłą. Regresja nieliniowa może być wykorzystywana do prognozowania zmiennej wynikowej, która przyjmuje dwie lub więcej wartości wynikowych. W celu wykorzystania tej regresji, dyskretna zmienna objaśniana jest zamieniana na zmienną ciągłą poprzez funkcję prawdopodobieństwa. Najczęściej wykorzystywanymi w praktyce modelami z dyskretną zmienną objaśnianą są: • model logistyczny („logit”), • model probitowy („probit”), • model „log-log”. Pozwalają one opisać zależności między częstościami występowania poszczególnych wariantów zmiennej objaśnianej a wybranymi zmiennymi objaśniającymi. W praktyce często mamy do czynienia z obserwacjami zmiennej objaśnianej, które można podzielić tylko na dwie kategorie. Wynik każdej obserwacji n y y y ,..., , 2 1 może być interpretowany jako sukces lub porażka. Wówczas zmienne n y y y ,..., , 2 1 nazywane są obserwacjami binarnymi , danymi binarnymi lub reakcjami binarnymi . Przyjmuje się, że n y y y ,..., , 2 1 mają rozkład Bernoulliego ( ) i p B , 1 , gdzie i p można interpretować jako prawdopodobieństwo sukcesu. Rozkład obserwacji n y y y ,..., , 2 1 jest określony za pomocą funkcji prawdopodobieństwa ( ) ( ) i i y i y i i i p p p y f − − = 1 1 , . Model logistyczny jest postaci = − p p 1 log k k x x α α α + + + ... 1 1 0 , gdzie k x x x ,..., , 2 1 są zmiennymi objaśniającymi, k α α α ,..., , 2 1 są parametrami modelu. Ponadto zachodzi związek ( ) ( ) k k k k x x x x p α α α α α α + + + + + + + = ... exp 1 ... exp 1 1 0 1 1 0 . Model probitowy jest postaci ( ) k k x x p α α α + + + = Φ− ... 1 1 0 1 , gdzie Φ oznacza dystrybuantę rozkładu normalnego N(0,1).
(…)
…
log(− log(1 − p )) = α 0 + α 1 x1 + ... + α k x k .
Zadanie do wykonania
1. Plik dane.csv zawiera informacje o stanie cywilnym, wieku, płci i statusie zawodowym dwustu
czterech osób. Stosując model regresji logistycznej:
• sprawdzić zależność statusu zawodowego od pozostałych zmiennych,
• sprawdzić zależność stanu cywilnego od pozostałych zmiennych,
• obliczyć prawdopodobieństwo, że osoba będąca tzw…
... zobacz całą notatkę
Komentarze użytkowników (0)