Wprowadzenie do statystyki - ćwiczenie 7

Nasza ocena:

5
Wyświetleń: 686
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Wprowadzenie do statystyki - ćwiczenie 7 - strona 1 Wprowadzenie do statystyki - ćwiczenie 7 - strona 2

Fragment notatki:


ĆWICZENIE 6  REGRESJA NIELINIOWA    Cel   Zapoznanie z modelem regresji nieliniowej. Wykonanie przykładowych obliczeń dotyczących  modelu  regresji  nieliniowej  dla  danych  dyskretnych  ze  szczególnym  uwzględnieniem  poprawnej interpretacji wyników.      Wprowadzenie teoretyczne  Regresja  nieliniowa  jest  w  pewnym  sensie  podobna  do  regresji  liniowej.  Podstawową  różnicę stanowi tutaj fakt, że zmienna objaśniana nie jest zmienną ciągłą. Regresja nieliniowa może  być  wykorzystywana  do  prognozowania  zmiennej  wynikowej,  która  przyjmuje  dwie  lub  więcej  wartości  wynikowych.  W  celu  wykorzystania  tej  regresji,  dyskretna  zmienna  objaśniana  jest  zamieniana na zmienną ciągłą poprzez funkcję prawdopodobieństwa.  Najczęściej wykorzystywanymi w praktyce modelami z dyskretną zmienną objaśnianą są:   •  model logistyczny („logit”),  •  model probitowy („probit”),  •  model „log-log”.  Pozwalają  one  opisać  zależności  między  częstościami  występowania  poszczególnych  wariantów  zmiennej objaśnianej a wybranymi zmiennymi objaśniającymi.  W  praktyce  często mamy do  czynienia  z  obserwacjami  zmiennej  objaśnianej, które można  podzielić tylko  na dwie kategorie. Wynik każdej obserwacji  n y y y ,..., , 2 1  może być interpretowany  jako  sukces  lub  porażka.  Wówczas  zmienne  n y y y ,..., , 2 1   nazywane  są   obserwacjami  binarnymi ,  danymi  binarnymi   lub   reakcjami  binarnymi .  Przyjmuje  się,  że  n y y y ,..., , 2 1   mają  rozkład  Bernoulliego  ( ) i p B  , 1 ,  gdzie  i p    można  interpretować  jako  prawdopodobieństwo  sukcesu.  Rozkład  obserwacji  n y y y ,..., , 2 1  jest określony za pomocą funkcji prawdopodobieństwa  ( ) ( )  i i y i y i i i p p p y f − − = 1 1 , .  Model logistyczny  jest postaci  = −  p p 1 log k k x x α α α + + + ... 1 1 0 ,  gdzie  k x x x ,..., , 2 1   są  zmiennymi  objaśniającymi,  k α α α ,..., , 2 1   są  parametrami  modelu.  Ponadto  zachodzi związek  ( ) ( ) k k k k x x x x p α α α α α α + + + + + + + = ... exp 1 ... exp 1 1 0 1 1 0 .  Model probitowy  jest postaci  ( ) k k x x p α α α + + + = Φ− ... 1 1 0 1 ,  gdzie  Φ  oznacza dystrybuantę rozkładu normalnego N(0,1). 

(…)


log(− log(1 − p )) = α 0 + α 1 x1 + ... + α k x k .
Zadanie do wykonania
1. Plik dane.csv zawiera informacje o stanie cywilnym, wieku, płci i statusie zawodowym dwustu
czterech osób. Stosując model regresji logistycznej:
• sprawdzić zależność statusu zawodowego od pozostałych zmiennych,
• sprawdzić zależność stanu cywilnego od pozostałych zmiennych,
• obliczyć prawdopodobieństwo, że osoba będąca tzw…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz