To tylko jedna z 54 stron tej notatki. Zaloguj się aby zobaczyć ten dokument.
Zobacz
całą notatkę
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy uczące się. Wydawnictwo Naukowo- Techniczne, 2005. J. Koronacki i J. Mielniczuk Statystyka dla studentów kierunków technicznych i przyrodniczych. Wydawnictwo Naukowo-Techniczne, 2006. P. Biecek Przewodnik po pakiecie R. http://cran.r-project.org/doc/contrib/Biecek-R-basics.pdf PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Prosta regresja liniowa Pytanie : Mając próbę zawierającą wartości zmiennych dla badanych obiektów, na przykład Xi oraz Yi , pytamy czy istnieje związek pomiędzy tymi wartościami? Szukamy związku liniowego y = β0 + β1x gdzie β0 i β1 są współczynnikami. Na przykład pytamy : Czy istnieje związek pomiędzy liczbą wypalanych papierosów a zachorowalnością na raka płuc? Co możemy powiedzieć o związkach pomiędzy wiekiem drzewa a jego wysokością? Czy śmiertelność noworodków wzrasta wraz ze spadkiem wysokości dochodów na osobę? Czy możemy stwierdzić że im więcej lat edukacji tym dłuższa oczekiwana długość życia? PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Przykład 1.1 Dane DANE1.txt 1 data1
(…)
… liniowej
Dla i = 1, 2 . . . , n
Yi zmienna objaśniana
Xi zmienna objaśniająca
Model
Yi = β0 + β1 Xi + εi
Yi wartość zmiennej objaśnianej dla i-tego osobnika
β0 - wyraz wolny
β1 - współczynnik nachylenia
Xi - wartość zmiennej objaśniającej dla i-tego osobnika
εi - błąd losowy o rozkładzie normalnym, ze średnią 0 i wariancją σ 2 .
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Własności prostego modelu regresji…
… liczba zmiennych objaśniających
Podstawowy model
Yi = β0 + β1 Xi,1 + · · · + βk Xi,k + εi ,
gdzie X1 , X2 , . . . , Xk są zmiennymi objaśniającymi, Xi,j - i-ta
obserwacja j-tej zmiennej objaśniającej
Parametry β0 , β1 , . . . , βk estymowane metodą MNK
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Przykład 1.2
Dane przykładowe: pakiet ISwR, dane cystfibr
Dane dotyczą funckjonowania płuc u osób chorych…
… lines (X , fitted ( lm . linear ) )
3 segments (X , fitted ( lm . linear ) ,X , Y )
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Przykład 1.1 - Wartości dopasowane a reszty
1 plot ( fitted ( lm . linear ) , resid ( lm . linear ) )
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Przykład 1.1 - Wykres kwantyl-kwantyl
1 qqnorm ( resid ( lm . linear ) )
Układ punktów ’na przekątnej’ sugeruje, że reszty pochodzą z
rozkładu…
…
1.1552 -1.510
0.152
fev1
1.0807
1.0809
1.000
0.333
rv
0.1970
0.1962
1.004
0.331
frc
-0.3084
0.4924 -0.626
0.540
tlc
0.1886
0.4997
0.377
0.711
Residual standard error: 25.47 on 15 degrees of freedom
Multiple R-squared: 0.6373,
Adjusted R-squared: 0.4197
F-statistic: 2.929 on 9 and 15 DF, p-value: 0.03195
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Przykład 1.2 - Krokowy wybór modelu
Chcemy uzyskać model…
... zobacz całą notatkę
Komentarze użytkowników (0)