Wykład 6 . Analiza regresji Analityczne wyrażenie kształtowania się zmiennej losowej pod wpływem innej zmiennej losowej Określenie 1 . Przez funkcję regresji dwóch zmiennych rozumie się funkcję opisującą zmiany w wartościach średnich warunkowych jednej zmiennej wywołane zmianami wartości drugiej zmiennej. Można mówić o funkcji regresji I rodzaju oraz o funkcji regresji II rodzaju . Funkcję regresji I rodzaju zmiennej Y względem zmiennej X wyraża się ogólnie w następujący sposób: ( ) ( ) k i x X Y E X f i ..., , 2 , 1 , | = = = . Dokładna postać tej funkcji nie jest znana. Na podstawie badań empirycznych można postawić odpowiednie hipotezy w tym zakresie (hipotezy modelowe). Określenie 2 . Regresją empiryczną zmiennej Y względem zmiennej X nazywa się zbiór punktów płaszczyzny XY o współrzędnych ( ) i i y x , , i = 1, 2, ..., k . Uwagi: Wykres takiego zbioru punktów tworzy tzw. empiryczną linię regresji. Zazwyczaj dysponuje się danymi indywidualnymi o wartościach badanych zmiennych, tj. xi oraz yi , dla i = 1, 2, …, n . Wówczas tworzy się wykresy zbiorów punktów o współrzędnych ( ) i i y x , . Na przykład, Rys. 1. Rozrzut punktów empirycznych wraz z dopasowanymi liniami regresji. Wykres jest najprostszym sposobem, który można wykorzystać formułując roboczą hipotezę na temat istniejącej zależności i jej postaci (np. liniowa). Liniowa funkcja regresji wyraża się wzorem: ( ) η α α η + + = + = X X f Y 1 0 , (1) gdzie: Y – zmienna zależna (objaśniana) X – zmienna niezależna (objaśniająca) η – resztowa zmienna losowa o własnościach: ( ) ( ) const D E = = = 2 2 0 η σ η η Empiryczne odpowiedniki modelu (1) są następujące: ( ) i i i i i u x a a u x f y + + = + = 1 0 (2) albo i i x a a y 1 0 ˆ + = , (2’) gdzie: 1 0, a a są ocenami parametrów 1 0, α α , natomiast i i i y y u ˆ − = są to tzw. reszty modelu. Określenie 3 . Funkcje wyrażone wzorami (2), (2’) przedstawiają tzw. funkcje II rodzaju. Warunki nałożone na funkcje II rodzaju:
(…)
… − yi ) 2
i= 1
n− 2
n
∑
i= 1
xi2
2
− n( x )
2) Ocenić stopień dopasowania modelu do danych
empirycznych
Miarami stosowanymi w tym wypadku są współczynnik
determinacji (R2) oraz współczynnik zbieżności (ϕ 2) [uwaga,
R2 + ϕ 2 = 1], tj.:
n
R2 =
( yi − y ) 2
∑ ˆ
i= 1
n
∑ ( yi − y ) 2
i= 1
n
ϕ
2
=
( yi − yi ) 2
ˆ
∑
i= 1
n
∑ ( yi − y ) 2
i= 1
,
Interpretacja
• Współczynnik determinacji informuje jaka…
… odrzucamy, a zatem nie jest prawdą,
że zmienna X nie wpływa na zmienną Y. Innymi słowy,
parametr regresji mierzący ten wpływ jest istotny
statystycznie.
Ad. (b)
Stawiamy hipotezy:
ˆ
H0 : Y = α 0 + α 1X
ˆ
H1 : Y ≠ α 0 + α 1 X
Stosujemy test serii
Jeżeli weryfikacji dokonujemy na podstawie danych
indywidualnych (a tak jest zazwyczaj), to postępujemy
następująco:
yi
porządkujemy według niemalejących wartości xi
xi
x1
x2
xn
yi
y1
y2
yn
> yi , to przyjmujemy A
ˆ
jeżeli yi < yi , to przyjmujemy B
ˆ
jeżeli yi = yi , to pomijamy
ˆ
jeżeli yi
yi
ˆ
y1
ˆ
y2
ˆ
yn
ˆ
ustalamy liczbę serii k oraz nA, nB, a także przyjmujemy
poziom istotności γ
Podejmujemy decyzję weryfikacyjną według następujących
zasad:
- jeżeli k > kγ ,n A ,nB , to nie ma podstaw do odrzuceni H0,
- jeżeli k ≤ kγ ,n A ,nB , to H0…
... zobacz całą notatkę
Komentarze użytkowników (0)