Współczynnik korelacji Pearsona -jakie założenia powinny być spełnione oraz jak się go wyznacza? Współczynnik korelacji liniowej Pearsona Założenia metody:
1) cechy maja być mierzalne na skali interwałowej lub stosunkowej (ilorazowej)
2) musi występować związek pomiędzy cechami w przybliżeniu liniowym
3) rozkłady cech zbliżone do normalnych
Współczynnik ten ( r xy ) jest miernikiem siły związku prostoliniowego między dwoma cechami mierzalnymi. Związkiem prostoliniowym nazywamy taką zależność, w której jednostkowym przyrostom jednej zmiennej (przyczyny) towarzyszy, średnio biorąc, stały przyrost drugiej zmiennej (skutku).
Wzór na współczynnik korelacji liniowej Pearsona jest wyznaczany poprzez standaryzację kowariancji. Kowariancja jest średnią arytmetyczną iloczynu odchyleń wartości zmiennych X i Y od ich średnich arytmetycznych:
Kowariancja przekazuje następujące informacje o związku korelacyjnym:
cov( x,y ) = 0 - brak zależności korelacyjnej;
cov( x,y ) 0 - dodatnia zależność korelacyjna.
Kowariancja przyjmuje wartości liczbowe z przedziału: [-s( x )s( y ), +s s( x )s( y )], gdzie s( x ) i s( y ) są odchyleniami standardowymi odpowiednich zmiennych.
Jeżeli cov( x,y ) = -s( x )s( y ), to między zmiennymi istnieje ujemny związek funkcyjny. Przy dodatnim związku funkcyjnym cov( x,y ) = +s( x )s( y ).
Kowariancja charakteryzuje współzmienność badanych zmiennych, ale jej wartość zależy od rzędu wielkości, w jakich wyrażone są obydwie cechy, co powoduje, że nie można jej wykorzystać w sposób bezpośredni do porównań.
Unormowanym miernikiem natężenia i kierunku współzależności liniowej dwóch zmiennych mierzalnych X i Y jest współczynnik korelacji linowej Pearsona, wyznaczony przez standaryzację kowariancji: Współczynnik korelacji liniowej Pearsona jest miarą unormowaną, przyjmującą wartości z przedziału: -1
(…)
…. Jeżeli natomiast , to brak jest związku korelacyjnego między badanymi zmiennymi X i Y.
Współczynnik korelacji jest określonym wskaźnikiem, a nie pomiarem na skali liniowej o jednakowych jednostkach. Oznacza to, że zależność rxy = 0,90 nie jest dwukrotnie większa od rxy = 0,45.
Kwadrat współczynnika korelacji nazywamy współczynnikiem determinacji . Informuje on o tym, jaka część zmian zmiennej objaśniającej (skutek) jest wyjaśniona przez zmiany zmiennej objaśniającej (przyczyna). Przykład W pewnym Urzędzie Stanu Cywilnego pewnego dnia przeprowadzono badanie nowo zawartych małżeństw wg wieku żony i męża. Wyniki badania losowo pobranych par przedstawiono niżej.
Określić siłę i kierunek zależności między badanymi zmiennymi. [Sobczyk str. 209-210, wyd.1991]
Wiek żony (xi)
18
19
20
21
23
24
26
27
27
30
Wiek męża (yi)
19
21
23
21…
... zobacz całą notatkę
Komentarze użytkowników (0)