Wykład 6 . Miary korelacji Pomiar korelacji w przypadku dwóch cech nominalnych Po stwierdzeniu zależności między badanymi cechami (patrz: poprzedni wykład – test niezależności χ 2) ocenia się siłę oraz ewentualnie charakter (dodatnia, ujemna) zależności. W tym zakresie można wykorzystać podane niżej miary. Współczynnik zbieżności Czuprowa + − − = = ) 1 )( 1 ( 2 l k n T T yx xy χ Warunki stosowania: Zależność między zmiennymi ma charakter liniowy Dane są ujmowane w tablicy korelacyjnej Zmienne mogą nie być mierzalne sensu stricto Własności: • Mierzy siłę zależności • Przyjmuje wartości z przedziału [0, 1] • Jest symetryczny Współczynnik Cramera + − − = ) 1 , 1 min( 2 l k n V χ Własności: • Przyjmuje wartości z przedziału [0, 1] • Może być obliczany na podstawie dowolnej tablicy korelacyjnej (w odróżnieniu od kolejnego – patrz niżej) Współczynnik Yule’a n 2 χ ϕ = Własności: • Przyjmuje wartości z przedziału [-1, 1] • Stosowany jest dla tablicy czterodzielnej Schemat tablicy czterodzielnej X Y ni . 1 2 1 a b a + b 2 c d c + d n. j a + c b + d n Współczynnik ϕ można teraz wyrazić wzorem: ( )( )( )( ) d c d b c a b a bc ad + + + + − = ϕ Uwaga , Znak oraz krańcowe wartości współczynnika ϕ zależą od uszeregowania liczebności w poszczególnych polach tablicy korelacyjnej. Wartość „0” omawianego współczynnika oznacza, że cechy są niezależne, – „1” lub „-1”, że istnieje między nimi zależność funkcyjna. Jednak nie należy na podstawie znaku współczynnika wyciągać wniosku o kierunku zależności. (Znak współczynnika zależy tutaj od tego w jaki sposób zostały uporządkowane warianty rozważanych cech). Wnioski: W tym wypadku interpretuje się jedynie wartość bezwzględną współczynnika. wartość ϕ wyliczoną według wzoru powyżej skorygować (patrz dalej) . Współczynniki Cole’a ( ) ( ) ( ) ( ) 0 , , min 0 , , min
(…)
…
korelacyjnej
Chcemy zweryfikować hipotezę, że zależność Y względem
X jest liniowa
Hipotezy:
H0: Zależność Y względem X jest liniowa
H1: Zależność Y względem X nie jest liniowa
Test statystyczny:
2
e 2 − rxy 1 − e 2
yx
yx
F=
:
k− 2
n− k
Statystyka F, przy założeniu prawdziwości hipotezy zerowej,
ma rozkład F-Snedecora o k – 2 i n – k stopniach swobody.
Decyzja weryfikacyjna:
Jeżeli F ≥ Fα ,( k − 2 ) ,( n− k…
… przyjmuje
postać:
( − ∞ ,− tα ,s ] ∪ [tα ,s ,+ ∞ )
lub
( − ∞ ,− uα ] ∪ [ uα ,+ ∞ ) .
Przykład
Badanie związku między dwiema cechami mierzalnymi sensu stricto
W celu ustalenia zależności między liczbą braków, w sztukach (Y)
a wielkością produkcji części zamiennych (X), w tys. sztuk, w grupie
12 zakładów produkcyjnych wytwarzających takie części wykorzystano
następujące dane.
xi 2,0 1,0 0,8 1,2 3,0 1,6 1,0…
… mogą być także wykorzystane do badania
zależności w sytuacji, gdy jedna z cech jest mierzalna sensu stricte,
druga zaś nominalna.
Badanie istotności statystycznej
Stawia się hipotezy
H 0 :η
yx
= 0,
H 0 :η
H1 :η
yx
> 0,
H1 :η
xy
xy
= 0,
> 0
Stosuje się odpowiedni test statystyczny, tj:
F=
lub
F=
e2
yx
k−1
2
exy
l−1
(1 − e2 )
yx
:
n− k
2
(1 − exy ) ,
:
n− l
gdzie: k – liczba wariantów zmiennej X,
l – liczba wariantów…
... zobacz całą notatkę
Komentarze użytkowników (0)