Sposób oceny niezależności(zależności) za pomocą testu chi-kwadrat * Statystyka bazuje na badaniach pełnych i częściowych . Wnioskowanie statystyczne- wyprowadzanie wniosków z próby na całą populację. Wnioskowanie odbywa się za pomocą kilku technik- korelacja-Pearson, test niezależności chi-kwadrat, test t-studenta * Test niezależności chi-kwadrat jest najpopularniejszym testem statystycznym służącym do badania zależności (związków) między dwiema cechami niemierzalnymi (jakościowymi) lub w przypadku badania niezależności cechy jakościowej z ilościową. * Hipoteza statystyczna.- dowolne przypuszczenie dotyczące rozkładu prawdopodobieństwa zmiennej losowej. Przykład- przeciętny wzrost ludzi w Polsce to 2 m. *Test statystyczny- to procedura statystyczna mająca na celu weryfikację hipotezy statystycznej (jej odrzucenie, bądź nie). Test ten jest regułą rozstrzygającą, jakie wyniki próby pozwalają uznać sprawdzoną hipotezę za prawdziwą, jakie natomiast za fałszywą. Załóżmy, że przedmiotem badania jest populacja generalna scharakteryzowana za pomocą dwóch jednakowych cech jakościowych. Z populacji tej wylosowano niezależnie dużą próbę o liczebności n elementów, a wyniki sklasyfikowano w tzw. tablicę niezależności o r wierszach i k kolumnach. Wnętrze tablicy niezależności stanowią liczebności n ij tych elementów próby, dla których wartości obu badanych cech należą do kombinacji (i, j) i - tego wiersza i j-tej kolumny. Tablica taka jest podstawą do weryfikacji nieparametryczne hipotezy zerowej (H 0 ) głoszącej, że n - elementowa próba losowa pochodzi z takiej zbiorowości generalnej, w której występuje niezależność stochastyczna zmiennych losowych x i y.
Hipotezę tę można zapisać zgodnie z pojęciem niezależności zmiennych losowych w sposób następujący:
H0; P (X = xi, Y = yj) = P (X = xi). P(Y = yj), czyli, że cechy X i Y są niezależne oraz
H1; P (X = xi, Y = yj) ¹ P (X = xi). P(Y = yj), czyli, że cechy X i Y są zależne,
przy przyjętym poziomie istotności a .
Do weryfikacji H 0 o niezależności stochastycznej zmiennych wykorzystuje się wzór:
Statystyka ta ma - przy założeniu prawdziwości H 0 - dla dużych prób asymptomatycznych rozkład z (r-1)(k-1) stopniami swobody.
Liczebności teoretyczne oblicza się ze wzoru:
Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki c 2 odczytaną przy poziomie istotności a i przy (r-1)(k-1) stopniach swobody, czyli: Obszar krytyczny (prawostronny) wyznacza nierówność . Jeżeli c2 ³ c2a; (r - 1)(k - 1) ® Ho odrzucamy na rzecz hipotezy alternatywnej
(…)
… programy
Płeć Kabarety Festiwale RAZEM
Mężczyzna 30
80
110
Kobieta 170
220
390
RAZEM
200
300
500
H0; cechy X i Y są niezależne (kolor włosów i kolor oczu są niezależne)
H1; cechy X i Y są zależne (kolor włosów i kolor oczu są zależne)
Do weryfikacji powyższych hipotez stosuje się statystykę c2 Z tablic rozkładu chi-kwadrat odczytujemy: c2a; (r - 1)(k - 1) Liczebności teoretyczne liczymy w następujący…
... zobacz całą notatkę
Komentarze użytkowników (0)