Ma 6 stron. Można w niej znaleźć takie kwestie jak: tablica korelacyjna dwu zmiennych, niezależność korelacyjna, siła, kierunek i kształt związku korelacyjnego, tablica czteropolowa.
Sposoby stwierdzenia zależności korelacyjnej
W przypadku obserwacji statystycznej dotyczącej dużej ilości zmiennych, operowanie wartościami szczegółowymi jest uciążliwe. W celu stwierdzenia istnienia lub braku związku korelacyjnego konstruuje się tablicę korelacyjną. Na skrzyżowaniu kolumn z wierszami wpisuje się liczebności jednostek zbiorowości statystycznej, u których zaobserwowano jednoczesne występowanie określonej wartości xi i yi. Tablica korelacyjna dwu zmiennych
xi yj
y1
y2
...
yj
...
yr
x1
x2
.
.
.
xj
.
.
xk
n 11
n 21
.
.
.
n i1
.
.
n k1
n 12
n 22
.
.
.
n i2
.
.
n k2
…
…
…
…
…
…
…
…
…
n 1j
n 2j
.
.
.
n ij
.
.
n kj
…
…
…
…
…
…
…
…
…
n 1r
n 2r
.
.
.
n ir
.
.
n kr
n 1.
n 2.
.
.
.
n j.
.
.
n k.
n .1
n .2
…
n .j
…
n .r
n
Jak wynika z tablicy zmienna losowa x przyjmuje k wariantów (i=1,2,...,k), zaś zmienna losowa y przyjmuje r wariantów (j=1,2,...,r). Symbol „n .j” oznacza liczbę jednostek, które mają wariant yj zmiennej Y, natomiast symbol ni. - liczbę jednostek, które mają wariant xi zmiennej X. Symbole nij oznaczają liczbę jednostek, które posiadają jednocześnie wariant xi cechy X i warianty yj cechy Y. Symbol n oznacza liczebność próby, przy czym:
Zamiast liczebności absolutnych nij można w tablicy korelacyjnej podawać częstości względne: . Jeżeli zmienne X i Y są zmiennymi ciągłymi, to wartości xi i yj w tablicy korelacyjnej są środkami przedziałów klasowych.
W tablicy korelacyjnej zawarte są dwa rodzaje rozkładów: brzegowe i warunkowe. Rozkład brzegowy prezentuje strukturę wartości jednej zmiennej (x lub y) bez względu na kształtowanie się wartości drugiej zmiennej. Z tego wynika, że w tablicy korelacyjnej są dwa rozkłady brzegowe. Rozkład brzegowy zmiennej X tworzy pierwsza i ostatnia kolumna tablicy, natomiast rozkład brzegowy zmiennej Y - pierwszy i ostatni wiersz.
Rozkład warunkowy prezentuje strukturę wartości jednej zmiennej (x lub y) pod warunkiem, że druga zmienna przyjęła określoną wartość. Rozkład warunkowy zmiennej x zapisujemy następująco: x/y = y
(…)
… wprowadza się poprawkę Yatesa otrzymując:
Ćwiczenie 1. Za Sobczyk str. 199 (wyd. z 1991 roku)
W 600 osobowej losowo dobranej grupie ludzi przeprowadzono badanie ankietowe mające na celu uzyskać odpowiedź na pytanie: „Czy istnieje zależność między wykształceniem telewidzów a rodzajem programu, który oglądają najchętniej?”. Wyniki przedstawiono w tablicy.
Wykształcenie
(X)
Rodzaj programu (Y)
Ogółem Film Teatr Programy rozrywkowe
Programy publicystyczne
Podstawowe Średnie
Wyższe 105
120
35
10
60
30
75
80
15
10
40
20
200
300
100
Ogółem
260
100
170
70
600
Za pomocą testu niezależności zweryfikuj hipotezę o niezależności stochastycznej zmiennych X i Y. Przyjąć poziom istotności .
Step 1.
Teoretyczne liczebności otrzymujemy mnożąc sumę liczebności i-tego wiersza przez sumę liczebności j-tej kolumny…
… oblicza się ze wzoru = (suma liczebności empirycznych i-tego wiersza x suma wartości empirycznych j-tej kolumny) : liczebność próby.
Obszar krytyczny (prawostronny) w rozważanym teście określa nierówność: gdzie jest wartością krytyczną odczytaną z tablicy rozkładu dla ustalonego z góry poziomu istotności α (0,05 lub 0,01) i dla (k-1)(r-1) stopni swobody w taki sposób, aby zachodziła relacja…
… wykształcenia ma związek z rodzajem oglądanych programów telewizyjnych. Jest to truizm, ale jak widać powyżej naukowo i matematycznie udowodniony.
…
... zobacz całą notatkę
Komentarze użytkowników (0)