Fragment notatki:
Statystyka w analizie i planowaniu eksperymentu
Wykład 8
Testów proporcji i testów średnich ciąg dalszy
Przemysław Biecek
Dla 1 roku studentów Biotechnologii
Przypomnienie kilku faktów
Xi ∼ N (0, 1)
Yi = k Xi ∼ N (0, k)
i=1
Xi /a ∼ N (0, 1/a2 )
Xi2 ∼ χ2
1
Z=
k
2
i=1 Xi
√X
Z /k
Z1 /n1
Z2 /n2
∼ χ2
k
∼ tk
∼ Fn1 ,n2
Zmienne Xi mają rozkład normalny.
Suma zmiennych normalnych ma rozkład
normalny o odpowiedniej średniej i wariancji.
Iloczyn liczby o rozkładzie normalnym
i stałej ma rozkład normalny.
Kwadrat liczby o rozkładzie normalnym
ma rozkład χ2 z jednym stopniem swobody.
Jeżeli sumowanych jest więcej kwadratów
to otrzymujemy zmienną o rozkładzie χ2
o k stopniach swobody.
Iloraz zmiennej o rozkładzie normalnym
i o rozkładzie χ2 ma rozkład t-Studenta
k
o k stopniach swobody.
Iloraz dwóch zmiennych o rozkładzie χ2
ma rozkład F .
Testy c.d.
2/34
Test dla proporcji
Zadanie:
Czy częstość występowania genotypu bb o fenotypie niebieskich
oczu występuje w populacji z częstością 1 ?
4
Eksperyment:
Sprawdzono kolory oczu 200 studentów z biotechnologii, 70 z nich
miało niebieskie oczy.
Pytanie:
Czy próba jest prawidłowo zebrana?
Jeżeli jest to jak odpowiedzieć na Zadanie?
Testy c.d.
3/34
Test dla proporcji - duże próby
W dużych próbach rozkład częstości przybliżyć można rozkładem
normalnym. Do testowania hipotezy
H0 : p = p 0
gdzie p0 zadana wartość, wykorzystać można test oparty na
statystyce testowej
p − p0
.
p0 (1 − p0 )n
Przy prawdziwej hipotezie zerowej statystyka ta ma rozkład
normalny N (0, 1). Obszary krytyczne wyznacza się ze wzorów
dla dwustronnej hipotezy alternatywnej
Wα = (−∞, qα/2 ] ∪ [q1−α/2 , ∞)
dla lewostronnej hipotezy alternatywnej
Wα = (−∞, qα ]
dla prawostronnej hipotezy alternatywnej
Wα = [q1−α , ∞).
T (X ) = n
Testy c.d.
4/34
Test dla proporcji
p = 70/200 = 0.35
T (X ) = 200 √
0.35 − 0.25
= 3.27
0.25 ∗ 0.75 ∗ 200
Decyzja?
Testy c.d.
5/34
Test dla proporcji
Zadanie:
Czy częstość występowania genotypu bb u kobiet i u mężczyzn jest
taka sama?
Eksperyment:
Sprawdzono kolory oczu 200 studentów z biotechnologii (120
kobiet i 80 mężczyzn), 70 z nich miało niebieskie oczy
(odpowiednio 40k i 30m).
Pytanie:
Czy próba jest prawidłowo zebrana?
Jeżeli jest to jak odpowiedzieć na Zadanie?
Testy c.d.
6/34
Test dla proporcji - duże próby
W dużych próbach rozkład częstości przybliżyć można rozkładem
normalnym. Do testowania hipotezy
H0 : p1 = p2 ,
wykorzystać można test oparty na statystyce testowej
T1 (X ) =
p1 − p2
p1 (1−p1 )
n1
lub
T2 (X ) =
+
p2 (1−p2 )
n2
p1 − p2
1
p(1 − p)( n1 +
1
n2 )
.
.
Przy prawdziwej hipotezie zerowej statystyka ta ma rozkład
normalny N (0, 1). Obszary krytyczne wyznacza się jak dla testu
dla jednej próby.
Testy c.d.
7/34
Test dla proporcji
p = 70/200 = 0.35
p1 = 40/120 = 0.333
p2 = 30/80 = 0.375
T (X ) =
0.042
= 0.72
0.35 ∗ 0.65 ∗ (0.0083 + 0.0125)
Decyzja?
Testy c.d.
8/34
Test dla wariancji
Zadanie:
Czy zmienność ocen ze statystyki wśród kobiet jest taka sama jak
u mężczyzn?
Eksperyment:
2
2
Sprawdzono wyniki pierwszego kolokwium, SK = 0.7 a SM = 0.5.
Wyniki dla 50 kobiet i 20 mężczyzn.
Testy c.d.
9/34
Test F dla wariancji
Do testowania hipotezy
2
2
H0 : σ1 = σ2
gdzie σi2 to wariancja w grupie i, wykorzystuje się test oparty o
statystykę testową
S2
T (X ) = 1
2
S2
(większą wariancję zawsze wpisujemy do licznika).
Przy prawdziwej hipotezie zerowej statystyka ta ma rozkład
normalny F(n1 − 1, n2 − 1). Obszary krytyczne wyznacza się ze
wzorów
dla dwustronnej hipotezy alternatywnej !!!
n1 −1,n
Wα = [f1−α/2 2 −1 , ∞)
dla jednostronnej hipotezy alternatywnej
n1 −1,n
Wα = [f1−α 2 −1 , ∞).
Testy c.d.
10/34
Test dla wariancji
Wyliczona wartość statystyki testowej wynosi
T (x) = 0.7/0.5 = 1.4
Wartość krytyczna odczytana z tablic
(49,19)
f0.95
≈2
Decyzja?
Testy c.d.
11/34
Test Wilcoxona
Zadanie:
Czy liczba punktów z pierwszego kolokwium była większa niż na
drugim?
Eksperyment:
hmmmm....
Testy c.d.
12/34
Test Wilcoxona
Nieparametryczny odpowiednik testu t Studenta. W wersji
sparowanej hipoteza zerowa ma postać
H0 : θ = 0
gdzie θ to mediana różnic di = Yi − Xi . Do testowania
wykorzystuje się statystykę testową
S = min(W + , W − )
gdzie
W+ =
r (di ),
di 0
W− =
r (di )
di 20) statystykę S można
przybliżyć rozkładem normalnym o średniej n(n+1) i wariancji
4
n(n+1)(2n+1)
. Dla małych prób wartości krytyczne powinny być
24
odczytywane z tablic.
Testy c.d.
13/34
Test Wilcoxona
W wyniku eksperymentu zaobserwowano następujące di
d = c(−2, −1, 0.5, 2, −1, 1.5, 2.5, 2.5)
r (|d|) = c(3.5, 6.5, 8, 3.5, 6.5, 5, 1.5, 1.5)
W + = 7 + 3.5 + 5 + 1.5 + 1.5 = 18.5
W − = 3.5 + 6.5 + 6.5 = 16.5
S = 16.5
Odczytujemy kwantyle (0.05 dla alternatywy jednostronnej i 0.025
dla alternatywy dwustronnej)
8
q0.05 = 6,
8
q0.025 = 4
W pakiecie R kwantyl można odczytać korzystając z funkcji
qsignrank(kwantyl,n).
Testy c.d.
14/34
Test U Wilcoxona-Manna-Whitneya
Porównajmy dochody 10 wylosowanych z populacji pracujących
kobiet i mężczyzn, czy są one równe?
zarobki M = 1500, 2000, 3500, 5500, 10000
zarobki K = 1600, 1900, 2400, 4000, 5000
Testy c.d.
15/34
Test U Wilcoxona-Manna-Whitneya
To nieparametryczny odpowiednik testu t Studenta.
Hipoteza zerowa ma postać
H0 : θ X = θ Y
gdzie θX to mediana dla populacji X a θY dla Y .
Do testowania wykorzystuje się statystykę testową
n1
n2
U=
1Xi 20) statystykę U można przybliżyć
rozkładem normalnym o średniej n12n2 i wariancji n1 n2 (n1 +n2 +1) .
12
Dla małych prób wartości krytyczne odczytujemy z tablic.
Testy c.d.
16/34
Test U Wilcoxona-Manna-Whitneya
zarobki M = 1500, 2000, 3500, 5500, 10000
zarobki K = 1600, 1900, 2400, 4000, 5000
Wyznaczamy wartość statystyki U
U = 1 + 1 + 2 + 3 + 3 = 10.
Odczytujemy kwantyl dla rozkładu statystyki testowej
(5,5)
q0.025 = 3,
(5,5)
q0.975 = 22.
W pakiecie R kwantyl można odczytać korzystając z funkcji
qwilcox(kwantyl,n1, n2).
Teraz spróbujemy przybliżyć statystykę testową rozkładem
normalnym. Normalizujemy wynik statystyki testowej
z = (10 − 12.5)/ (25 ∗ 11/12) = −0.11
Testy c.d.
17/34
Test χ2
Czy cechy kolor oczu i płeć są ze sobą zależne?
niebieskie
brązowe
Testy c.d.
K
30
60
M
8
12
18/34
Test χ2
Do testowania hipotezy
H0 : X niezależne od Y
wykorzystuje się test oparty o statystykę testową
T =
(O − E )2
=
E
k
p
i=1 j=1
(nij − Eij )2
Eij
gdzie
Eij =
k
i=1 nij
k
i=1
p
j=1 nij
p
j=1 nij
.
Przy prawdziwej hipotezie zerowej statystyka ta ma rozkład
χ2
(k−1)(p−1) ze (k − 1)(p − 1) stopniami swobody.
Obszary krytyczne wyznacza się ze wzoru
2,(k−1)(p−1)
Wα = [χ1−α
Testy c.d.
, ∞)
19/34
Test χ2
Czy kolor oczu i płeć są ze sobą zależne?
Obserwowane
K M
niebieskie 30 8
38
brązowe 60 12 72
90 20 110
Oczekiwane
niebieskie
brązowe
K
31.1
58.9
90
M
6.9
13.1
20
38
72
110
T = 1.12 /31.1 + 1.12 /6.9 + 1.12 /58.9 + 1.12 /13.1 = 0.33
χ2,1 = 3.84
0.95
Testy c.d.
20/34
Test McNemara
Czy dziewczynki są bardziej podatne na chorobę niż chłopcy?
Zbadano grupę 110 par bliźniąt dwujajowych w których jedna
osoba jest chora a druga zdrowa.
zdrowy / chory
K
M
Testy c.d.
K
a=30
c=60
M
b=8
d=12
21/34
Test McNemara
Do testowania hipotezy
H0 : b występuje równie często jak c
wykorzystuje się test oparty o statystykę testową
T =
(b − c)2
.
b+c
Przy prawdziwej hipotezie zerowej statystyka ta ma rozkład χ2 z 1
1
stopniem swobody.
Obszary krytyczne wyznacza się ze wzoru
Wα = [χ2,1 , ∞)
1−α
Testy c.d.
22/34
Test Kołomogorova-Smirnova
Do testowania hipotezy
H0 : X ∼ F
wykorzystuje się test oparty o statystykę testową
Dn = sup |Fn (x) − F (x)|
x
gdzie Fn (x) to dystrybuanta empiryczna zadana wzorem
1
Fn (x) =
n
√
n
IXi ≤x .
i=1
n→∞
nDn − − sup |B(F (t))|
−→
t
Kwantyli rozkładu tej statystyki testowej najlepiej szukać w
tablicach.
Testy c.d.
23/34
Testy w R
Jak wykonać omawiane testy w R?
Test dla proporcji zaimplementowany jest w funkcji
prop.test(),
Test dla wariancji zaimplementowany jest w funkcji
var.test(),
Test dla parametrów przesunięcia zaimplementowany jest w
funkcji wilcox.test(),
Test χ2 zaimplementowany jest w funkcji chisq.test(),
Test McNemara zaimplementowany jest w funkcji
mcnemar.test(),
Test Kołomogorova-Smirnova χ2 zaimplementowany jest w
funkcji ks.test(),
Dobry test normalności zaimplementowany jest w funkcji
shapiro.test().
Testy c.d.
24/34
Wynik testowania
Bardzo Ważna Tabelka
Decyzja
Stan faktyczny
H0 prawdziwa
H0 fałszywa
przyjąć H0
ψ(x) = 0
decyzja poprawna
błąd II rodzaju
Testy c.d.
odrzucić H0
ψ(x) = 1
błąd I rodzaju
decyzja poprawna
25/34
Pojęcie mocy testu
Moc
Moc testu określamy jako prawdopodobieństwo odrzucenia
hipotezy zerowej, w sytuacji gdy jest ona fałszywa.
Moc zależy od:
przyjętego poziomu istotności,
rozmiaru próby,
różnicy pomiędzy alternatywą a hipotezą zerową.
Testy c.d.
26/34
Jak wyznaczyć moc?
W R to jest proste!
pwartosci = NULL
for (i in 1:1000) {
x = rnorm(n)
y = rnorm(n)+0.5
pwartosci[i] = t.test(x,y)$p.value }
mean(pwartosci)
0.331
Testy c.d.
27/34
Moc
0.2
0.3
0.4
moc
0.5
0.6
0.7
Moc w zależności od liczebności próby
10
20
30
40
50
n
Testy c.d.
28/34
Moc
0.1
0.2
0.3
moc
0.4
0.5
0.6
0.7
Moc w zależności od poziomu istotności
0.001
0.002
0.005
0.010
0.020
0.050
0.100
alpha
Testy c.d.
29/34
Moc
0.6
0.4
0.2
moc
0.8
1.0
Moc w zależności od różnic pomiędzy hipotezami
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
d
Testy c.d.
30/34
Brakujące obserwacje
W rzeczywistych danych często zdarzają się brakujące obserwacje
pomiar się nie powiódł a ze względów finansowych lub
organizacyjnych nie jesteśmy w stanie go powtórzyć,
jakiś pomiar przyjmuje ewidentnie błędną wartość, np.
ciśnienie =350,
operujemy na danych z innego źródła, które są niekompletne.
Testy c.d.
31/34
Brakujące obserwacje
Co zrobić?
Możemy usunąć cały przypadek w którym choć jeden pomiar
jest brakujący, są plusy i minusy,
Możemy wstawić za brakującą wartość wartość
charakterystyczną dla zmiennej (średnią, medianą),
Możemy przeprowadzić zbiór testów, wstawiając za brakującą
wartość losową wartość, jedną z występujących w próbie.
Testy c.d.
32/34
Studium przypadku
Zobaczmy, jak wyglądają rzeczywiste analizy.
Testy c.d.
33/34
Co trzeba zapamiętać?
Jak działa i po co jest test Wilcoxona?
Jak działa i po co jest test U-Wilcoxona-Manna-Withneya?
Jak działa i po co jest test χ2 ?
Jak działa i po co jest test proporcji?
Jak działa i po co jest test F?
Jak działa i po co jest test Kołomogorova Smirnova?
Co to jest moc i po co nam to pojęcie?
Testy c.d.
34/34
... zobacz całą notatkę
Komentarze użytkowników (0)