Testowanie hipotez w rodzinie rozkładów normalnych— przypadek nieznanego odchylenia standardowego Wykład 10; 23 kwietnia 2012 Przykład wprowadzaj ˛ acy Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszka´n w mie´scie A: 3 , 75; 3 , 89; 5 , 09; 3 , 77; 3 , 53; 2 , 82; 3 , 16; 2 , 79; 4 , 34; 3 , 61; 4 , 31; 3 , 31; 2 , 50; 3 , 27 . W prasie podano informacj˛e, ˙ze ´srednia cena metra kwadratowego mieszka´n w A wy- nosi 3800 zł. Czy powy˙zsze dane potwierdzaj ˛ a to stwierdzenie? Formalizacja problemu Zakładamy, ˙ze dane dotycz ˛ ace cen metra kw. mieszka´n w A s ˛ a realizacj ˛ a losowej próby prostej z rozkładu normalnego N ( µ, σ ) . (W wielu praktycznych sytuacjach zało˙zenie o normalno´sci rozkładu ceny metra kwadratowego mieszka´n— lub domów — nale˙zy odrzuci´c). Chcemy zweryfikowa´c: H 0 : µ = µ 0 przeciw H 1 : µ = µ 0 (w naszym przykładzie µ 0 = 3 , 8). Statystyka testowa i jej rozkład Zakładamy, ˙ze nasze pomiary stanowi ˛ a realizacj˛e próby prostej X 1 , X 2 , . . . , Xn , gdzie Xi ∼ N ( µ ; σ ); Chcemy „procedur˛e testow ˛ a" oprze´c na zmiennej losowej (tzw. statystyce testowej) T = ¯ X − µ 0 S/ √ n , gdzie S oznacza odchylenie standardowe z próby X 1 , X 2 , . . . , Xn. Posta´c statystyki testowej T jest podobna do postaci statystyki testowej Z — ró˙znica polega na wstawieniu S zamiast σ. Czy mo˙zna mie´c nadziej˛e, ˙ze T b˛edzie miała rozkład N (0 , 1) (podobnie jak Z )? 1 Histogram dla z z 2.5 3.0 3.5 4.0 4.5 5.0 0 1 2 3 4 Rysunek 1: Histogram liczebno´sci dla danych dotycz ˛ acych ceny metra kw. mieszka´n w A, wyra˙zonych w tys. zł; dane s ˛ a zapisane w zmiennej z Rozkład statystyki testowej T Mo˙zna pokaza´c, ˙ze statystyka testowa T ma rozkład t-Studenta z n − 1 stopniami swobody; udowodnił to W. Gosset (pseudonim Student) na pocz ˛ atku XX w. Wykres g˛esto´sci rozkładu t-Studenta z n − 1 stopniami swobody jest „spłaszczony” w stosunku do wykresu g˛esto´sci rozkładu normalnego N (0 , 1) (por. Rys. 1). Analityczne okre´sle- nie g˛esto´sci rozkładu t-Studenta wymaga znajomo´sci funkcji gamma (definiuje si˛e j ˛ a za pomoc ˛ a odpowiedniej całki niekore´slonej por. ksi ˛ a˙zk˛e J. Koronackiego i J. Mielni- czuka, str. 201). −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 x y Rysunek 2: Wykresy g˛esto´sci rozkładów normalnych: normalnego N (0 , 1) (linia ci ˛ a- gła), t-Studenta z dwoma 4 st. swobody (linia „kreskowana”), t-Studenta z 12 st. swo-
(…)
…”).
Obszar krytyczny
2
Dla ustalonego poziomu istotno´ci α i hipotezy alternatywnej H1 obszar krytyczny ma
s
posta´ :
c
(−∞, −t1−α/2,n−1 ] ∪ [t1−α/2,n−1 , ∞)
gdzie t1−α/2,n−1 oznacza kwantyl rz˛ du 1−α/2 rozkładu t-Studenta z n−1 stopniami
e
swobody.
Definicja 1. Kwantylem rz˛ du u, u ∈ (0, 1), rozkładu typu ciagłego z funckja g˛ sto´ci
e
˛
˛ e s
g dodatnia na przedziale I i równa zeru poza tym przedziałem, b˛ dziemy nazywali
˛
˛
e
liczb˛ cu spełniajaca równo´c:
e
˛ ˛
s´
F (cu ) = u,
gdzie F jest dystrybuanta rozkładu (tj. F (t) =
˛
t
−∞
g(x)dx).
Przykład— obliczenia
Chcemy zweryfikowa´ hipotez˛
c
e
H0 : µ = 3,8 przeciw H1 : µ = 3,8
przyjmujac poziom istotno´ci α = 0,05.
˛
s
Znajdujemy w tablicach lub obliczamy korzystajac z pakietu statystycznego (np. R-a):
˛
t1−0,05/2;13 = t0,975;13 ≈ 2,160
Obszar…
…
gdzie F oznacza dystrybuant˛ rozkładu t-Studenta z 13 stopniami swobody.
e
Hipotezy alternatywne jednostronne
W przypadku, gdy hipoteza alternatywna jest prawostronna, tj. gdy testujemy
H0 : µ = µ0 przeciw H1 : µ > µ0
obszar krytyczny ma posta´ [t1−α,n−1 , ∞); analogicznie, gdy weryfikujemy
c
H0 : µ = µ0 przeciw H1 : µ < µ0
obszar krytyczny ma posta´ (−∞, −t1−α,n−1 ].
c
3
´
Przykład— obliczenia…
… equal to 3.8
95 percent confidence interval:
3.180491 3.982366
sample estimates:
mean of x
3.581429
Obliczenia— sa wykonane dokładniej (z mniejszymi bł˛ dami zaokragle´ ) niz uprzed˛
e
˛ n ˙
nio przedstawione rachunki;
warto´c statystyki testowej t = −1,1777; df — degrees of freedom– liczba stopni
s´
swobody; p-value (p-warto´c): 0,26 95 percent confidence interval:- 95-procentowy
s
przedział ufno…
... zobacz całą notatkę
Komentarze użytkowników (0)