wykład 5 1 Statystyka matematyczna Interesuje nas pewna cecha w populacji (np. wzrost w populacji mę czyzn, zawartość skrobi w ziemniakach, zawartość białka w ziarnach pszenicy, długość ycia pewnego rodzaju bakterii, wytrzymałość jakiegoś materiału itp). Badamy część populacji- próbę losową. Chcemy na jej podstawie wnioskować o całej populacji. Są 2 podstawowe działy statystyki matematycznej: - estymacja: oszacowanie rozkładu lub parametrów rozkładu cechy w populacji, - testowanie (weryfikacja) hipotez dotyczących rozkładu lub parametrów rozkładu cechy w populacji. Graficzne oszacowanie rozkładu Dystrybuanta empiryczna Niech ( ) n x , , x , x K 2 1 będzie losową próbą z pewnego rozkładu. Uporządkujmy jej elementy od najmniejszego do największego: ( ) ( ) ( ) n x x x ≤ ≤ ≤ K 2 1 . Dystrybuantą empiryczną F n ( x ) nazywamy funkcję określoną następująco: ( ) ( ) ( ) ( ) ( ) dla dla dla ≥
(…)
… wykres naszej próby na siatce probabilistycznej:
5
wykład 5
0,977
0,841
0,500
0,159
0,023
0
1
2
3
4
5
6
ESTYMACJA PARAMETRÓW ROZKŁADU.
Są 2 sposoby oszacowania (estymowania) parametrów rozkładu:
a) estymacja punktowa – gdy podajemy na podstawie próby jedną wartość
liczbową jako ESTYMATOR nieznanego parametru
b) estymacja przedziałowa (tzw. przedział ufności) gdy podajemy przedział,
który prawdopodobnie…
… jeśli jego wartość oczekiwana jest równa
nieznanemu parametrowi.
Estymator ma te swoją wariancję.
Najlepsze są estymatory NIEOBCIĄ ONE O MINIMALNEJ WARIANCJI.
Oszacowanie odchylenia standardowego estymatora (czyli pierwiastka z
wariancji) nazywamy BŁĘDEM STANDARDOWYM ESTYMATORA.
6
wykład 5
Zajmiemy się przede wszystkim wnioskowaniem o parametrach rozkładu w
populacji w 2 przypadkach:
1. rozwa ymy cechę jakościową…
…( p) =
1
1
E (K ) = ⋅ n ⋅ p = p
n
n
A więc jest to estymator nieobcią ony.
ˆ
Var ( p ) =
1
1
p(1 − p )
Var (K ) = 2 ⋅ np(1 − p ) =
.
n2
n
n
A więc im większa próba, tym mniejsza wariancja (estymator coraz lepszy).
7
wykład 5
p
Odchylenie standardowe estymatora ˆ wynosi
p (1 − p )
. Jeśli w tym wzorze
n
p
zamiast p wstawimy estymator ˆ to otrzymamy błąd standardowy estymatora.
Przykład.
Sztab kandydata w kampanii wyborczej przeprowadził sonda wśród 100
losowo wybranych osób pytając czy będą głosowały na tego kandydata. 30 osób
odpowiedziało, e tak.
ˆ =
p
30
= 0 ,3 = 30%
100
błąd standardowy tej oceny (estymatora)=
,
0 ,3 ⋅ 0,7
≈ 0,046 = 4,6% .
10
Gdyby zapytali 10 000 osób i 3000 odpowiedziało TAK, błąd standardowy
byłby 10 razy mniejszy i wynosiłby ok. 0,46%.
Pytanie.
Wśród ilu osób przeprowadzić sonda , aby mieć pewność, e błąd standardowy
będzie mniejszy ni 1%?
Rozwiązanie:
Załó my, e nie mamy pojęcia jakie mniej więcej jest poparcie dla kandydata
(jakiego rzędu jest wielkość p). Zauwa my , e przy ustalonym n błąd
p
standardowy jest największy gdy ˆ = 0,5 . Trzeba rozwiązać nierówność
0,5 ⋅ 0,5
< 0,01
n
co daje n ≈ 2500 .
8
wykład 5
Estymatory parametrów rozkładu normalnego
Załó my, e…
… nie ma lepszego estymatora i
e ma on rozkład normalny.
9
wykład 5
Uwaga 2
Jeśli X jest zmienną losową o dowolnym rozkładzie z wartością oczekiwaną µ i
wariancją σ2 to
σ2
X ~ Nµ ,
n
as
(patrz centralne twierdzenie graniczne, wykład IV).
Estymacja parametru w rozkładzie Poissona
Przypomnijmy (wykład 2) , e zmienna X ma rozkład Poissona jeśli przyjmuje
wszystkie wartości całkowite dodatnie od 0 do nieskończoności ( X=0,1,2,...)
λk −λ
oraz P ( X = k ) = e
k=0,1,2,... . λ > 0 jest parametrem rozkładu.
k!
EX=λ, Var(X)=λ .
Niech X1, X2,...Xn będzie próbą z tego rozkładu.
ˆ
Najlepszym nieobcią onym estymatorem parametru λ jest λ = X .
Estymacja parametru w rozkładzie wykładniczym
Przypomnijmy (wykład 3) e rozkład ciągły o gęstości
λ
dla x ≤ 0
0
f ( x ) = -λx
dla x > 0
λe
nazywa się rozkładem wykładniczym…
…
5,5
Graficzna ocena normalności rozkładu: wykres kwantylowy
prawdopodobieństwa
W wielu zagadnieniach statystycznych, jak się później Państwo przekonacie,
pojawia się zało enie, ze interesująca nas cecha ma rozkład normalny. Istotna
jest więc umiejętność sprawdzenia czy takie zało enie jest zasadne. W tym celu
mo na wykorzystać pewną metodę graficzną.
Przypomnijmy czym jest kwantyl rozkładu.
(
Jeśli X…
... zobacz całą notatkę
Komentarze użytkowników (0)