Fragment notatki:
To jest strona 0
Drukować od strony 1 (wskutek jakiegoś błędu, przy drukowaniu 2 stron na jednej kartce papieru, wydruk źle wychodzi - drukuje się najpierw oddzielnie strona 1, potem strony 2 i 3 itd). Jako strony do drukowania wskazać 1-8.
PODSTAWOWE POJĘCIA STATYSTYKI
Mówiąc bardzo ogólnie, statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości statystycznej (tzw. populacji generalnej) na podstawie zbadania pewnej jej części, zwanej próbką lub próbą.
Przez populację generalną rozumiemy tu dowolny zbiór elementów, które różnią się od siebie pod względem badanej cechy (lub - skończonego - układu badanych cech). Próbka - jest to pewien (skończony) podzbiór populacji, podlegający badaniu ze względu na ustaloną cechę (lub cechy), w celu wyciągnięcia wniosków na temat kształtowania się tej cechy (tych cech) w populacji generalnej.
Konieczność takiego podejścia wynika z niemożliwości przeprowadzenia badań na wszystkich elementach populacji - z racji ich liczby (może być praktycznie nieskończona), kosztów takiego badania, lub też niszczącego charakteru takiego badania (np. badanie jakości konserw mięsnych). Zwykle jako próbkę pobieramy drogą losowania, tzn. otrzymujemy tzw. próbę losową (o zakwalifikowaniu elementu do próby decyduje jedynie przypadek). Możemy mieć do czynienia z losowaniem niezależnym (ze zwracaniem - wtedy dany element może wystąpić więcej niż jeden raz w próbie), albo zależnym (bez zwracania). Jeżeli liczebność populacji jest duża w porównaniu z liczebnością próby, to nawet biorąc do próby różne elementy możemy założyć, że losowanie jest niezależne - co upraszcza większość rozważań, ponieważ wtedy rozkład badanej cechy jest dla wszystkich elementów próby jednakowy.
Zajmijmy się na razie przypadkiem badania tylko jednej, ustalonej cechy populacji generalnej. Przyjmujemy, że ta cecha jest zmienną losową - o pewnym rozkładzie, zwykle - posiadającym przynajmniej wartość oczekiwaną i wariancję. Jeżeli rozważamy dużą próbkę (o liczebności n≥30), to w pewnych zagadnieniach możemy poza istnieniem m i σ nic więcej nie zakładać o postaci rozkładu. Jeżeli rozważamy małą próbkę, to musimy założyć samą postać rozkładu (ewentualnie z dokładnością do nieznanych parametrów) - w większości zagadnień przyjmujemy, że rozkład badanej cechy w populacji jest normalny (chyba że bardziej naturalne jest przyjęcie innego rozkładu, jak np. dwumianowego lub Poissona).
Przy powyższym założeniu, dla każdego (wylosowanego) elementu populacji rozkład na nim badanej cechy jest taki sam, jak w całej populacji. Dlatego łączny rozkład wartości badanej cechy na elementach n-elementowej próby możemy utożsamiać z układem (X1, X2,...,Xn) niezależnych zmiennych losowych o jednakowym rozkładzie takim jak rozkład zmiennej X - opisującej rozkład badanej cechy w populacji. Konkretna próbka - powiedzmy (x
(…)
…). Definicja 2. Niech teraz Y, X1, X2, ..., Xn będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N(0,1), lub też - równoważnie - Y i Z będą niezależnymi zmiennymi, przy czym Y ma rozkład normalny N(0,1), zaś Z ma rozkład chi kwadrat o n stopniach swobody. Wtedy rozkład zmiennej losowej nazywamy rozkładem t Studenta o n stopniach swobody. Można wykazać, że gęstość tego rozkładu wyraża się wzorem…
… tego rozkładu wyraża się wzorem:
Własności: dla rozkładu F Fishera - Snedecora o (n1, n2) stopniach swobody mamy:
.
JEDNA POPULACJA GENERALNA
Twierdzenie 1. Niech X1, X2, ..., Xn będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N(m,σ). Niech
Wtedy:
1) Zmienna ma rozkład normalny [lub, równoważnie, ma rozkład normalny N(0,1)].
2) .
3) Zmienne i są niezależne.
4) Zmienna ma rozkład chi kwadrat o n-1…
… - takich jak jej wartość oczekiwana lub też wariancja - a równoważnie odchylenie standardowe, lub przedziałów dla wybranych parametrów rozkładu - jak np. parametru λ dla rozkładu Poissona, parametru p dla rozkładu dwumianowego itp.; chodzi tu o przedział, który z zadanym - dość dużym prawdopodobieństwem, zwanym poziomem ufności (np. 1-α=0,9 lub 0,95, lub 0,98, lub np. 0,999) pokrywa nieznaną wartość cechy…
… (lub więcej) populacji, to możemy weryfikować hipotezę np. że średnie (lub wariancje) w obu (odpowiednio - we wszystkich) populacjach są sobie równe.
DEFINICJE PODSTAWOWYCH ROZKŁADÓW,
WYSTĘPUJĄCYCH W STATYSTYCE MATEMATYCZNEJ
Definicja 1. Niech X1, X2, ..., Xn będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N(0,1). Wtedy rozkład zmiennej losowej χn2 = X12 + X22 +...+ Xn2 nazywamy rozkładem chi kwadrat o n stopniach swobody. Można wykazać, że gęstość tego rozkładu wyraża się wzorem
(dowodzi się najpierw, że rozkład Xi2 jest szczególnym przypadkiem rozkładu gamma i korzysta z twierdzenia o dodawaniu dla rozkładu gamma).
Własności rozkładu chi kwadrat:
1. E(χn2)=n; D2(χn2)=2n. 2. Jeżeli X ma rozkład chi kwadrat o n stopniach swobody, Y ma rozkład chi kwadrat o m stopniach swobody oraz zmienne X i Y…
… korelacji dwóch zmiennych losowych;
3b) współczynnika regresji liniowej jednej z badanych cel względem drugiej;
4) testować hipotezy odnośnie:
4a) niezależności badanych cech (odpowiednich zmiennych) w populacji;
4b) nieskorelowania badanych cech w populacji (H0: ρ=0, gdzie ρ - współczynnik korelacji badanych cech w populacji). Wreszcie, jeżeli mamy dwie próbki (lub więcej) pobrane z dwóch (lub więcej) populacji, to możemy weryfikować hipotezę np. że średnie (lub wariancje) w obu (odpowiednio - we wszystkich) populacjach są sobie równe.
DEFINICJE PODSTAWOWYCH ROZKŁADÓW,
WYSTĘPUJĄCYCH W STATYSTYCE MATEMATYCZNEJ
Definicja 1. Niech X1, X2, ..., Xn będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N(0,1). Wtedy rozkład zmiennej losowej χn2 = X12 + X22 +...+ Xn2 nazywamy rozkładem chi kwadrat o n…
... zobacz całą notatkę
Komentarze użytkowników (0)