Zawiera wiedzę z wykładów przeprowadzonych na Uniwersytecie Techniczno-Przyrodniczym w Bydgoszczy z dziedziny statystyki opisowej. Zawarte są tutaj trzy pliki. W jednym z nich znajdziecie kompendium definicji z dziedziny statystyki wraz ze wzorami. Przykładowe pozycje jakie możecie odnaleźć to: wnioskowanie statystyczne, zbiorowość statystyczna, cechy stałe, cechy zmienne, cechy skokowe, rozkład statystyki, przestrzeń próby, losowanie zależne, niezależne i wiele innych także z dziedziny statystyki matematycznej. W kolejnych plikach znajdziecie informację, które na pewno pomogą Wam w analizie regresji i korelacji o raz zdobędziecie wiedzę dotyczącą zagadnienia nieparametrycznych testów istotności. Oba te zagadnienia poparte są przykładem bądź to zadaniem.
Materiały z wykładów ze statystyki z zadaniem
8. NIEPARAMETRYCZNE TESTY ISTOTNOŚCI
Test zgodności Nieparametryczne testy istotności, w których weryfikowana hipoteza dotycząca rozkładu badanej cechy w populacji generalnej nie precyzuje wartości parametrów tego rozkładu, można ogólnie podzielić na dwie grupy. Pierwsza grupa to tzw. testy zgodności, a druga, bardzo liczna, to testy dla hipotezy, że dwie próby pochodzą z jednej populacji (czyli że dwie populacje mają ten sam rozkład.) Jednym z najstarszych testów statystycznych jest test zgodności . Nazwa jego pochodzi stąd, że statystyka, jakiej używa się przy weryfikacji hipotezy o zgodności próby wyników z rozkładem populacji, ma rozkład asymptotyczny .
Test zgodności pozwala na sprawdzenie hipotezy, że populacja ma określony typ rozkładu (tj. określoną postać funkcyjną dystrybuanty). W teście zgodności próba musi być duża.
Model
Populacja generalna ma dowolny rozkład o dystrybuancie należącej do pewnego zbioru rozkładów o określonym typie postaci funkcyjnej dystrybuanty. Z populacji tej wylosowano niezależnie dużą próbę (n co najmniej kilkadziesiąt), której wyniki podzielono na r rozłącznych klas o liczebnościach ni w każdej klasie, przy czym . Otrzymano w ten sposób tzw. rozklad empiryczny. Na podstawie wyników tej próby należy sprawdzić hipotezę Ha, że populacja generalna ma rozkład typu , tzn. Ho : F(x) S2, gdzie F(x) jest dystrybuantą rozkładu populacji.
Test istotności, zwany testem zgodności, dla tej hipotezy jest następujący. Z hipotetycznego rozkładu typu obliczamy dla każdej z r klas wartości badanej cechy X prawdopodobieństwa pi, że zmienna losowa X o rozkładzie przyjmie wartości należące do klasy o numerze i (i=1, 2, ..., r). Z kolei mnożąc pi przez liczebność całej próby n otrzymuje się liczebności teoretyczne npi , które powinny były wystąpić w klasie i, gdyby populacja miała rozkład typu , tzn. gdyby hipoteza Ho była prawdziwa. Ze wszystkich liczebności empirycznych ni oraz hipotetycznych npi wyznacza się następnie wartość statystyki
(2.1) która przy założeniu prawdziwości hipotezy Ho ma rozkład asymptotyczny o r-1 stopniach swobody lub o r-k-1 stopniach swobody, gdy z próby szacowano k parametrów rozkładu metodą największej wiarygodności.
PRZYKŁAD1
W oddziale położniczym szpitala miejskiego w Bydgoszczy otrzymano dane statystyki płci urodzonych niemowląt za rok 2010.
Na łączną liczbę 2176 porodów urodziło się 1126 chłopców i 1050 dziewczynek. Zweryfikować hipotezę czy uzyskane proporcje liczby chłopców i dziewczynek przeczą teorii, że rozkład płci u potomstwa jest jak 0,5 : 0,5. Czyli 2176:2 = 1088 ni - npi = 38
= (38x38):1126+(38x38):1050=1,375+1,282= 2,657
(…)
… krytyczną wartość tα=2,306. Ponieważ |t|=4,21>2,306= tα, zatem hipotezę H0 należy odrzucić. Oznacza to, że dodatni współczynnik korelacji między wynikami uzyskiwanymi przez studentów tego wydziału na I i IV roku różni się istotnie od zera.
Współczynnik determinacji d = rur x 100 w %
d- 0,69 --- 69 %
Wyniki egzaminów osiągane prez studentów na pierwszym roku determinują wyniki osiągane na roku IV w około 69…
… regresji liniowej dla wartości x1= 100 i x2=400 Y1 =( 5,6 x 100) - 24,66 =535,34
Y2 = (5,6 x 400) - 24,66 = 2215,34
Kolejno obliczamy współczynnik korelacji
Kolejno obliczamy współczynnik determinacji d, który jest kwadratem współczynnika korelacji.
d= r2
d=0,9682=0,937
Wartość współczynnika determinacji pomnożona przez 100 wyraża nam procent zmienności zmiennej zależnej objaśnianej przez wartość zmiennej…
… czasowych pracy pewnej centrali telefonicznej i otrzymano następujący empiryczny rozkład liczby zgłoszeń:
Liczba zgłoszeń
Liczba odcinków
0
1
2
3
4
5
50
100
80
40
20
10
Na poziomie istotności α=0,05 należy zweryfikować hipotezę, że rozkład liczby zgłoszeń w tej centrali jest rozkładem Poissona.
Rozwiązanie
Z treści zadania wynika, że nie jest sprecyzowany parametr rozkładu Poissona, stawiamy więc hipotezę…
…).
Wnioskowanie statystyczne będące przedmiotem statystyki matematycznej może występować w dwu wariantach zastosowań:
jako estymacja, czyli szacowanie parametrów rozkładu badanej cechy w populacji generalnej,
jako weryfikacja (testowanie) hipotez statystycznych dotyczących rozkładu badanej cechy w populacji (zbiorowości generalnej). Zarówno w estymacji jak i przy weryfikacji hipotez statystycznych zakłada…
... zobacz całą notatkę
Komentarze użytkowników (0)