Dokument ma 26 stron i porusza zagadnienia takie jak: szereg rozdzielczy, histogram, łamana częstości, rozstęp, miary opisowe, rozproszenie, skośność, spłaszczenie, miary środka rozkładu, średnia, mediana, moda, miary rozproszenia, rozstęp, wariancja, odchylenie standardowe, rozstęp międzykwartylowy, kwantyle, odchylenie pseudostandardowe, współczynnik zmienności, dystrybuanta empiryczna, moment zwykły, moment centralny, współczynnik skośności, współczynnik skośności standaryzowany, indeks skośności Pearsona, współczynnik spłaszczeni - kurtoza, kurtoza standardowa, standaryzacja, wartości nietypowe, dane ucięte, dane winsorowskie, wnioskowanie statystyczne, model statystyczny, dystrybuanta empiryczna, twierdzenie Gliwienki - Cantelliego, statystyka Kołmogorowa, statystyki dostateczne, kryterium faktoryzacyjne, statystyki swobodne i zupełne, rodziny wykładnicze rozkładów, estymacja punktowa, twierdzenie Rao-Blackwella, twierdzenie Lehmanna-Scheffégo, twierdzenie Cramera-Rao, testy zgodności, testy jednorodności.
Elementy Statystyki Opisowej
Szereg rozdzielczy, histogram, łamana częstości
Niech będzie n-elementową próbką. Rozstępem z próbki nazywamy Przy większej liczności próbki (n 30), w celu ułatwienia analizy danych, wartości liczbowe próbki grupuje się w klasach (najczęściej o jednakowej długości), przyjmując uproszczone założenie, że wszystkie wartości znajdujące się w danej klasie są identyczne ze środkiem klasy.
Liczba klas - k. Liczność próbki n Liczba klas k
30 - 60
6 - 8
60 - 100
7 -10
100 - 200
9 -12
200 - 500
11 - 17
500 - 1500
16 - 25
Na ogół nie stosuje się liczby klas k większej od 30.Długość klasy - b.
Punkty stanowiące granice poszczególnych klas ustala się z dokładnością do /2, gdzie jest dokładnością pomiaru. Oznaczmy przez liczność i-tej klasy. Oczywiście .
Szereg rozdzielczy (Frequency Tabulation). Szeregiem rozdzielczym nazywamy ciąg par , gdzie jest środkiem i-tej klasy. Ciąg nazywamy rozkładem liczności badanej cechy przy danej liczbie k klas.
Przykład. Wkładka topikowa bezpiecznika o natężeniu znamionowym 20A winna, zgodnie z normą, wytrzymać bez przepalenia się natężenie 28A w ciągu 1 godziny. W celu sprawdzenia zgodności z normą, z partii wkładek topikowych tego typu pobrano losowo 40 sztuk i zanotowano czasy przepalenia się wkładki przy natężeniu prądu 28A. Otrzymano następujące wyniki w minutach:
51 58 64 69 61 56 41 48 56 61
75 55 46 57 70 55 47 62 55 60
54 57 65 60 53 54 49 58 62 59
53 50 58 63 64 59 52 51 65 60
Dla przedstawionej próbki zbudować szereg rozdzielczy oraz narysować histogram i łamaną częstości.
Rozwiązanie. Zauważmy, że oraz . Zatem rozstęp z próbki R = 34. Ponieważ liczność próbki n = 40, to wygodnie jest przyjąć liczbę klas k = 7 oraz szerokość klasy b = 5. Tym samym otrzymujemy następujący szereg rozdzielczy:
Nr klasy i Klasa 1 40.500 45.500 43.000 1 .0250 1 .0250
2 45.500 50.500 48.000 5 .1250 6 .1500
3 50.500 55.500 53.000 10 .2500 16 .4000
4 55.500 60.500 58.000 12 .3000 28 .7000
5 60.500 65.500 63.000 9 .2250 37 .9250
6 65.500 70.500 68.000 2 .0500 39 .9750
7 70.500 75.500 73.000 1 .0250 40 1.0000 gdzie oraz są licznościami i częstościami łącznymi odpowiednio.
(…)
… , to a) ma rozkład normalny ;
b) , ma rozkład chi-kwadrat z (n-1) stopniami swobody, gdzie ;
c) ma rozkład t[n-1] t-Studenta z (n-1) stopniami swobody;
d) statystyki i są niezależne.
Dowód. Własność a) jest oczywista i wynika stąd, że kombinacja liniowa zmiennych losowych o rozkładzie normalnym ma rozkład normalny. b) i d). Bez straty ogólności można założyć, że =0 a =1. Istotnie gdzie jest prostą próbą losową…
… została zdefiniowana w ten sposób, że Jednocześnie mamy
Ponieważ , to Tym samym , ma rozkład chi-kwadrat i jest niezależne od .
c) Podobnie, bez straty ogólności, możemy założyć, że =0 a =1. jest ilorazem dwóch niezależnych zmiennych losowych, jednej o standardowym rozkładzie normalnym i drugiej będącej pierwiastkiem z ilorazu zmiennej o rozkładzie chi-kwadrat z (n-1) stopniami swobody podzielonej…
…. Jeżeli jest prawdopodobieństwem orła, to jak to pokazaliśmy wcześniej rozkład prawdopodobieństwa na przestrzeni próby ma postać .
Niech T oznacza statystykę równą liczbie orłów w próbie, tzn. Rozkład tej statystyki jest dobrze znanym rozkładem dwumianowym:
, gdzie t = 0,1,...,n.
Nietrudno sprawdzić, że rozkład warukowy próby pod warunkiem T = t nie zależy od Fakt ten można zinterpretować w następujący sposób: gdy wiemy, że T…
... zobacz całą notatkę
Komentarze użytkowników (0)