To tylko jedna z 13 stron tej notatki. Zaloguj się aby zobaczyć ten dokument.
Zobacz
całą notatkę
Statystyka (15.10.12)
STATYSTYKA OPISOWA
Szeregi rozdzielcze, mierniki tendencji centralnej i mierniki rozproszenia
Rodzaje grupowania:
Typologiczne - np. wg. Cech terytorialnych, rzeczowych, czasowych; mające na celu wyodrębnienie grup różnych jakościowo
Wariacyjne - mające na celu uporządkowanie badanej zbiorowości i poznanie jej struktury, które polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych.
Szereg:
Statystyczny - ciąg wielkości statystycznych, uporządkowanych wg określonego kryterium
Rozdzielczy - stanowi zbiorowość statystyczną, podzieloną na części/klasy wg określonej cechy jakościowej lub ilościowej z podaniem liczebności lub częstości każdej z wyodrębnionych klas
Rozdzielczy skumulowany - uzyskuje się poprzez przyporządkowanie kolejnym wariantom cechy odpowiadających im liczebności/częstości skumulowanych, informuje, dla ilu jednostek badanej zbiorowości cecha przyjmuje wartości nie większe/mniejsze od górnej granicy poszczególnej przedziału klasowego.
Konstrukcja szeregu rozdzielczego
Dzielimy spodziewany zbiór wartości badanej cechy na K przedziałów klasowych o krańcach odpowiednio X1i i X2i, dolny i górny kraniec i-tego przedziału klasowego. Ustalamy sposób domknięcia przedziału, najczęściej jest to przedział prawostronny domknięty.
Różnica to rozpiętość i-tego przedziału klasowego, szereg powinien być tak skonstruowany aby rozpiętości przedziałów były jednakowe. Przedziałów klasowych powinno być 8-15, proporcjonalnie do wielkości próby losowej.
WZÓR Środek przedziału klasowego
Liczebność względna (frakcja, %)
+ liczebność skumulowana (cumulative frequency)
Krzywa rozkładu normalnego (krzywa Gaussa), która dotyczy większości badanych cech (tzn. najwięcej jest przeciętnych przedstawicieli cechy, a ekstrema z obu końców skali stanowią mniejszość).
Ustalenie liczby przedziałów klasowych
Opisowe charakterystyki rozkładów
Tendencja centralna - za pomocą miar średnich (klasyczne i pozycyjne). Do średnich klasycznych zaliczają się średnia arytmetyczna, geometryczna i harmonijna.
Właściwości średniej arytmetycznej: suma odchyleń wszystkich pomiarów od średniej wynosi zero (oznacza to, że jest ona dobrze policzona).
W przepadku danych zgrupowanych i szereg rozdzielczy przedziałowy, wzór na średnią arytmetyczną jest inny (uwzględniamy środek przedziałów klasowych).
Jeżeli wartości zmiennej występują z różną częstotliwością, wówczas liczy się średnią arytmetyczną ważoną (wagami są liczebności odpowiadające poszczególnym wartościom).
Średnie pozycyjne:
Dominanta (moda - wartość najczęstsza)
(…)
… lub losowości próby)
Proces weryfikacji hipotezy przebiega wg pewnego schematu postępowanie, nazywanego testem statystycznym.
ALE odrzucenie hipotezy w teście statystycznym nie jest równoznaczne z logicznym udowodnieniem jej prawdziwości lub fałszywości. (Należy bowiem pamiętać, że odrzucając sprawdzaną hipotezę w teście statystycznym, kierujemy się jedynie tym, że dane liczbowe wynikające z pomiarów dają…
… nie odrzucamy - brak różnic między średnimi
Testy parametryczne dla rozkładów ciągłych
test równości wartości oczekiwanych;
test t-studenta i jego modyfikacje
analiza wariancji z porównaniami post hoc
test równości wariancji
test F-Fishera-Snedecora; test dla dwóch wariancji - weryfikacja hipotezy o różnicy między rozkładami pochodzącymi z dwóch niezależnych prób (sprawdza, czy kształty rozkładów dwóch prób…
… średniej z próby w odniesieniu do ś® z populacji generalnej. Na podstawie wyników próby losowej chcemy teraz skonstruować taki test statystyczny, który da możliwość podjęcia decyzji decyzji co do prawdziwości hipotezy zerowej.
Weryfikacja hipotezy statystycznej
12.11.2012
Wpływ liczebności prób na interpretację wyników
Testy na równość dwóch wartości oczekiwanych
Test t-studenta dla prób powiązanych…
…), a następnie po zaczęciu stosowania go (X2). Ho (zerowa) - X1 = X2. Ha (alternatywna) - X1 =/= X2
Omówione testy badały różnicę między:
rozkładami
średnią z próby a populacją
dwoma próbami
dwoma seriami pomiarów (wpływ czynnika)
Kiedy nie stosować testów t-studenta?
Aby porównać więcej niż dwie grupy stosujemy analizę wariancji (ANOVA).
ANOVA
podobnie jak w teście t-studenta zakłada się, że wyniki podlegają…
…, 1 idealny związek dodatni (pozytywny).
0.0-0.2
brak
0.2-0.4
słaba
0.4-0.7
średnia
0.7-0.9
silna
0.9-1.0
bardzo silna
Współczynnik determinacji
Jeśli x to zmienna niezależna, y to zmienna zależna, powiązana z x zależnością korelacyjną, to odchylenie całkowite (odległość najdalszego punktu od średniej) punktu o wartości zmiennej Y = y, od wartości średniej (^y) można przedstawić następująco:
yi - średnia y = ^yi - śr. y + yi - ^yi
Odchylenie całkowite wszystkich elementów układu (nieobowiązkowe)
Kwadrat współczynnika korelacji r2 (współczynnik determinacji) wskazuje jaka część zmienności cechy Y możemy opisać za pomocą zmienności cechy X.
r2 x 100 = procent wyjaśnionej zmienności
(1 - r2) = pozostała niewyjaśniona zmienność
Korelacja cząstkowa
Miernik związku pomiędzy dwiema cechami x i y…
…:
hipoteza zerowa zakłada równość wartości zmiennej przed i podziałaniu czynnika
decyduje kierunek różnic a nie faktyczna wartość różnicy pomiędzy średnimi
wymaga normalności rozkładu zmiennych w obu parach
nie wymaga weryfikacji jednorodności wariancji
Czynnik - szampon na porost włosów
Czy szampon ma pozytywny wpływ na tempo przyrostu włosów?
mierzymy tempo przyrostu przed zastosowaniem szamponu (X1…
... zobacz całą notatkę
Komentarze użytkowników (0)