Metody analizy danych ilościowych

Nasza ocena:

3
Pobrań: 1239
Wyświetleń: 3906
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Metody analizy danych ilościowych - strona 1

Fragment notatki:

METODY ANALIZY DANYCH ILOŚCIOWYCH Metody opisu statystycznego Statystyka opisowa to zbiór metod analizy danych w obrębie badanej próbki losowej, służącej do szacowania jej estymatorów (właściwości) Statystyka indukcyjna jest zbiorem metod służących o szacowania właściwości populacji (parametrów) na podstawie właściwości próbki losowej (estymatorów) oraz testowania hipotez statystycznych. To szacowanie nazywa się wnioskowaniem statystycznym Miary opisu statystycznego służą do oszacowania typowych wartości zmiennej obserwowalnej w próbce i wtedy nazywają się miarami tendencji centralnej lub do oszacowania zróżnicowania zbioru danych i wtedy nazywają się miarami dyspersji (zróżnicowania, rozproszenia).
Jeśli odniesiemy metody opisu statystycznego do relacji między zmiennymi, a więc tego, co leży u podstaw pytań i hipotez badawczych, to możemy rozpatrywać miary współzmienności służące do oszacowania siły związku między dwiema zmiennymi. Miary tendencji centralnej - wyrażają typowe wartości zmiennej w badanej próbce
Na poziomie nominalnym można zastosować jedynie miarę modalnej (dominanty), czyli wartości najczęściej występującej w zbiorze wartości zmiennej.
Modalna oznacza, że najwięcej osób badanych ogniskuje się wokół danego wariantu zmiennej (np. gdy wyniki testu są następujące 0,0,0,1,1,2,3,4,6,7,7,7,8,8,8,8,8,8,9,9,10,10,10,11,11 to modalna to 8)
Mediana jest to wartość, która dzieli zbiór danych na dwie równe części, po 50% (u góry liczba 8), a kwartyle to trzy wartości, które dzielą zbiór danych na cztery równe części (po 25%)
Średnia arytmetyczna to średni wynik danych ze zbioru ( u góry 6.24)
Miary dyspersji
Miary odnoszą się do zmiennych na poziomie interwałowym.
Wariancja z próby jest definiowana jako średnia arytmetyczna odchyleń od średniej podniesionych do kwadratu
Odchylenie standardowe to pierwiastek kwadratowy z wariancji
Współczynnik zmienności jest względną miarą dyspersji, można go otrzymać dzieląc odchylenie standardowe przez średnią i mnożąc wynik przez 100
Na poziomie nominalnym nie ma efektywnych miar tego rodzaju.
Na poziomie porządkowym są 2 miary dyspersji: odchylenie ćwiartkowe(płowa obszaru zmienności, czyli 50%środkowych wyników w szeregu statystycznym) i współczynnik zmienności.
Miary współzmienności
W swojej strukturze zawierają one dwie zmienne losowe, a ich weryfikacja będzie polegać na szacowaniu, czy między tymi zmiennymi zachodzi związek. Na poziomie nominalnym - współczynnik kontyngencji C (służy do szacowania siły związku pomiędzy dwiema zmiennymi jakościowymi) i współczynnik zbieżności cech Czuprowa T (to samo;/). W ich strukturze występuje chi-kwadrat, który jest miarą niezależności prawdopodobieństw dwóch zmiennych.

(…)

…) w postaci współczynnika determinacji, który pozwala oszacować, jaki procent wariancji jednej zmiennej można tłumaczyć wariancja innej zmiennej.
Liczba stopni swobody -> wariancja zmiennej wiąże się z jej odchyleniami od średniej. Suma odchyleń od średniej zawsze będzie równa 0. To oznacza, że w zasadzie jedno odchylenie jest stałe, nie jest swobodne - nie może się zmieniać. Trzy jednak będą swobodne…
… normalnego.
Estymacja wskaźnika struktury - dobrym estymatorem jest częstość względna
Estymatory te można stosować w próbkach losowych indywidualnych oraz grupowych, nie można stosować do szacowania parametrów populacji
Testowanie hipotez statystycznych
Aby określić najmniejsze prawdopodobieństwo, że nasz wynik jest efektem systematycznego błędu, musimy odwołać się do testów statystycznych, czyli narzędzi pozwalających oszacować to. Każdy test statystyczny posiada hipotezę zerową, która orzeka, że różnice między średnimi czy zależnością są dziełem przypadku, więc tak naprawdę ich nie ma.
Kryteria przy wyborze testu:
- liczebność próbki
- poziom pomiaru zmiennej
- rozkład zmiennej zależnej
Testy istotności:
- parametrycze - wymagają spełnienia warunku normalności rozkładu
- nieparametryczne - nie wymagają…
… się zmienna zależna, jeśli o jedno odchylenie zmieni się dany predyktor.
Równanie regresji służy do przewidywania wartości zmiennej zależnej na podstawie zmian wartości zmiennych niezależnych.
Wieloczynnikowa analiza wariancji Anova
Fisher - twórca metody analizy wariancji
Całkowita wariancja zmiennej zależnej dzieli się na dwie części: na wariancję międzygrupową i wariancję wewnątrzgrupową, czyli wariancję…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz