Fragment notatki:
Tematem przewodnim jest analiza współzależności.
Informacje zawarte w notatce dotyczą kwestii takich jak: szereg korelacyjny, współczynnik korelacyjny Pearsona, analiza współzależności, analiza regresji, funkcje regresji i jej dopasowanie.
A także: współczynnik determinacji, rozkład Snedecora, korelacja cech jakościowych.
W notatce jest wiele wykresów i obliczeń przybliżających temat.
Analiza współzależności
Poznawanie związków między cechami jest analizą ze względów poznawczych. W rzeczywistości rzadko jest tak aby jakaś cecha obiektów lub zjawisko pewnego rodzaju kształtowało się zupełnie niezależnie od innych cech lub zjawisk. Właściwie pobieżne obserwacje różnych właściwości pozwalają stwierdzić istnienie pewnych związków lub zgodności między nimi.
Cecha Y - wydatki na żywność
Cecha X - dochody gospodarstw domowych.
() - wartość cechy
Zależności między zjawiskami nie mają charakteru funkcyjnego, mają charakter probabilistyczny - nazywamy je zależnościami stochastycznymi. Zależność stochastyczna (probabilistyczna) polega na tym, że jedna ze zmiennych reaguje na zmianę drugiej w ten sposób, że zmienia swój rozkład. Danej wartości cechy X odpowiadają różne rozkłady wartości cechy Y. Analiza zależności ma na celu ustalenie siły i kierunku występujących związków między cechami oraz skwantyfikowanie wpływu czynników na badane zmienne.
Kwantyfikacja (wyrażenie za pomocą liczby)
Prezentacja danych w analizie współzależności
Szereg korelacyjny.
Próba n-elementowa. Obiekty obserwujemy ze względu na dwie cechy ilościowe: X;Y.
Każda jednostka jest opisywana charakterystyczną parą liczb ().
Jeśli n jest mała, tworzymy szereg korelacyjny.
Numer jednostki Wartość cechy Wartość cechy 1
2
N
Szereg korelacyjny jest uporządkowany. Szereg korelacyjny można porządkować tylko wg jednej wartości cechy.
Trzecia forma prezentacji danych to wykres korelacyjny. Diagram korelacyjny jest wykresem punktowym. Diagram jest tworzony po to aby przeprowadzić wstępną ocenę współzależności. Ocena jest ważna dla dalszego toku postępowania. Ma odpowiadać na pytania:
Czy między zmiennymi występuje zależność (Tak, Nie)
Jaki jest charakter i siła zależności
Ocena zależności na podstawie diagramu korelacyjnego.
Brak zależności Słaba zależność liniowa dodatnia
Zasadnicze pytanie (2) czy zależność jest liniowa czy nieliniowa. Inaczej się bada zależności liniowe i nieliniowe.
Zależność statystyczna lub stochastyczna jest to uproszczenie koncepcji stochastycznej , powiadamy, że zmienne są niezależne statystycznie lub nie są nieskorelowane jeżeli poszczególnym odmianom jednej zmiennej odpowiadają takie same wartości średnich warunkowych.
W przeciwnym przypadku mówimy, że zmienne są skorelowane. Ponieważ koncepcja zależności stochastycznej jest szersza, to z niezależności stochastycznej wynika niezależność statystyczna (korelacyjna) ale nie odwrotnie. Czyli jeżeli stwierdzimy, że zmienne są nieskorelowane to nie wynika z tego, że są niezależne stochastycznie (probabilistycznie).
(…)
… mieszkańców )
Wykres szeregu czasowego.
Scharakteryzować dynamikę zjawiska za pomocą wskaźników indywidualnych
Przyrost absolutny łańcuchowy Indeksy łańcuchowe (100)
Indeksy jednopodstawowe (100)
Musimy zastosować średnią geometryczną
- średni indeks zmian
wzrost abonentów
Zadanie:
W latach 1992 - 1998 liczba samochodów zarejestrowanych w tysiącach sztuk była następująca:
Lata
Liczba samochodów w tys. szt…
… przebiegu zjawiska w przeszłości oraz przewidywania zjawiska w przyszłości. Jest również determinowana stopniem dopasowania do danych empirycznych. Przed przystąpieniem do opracowywania należy zbadać dopasowanie funkcji trendu do danych empirycznych
Błąd standardowy szacunku funkcji trendu. Współczynnik zbieżności (indenterminacji) Wahania sezonowe - są trzecim składnikiem szeregu czasowego obok tendencji rozwojowych i wahań przypadkowych. Polegają one na tym, że przyczyny działające periodycznie powodują, że badane zjawisko powtarza się z jednakowym w przybliżeniu natężeniem w kolejnych jednakowo odległych podokresach jakiegoś dłuższego (wieloletniego) okresu czasu. Takie podokresy nazywamy jednoimiennymi. Wahania sezonowe charakteryzują się tym, że pełny ich cykl zamyka się w okresie rocznym. Okresami jednoimiennymi są miesiące, kwartały, półrocza. Przyczyny, które wywołują wahania sezonowe wynikają z kalendarza obok tego na powstawanie zjawiska sezonowości mają wpływ organizacja życia zbiorowego lub zwyczaju (system organizacji roku szkolnego, urlopy). Zatem wiele zjawisk będzie podlegać wpływom sezonowym.
By móc wykryć wahania sezonowe musimy dysponować odpowiednim szeregiem czasowym dla okresów…
… zmiennej zależnej Y od wartości teoretycznych (represyjnych).
Ocena dokładności funkcji represji opiera się na analizie wariancji. Bierze się tu za punkt wyjścia następującą tożsamość:
zsumować po wszystkich i
całkowita zmienność suma kwadratów całkowita
suma kwadratów reszt
suma kwadratów regresji
Z związane jest n-1 stopni swobody
stopni swobody
suma kwadratów regresji
( wzór do stosowania…
… różni się od 0.
Korelacja cech jakościowych
Badanie skuteczności szczepionki cholery przeprowadzone w trakcie zachorowań dostarczyły następujących informacji:
Nie zachorowali
Zachorowali
Zaszczepieni
192 ( a )
4 ( b )
196
Nie zaszczepieni
113 ( c )
34 ( d )
147
305
38
343
Test niezależności
badane cechy są niezależne ( hipoteza)
- hipoteza niezależności
badane cechy są zależne
- zaprzeczenie hipotezy…
... zobacz całą notatkę
Komentarze użytkowników (0)