To tylko jedna z 26 stron tej notatki. Zaloguj się aby zobaczyć ten dokument.
Zobacz
całą notatkę
Analiza dwóch zmiennych
Spis treści
1. Wprowadzenie
W lipcu 2002 roku będąc osobą bezrobotną zarejestrowaną w Powiatowym Urzędzie Pracy w Białymstoku otrzymałam w ramach pracy interwencyjnej pewne zlecenie. Moim zadaniem było spisywanie stanów wodomierzy w blokach na osiedlu Kraszewskiego z miesięcy: kwiecień, maj i czerwiec.
Dane z jednego z bloków postanowiłam wykorzystać w niniejszej pracy. Stan wodomierzy z trzech miesięcy będzie pierwszą zmienną, którą zamierzam przeanalizować. Do wybranego bloku poszłam niedawno po raz drugi z zapytaniem do mieszkańców ile osób zamieszkuje poszczególne mieszkania. Będzie to moja druga zmienna przydatna do analizy.
Celem pracy jest zbadanie czy wzrost liczby mieszkańców wpływa na ilość zużycia wody. Dane przedstawia poniższa tabela:
Nr mieszkania
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Zużycie wody w m3 13
13
14
15
15
15
16
17
17
10
17
10
17
18
11
11
18
18
11
18
Liczba mieszkańców
3
3
2
2
5
2
5
4
5
2
5
3
5
7
2
4
6
5
2
2
(…)
… przeciętne oblicza się następująco:
Zużycie wody różni się średnio ze względu na wartość zmiennej od średniej arytmetycznej o 0,0002 m3.
Odchylenie ćwiartkowe
Odchylenie ćwiartkowe bada poziom zróżnicowania tylko części jednostek badanej zbiorowości (po odrzuceniu 25% jednostek o wartościach najniższych oraz 25% o wartościach najwyższych). Odchylenie ćwiartkowe mierzy więc średnią w połowie obszaru…
… wartości niż na przykład odchylenie ćwiartkowe ponieważ obliczane jest na podstawie wszystkich obserwacji. Dlatego też odchylenie standardowe używane jest najczęściej do wyznaczania miar zmienności.
W tym przypadku odchylenie standardowe wynosi 2,675 co oznacza, że zużycie wody różni się przeciętnie od średniego zużycia wody o 2,675 m3.
Współczynnik zmienności
Na podstawie odchylenia standardowego…
… różnice między średnimi wartościami danej zmiennej, obliczanymi dla konkretnych wariantów drugiej zmiennej.
Na podstawie otrzymanych wyników nie można stwierdzić liniowego związku pomiędzy zmiennymi, gdyż nie zachodzą następujące równości:
4.1. Kowariancja
W celu dokładnego określenia rodzaju oraz siły zależności stosowany jest współczynnik korelacji Pearsona. Aby go wyznaczyć należy obliczyć kowariancję…
…:
1. Rozkład brzegowy- na jego podstawie możemy określić jak kształtują się wartości jednej zmiennej, bez względu na zmianę wartości drugiej zmiennej
2.Rozkład warunkowy- pozwala przeanalizować w jaki sposób zmienia się wartość zużycia wody, pod warunkiem, że mieszkanie zamieszkuje określona ilość mieszkańców, lub odwrotnie.
Podstawowymi wielkościami charakteryzującymi rozkład warunkowy są średnia arytmetyczna i wariancja (lub odchylenie standardowe), których wyliczenia znajdują się w poniższych tabelach: Z powodu wcześniejszego rozpatrywania obu zmiennych jako niezależnych badanie rozkładu brzegowego zostaje pominięte.
Rozkłady warunkowe
x dla y=2
x/y1 x0i-x1i ni *ni x2 x2*ni 10-12
6
11
66
121
726
12-14
5
13
65
169
845
14-16
3
15
45
225
675
16-18
1
17
17
289
289
18-20
-
19
0
361
0
Razem
15
x
193
x…
…
Wykres 1. Histogram częstości zmiennej å
Za pomocą histogramu można odczytać jaki odsetek mieszkań zawiera się w poszczególnych przedziałach zużycia wody.
Wykres 2. Histogram częstości skumulowanych zmiennej x
2.1. Miary średnie
Średnia arytmetyczna
Zużycie wody w m3 (x0i-x1i>
Liczba mieszkań ni Środek przedziału
i i* ni 10-12
15
11
165
12-14
19
13
247
14-16
22
15
330
16-18
18
17
306
18-20
16
19
304…
…, iż w badanych mieszkaniach najczęściej spotykane zużycie wody wyniosło 14,857 m3.
Kwartyle
Z pośród kwartyli wyróżnia się kwartyl pierwszy, kwartyl drugi (inaczej mediana), kwartyl trzeci. Kwartyl pierwszy dzieli zbiorowość uporządkowaną na dwie części w ten sposób,że 25% jednostek ma wartości cechy niższe a 75% wyższe od kwartyla pierwszego.
Mediana dzieli zbiorowość uporządkowaną na dwie równe części…
... zobacz całą notatkę
Komentarze użytkowników (0)