Przedmiot statystyki. Graficzne przedstawienie danych. Wykład 1; 6 lutego 2012 Przedmiot statystyki Statystyka dzieli si˛e na trzy cz˛e´sci: -zbieranie danych; -opracowanie i kondensacja danych (analiza danych); -wyci ˛ aganie wniosków na podstawie danych (wnioskowanie statystyczne). Statystyka i gospodarka przestrzenna Ceny mieszka´n u˙zywanych we Wrocławiu (ceny proponowane przez sprzedaj ˛ acych): Ceny mieszka´n w dzielnicy A (miasta Wrocławia): 65,80,139,180,355,158,240,205,265,305,200,155,209, 310,149,254,188,265,275,200,184,130,260,250,195 Ceny mieszka´n w dzielnicy B (miasta Wrocławia): 420,350,275,277,327,223,198,275,350,327,260,306, 270,295,270,220,299 ´Srednia cena w dzielnicy A: 208 , 8;´srednia cena w dzielnicy B: 290 , 71 . Czy ceny mieszka´n w dzielnicy B s ˛ a wy˙zsze ni˙z w dzielnicy A? Analiza zale˙zno´sci cech Powierzchnia (w metrach kwadratowych) mieszka´n w dzielnicy B: 94,73,75,80,74,60,50,63,74,74,56,85,80,80,80,75,60 Dane nt. mieszka´n z dzielnicy B mo˙zna przedstawi´c jako tzw. „szereg dwucechowy”: (94; 420) , (73 , 35) , . . . , (60; 299) . Wykres rozproszenia Dane te mo˙zna przedstawi´c przy pomocy wykresu rozproszenia: Wykres rozproszenia+prosta MNK Do „chmury punktów” na wykresie rozproszenia mo˙zna dopasowa´c prost ˛ a w nast˛epuj ˛ acy sposób. Oznaczmy dane („szereg dwucechowy”) przez ( x 1 , y 1) , . . . , ( xn, yn ) Chcemy znale´z´c prost ˛ a y = b 0 + b 1 x tak ˛ a,˙ze S ( b 0 , b 1) = n k =1 ( yi − b 1 xi − b 0) 2 suma kwadratów odchyle´n przyjmuje warto´s´c minimaln ˛ a (je´sli nie wszystkie wsółrz˛edne x-owe s ˛ a równe jednej liczbie, to istnieje dokładnie jedna para liczb, dla których krytetium S przyjmuje warto´s´c minimaln ˛ a). Otrzymana prosta MNK (od Metody Najmniejszych Kwadratów)- odpowiada minmalnej warto´sci funkcji S ( b 0 , b 1); wielko´s´c yi −b 1 xi −b 0 mo˙zna interpretowa´c jako odchylenie i − tej obserwacji yi od warto´sci przewidywanej b 1 xi + b 0 Dla danych nt. mieszka´n w dzielnicy B prosta ta dana jest równaniem: y = 74 , 78729 + 2 , 97698 x Wykres rozproszenia+prosta MNK Problem: czy rozwa˙zana zale˙zno´s´c liniowa mi˛edzy zmiennymi jest w jakim´s sensie istotna statystycznie? adekwatna? Wst˛epna analiza danych i wnioskowanie statystyczne Schemat post˛epowania: dla posiadanego zbioru danych wykonujemy wst˛epn ˛ a analiz˛e: obliczamy wska´zniki sumaryczne (´sredni ˛ a itd.) oraz sporz ˛ adzamy odpowiednie wykresy statystyczne; nast˛epnie przeprowadzamy odpowiednie analizy staty- styczne (testujemy odpowiednie hipotezy itd.)
(…)
…: Wykres rozproszenia dla danych: powierzchnia i ceny mieszka´ w dzielnicy B+prosta MNK
n
Cechy ilo´ciowe i jako´ciowe
s
s
Cena mieszka´ w dzielnicy B- przykład cechy ilo´ciowej (mamy tu do czynienia z liczbami odpowiadajacymi warto´ciom
n
s
˛
s
mierzonych wielko´ci);
s
-cechy jako´ciowe:
s
• płe´ ;
c
• typ schorzenia;
Histogram i szereg rozdzielczy
Dla zbioru danych liczbowych y1 , y2 . . . , yn niech: M…
… szereg rozdzielczy, przedstawiony w postaci tabeli:
klasa
(150, 210] (210, 270] (270, 330] (330, 390] (390, 450]
liczno´c
s´
1
5
8
2
1
2
8
6
4
2
0
200
250
300
350
400
450
0.000
0.002
0.004
0.006
0.008
150
150
200
250
300
350
400
450
´
Histogram liczebno´ci dla danych „ceny mieszkan w B”
s
Histogram cz˛ sto´ci
e s
˙
Je´liby histogram liczebno´ci przeskalowa´ w ten sposób, ze wysoko´ci słupków…
... zobacz całą notatkę
Komentarze użytkowników (0)