Pakiety Statystyczne Lista nr 2 (Statistica) 1. Do programu STATISTICA wczytad dane o nazwie „DanePakietyStatystyczne.csv” umieszczone na stronie http://theta.edu.pl/teaching/pakiety-statustyczne/. Dane przedstawiają grupę 860 pacjentów, pochodzących z trzech miast w Polsce (Gdaosk, Warszawa i Wrocław), dla których zostały zmierzone wartości hemoglobiny (g/dL), witaminy B12 (pg/dL) oraz kreatyniny (mg/dL). Dodatkowo dla każdego pacjenta jest znana jego płed, waga, wzrost oraz rok urodzenia. Dokładna struktura kolumn to: rok urodzenia, wzrost, waga, płed, hemoglobina, witamina B12, kreatynina oraz miasto pochodzenia. 2. Jak są oznaczone brakujące obserwacje dla zmiennej miasto pochodzenia? Wartości brakujących obserwacji zamienid na wartośd -9999. 3. Przekodowad kolumnę płed, tak aby mężczyzna był oznaczany jako 1, a kobieta 0. 4. Wyznaczyd wartości statystyk opisowych (średnia, wariancja, odchylenie standardowe, mediana oraz skośnośd) dla hemoglobiny, witaminy B12 oraz kreatyniny. 5. Ile średnio lat w dniu dzisiejszym mieli by pacjenci znajdujący się w analizowanym zbiorze danych? 6. W którym z miast średnia wartośd kreatyniny jest najniższa, a w którym najwyższa? 7. Na podstawie wagi i wzrostu utworzyd nową kolumnę o nazwie BMI ( B ody M ass I ndex ). Porównad wskaźniki BMI pomiędzy kobietami, a mężczyznami. Ile procent mężczyzn jest otyłych w analizowanym zbiorze danych (otyłośd zaczyna się gdy wskaźnik BMI jest większy od 30)? 8. Zlogarytmowad dane o dużej skośności. 9. Zbiór danych z nowo utworzonymi zmiennymi zachowad na następne zajęcia.
... zobacz całą notatkę
Komentarze użytkowników (0)