To tylko jedna z 3 stron tej notatki. Zaloguj się aby zobaczyć ten dokument.
Zobacz
całą notatkę
Ćwiczenia. Plik drukarki.txt zawiera dane na temat konserwacji drukarek. Druga kolumna zawiera liczbę kopiarek a kolumna pierwsza zawiera czas (w godzinach) potrzebny na konserwację tej liczby kopiarek. (a) Narysuj dane (b) Czy relacja między zmiennymi jest w przybliżeniu liniowa? (c) Narysuj histogram rozkładu czasu potrzebnego na konserwację drukarek. (d) Skonstruuj model regresji liniowej opisujący zależność pomiędzy liczbą kopiarek a czasem potrzebnym na konserwację: i) Napisz wyestymowany model regresji. ii) Przedstaw histogram wartości resztowych. iii) Narysuj dane wraz z dopasowaną prostą regresji. iv) Przedstaw i zinterpretuj wykres kwantyl-kwantyl. v) Wyznacz graficznie 95% przedziały ufności i przedziały predykcyjne, bazu- jąc na wybranym podzbiorze obserwacji. vi) Jaka jest dolna granica przedziału ufności dla trzeciej obserwacji? vii) Wyznacz macierz korelacji i podaj wartość współczynnika korelacji Pear- sona. viii) Czy prawdziwa wartość współczynnika korelacji jest istotnie różna od zera? ix) Podaj 95% przedział ufności dla współczynnika korelacji Pearsona. Zadania Z1. Dane kfm (pakiet ISwR): 50 wierszy i 7 kolumn. Zostały zebrane przez Kim Fleischer Michaelsen i zawierają dane dla 50 niemowląt w wieku w przybliżeniu 2 miesięcy. Dzieci były ważone tuż przed i tuż po karmienu piersią. Zbadano też ilość spożytego mleka oraz inne dane: no numer identyfikacyjny dl.milk ilość spożytego mleka (dl/24h). sex płeć, zmienna czynnikowa o dwóch poziomach ’boy’ i ’girl’. weight waga dziecka (kg) ml.suppl dodatkowy substytut mleka (ml/24h) mat.weight waga matki (kg) mat.height wzrost matki (cm) (a) Przeanalizuj i zinterpretuj wpływ zmiennych objaśniających sex, weight, ml.suppl, mat.weight, mat.height na ilość spożytego mleka (dl.milk) przy użyciu modelu regresji wielokrotnej. 1 (b) Zauważ, że zmienna ’płeć’ (sex) jest zmienną o dwóch poziomach: boy (chłopiec) i ’girl’ (dziewczynka). Jakie ma to znaczenie dla przeprowadzonej analizy? (c) Przedstaw i zinterpretuj wykres zależności parami oraz macierz ko- relacji między zmiennymi. (d) Przyjmując poziom istotności równy 0.05 dokonaj krokowej proce- dury wyboru modelu startując z modelu zawierającego wszystkie zmienne i eliminując zmienne nieistotne o największej p-wartości. Napisz i zinterpretuj otrzymany końcowy model. Z2. Dane iris (zawarte w podstawowym pakiecie danych w R) zawierają informacje o długości i szerokości kielicha (sepal length/ width) i długości i szerokości płatka (petal length/ width) w centymetrach, dla 50 kwiatów
... zobacz całą notatkę
Komentarze użytkowników (0)