Analiza danych statystycznych - ćwiczenia 8

Nasza ocena:

5
Pobrań: 49
Wyświetleń: 994
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza danych statystycznych - ćwiczenia 8 - strona 1 Analiza danych statystycznych - ćwiczenia 8 - strona 2 Analiza danych statystycznych - ćwiczenia 8 - strona 3

Fragment notatki:

 Analiza wariancji- ANOVA Ćwiczenia Załóżmy, że rozważamy trzy grupy obserwacji, po 7 obserwacji w każdej grupie: y1 = c(18.2, 20.1, 17.6, 16.8, 18.8, 19.7, 19.1) y2 = c(17.4, 18.7, 19.1, 16.4, 15.9, 18.4, 17.7) y3 = c(15.2, 18.8, 17.7, 16.5, 15.9, 17.1, 16.7) i) Przedstaw dane w postaci jednego długiego wektora y oraz stwórz wektor oznaczający indeksy klas dla poszczególnych obserwacji. ii) W każdej z trzech klas wyznacz sumę, średnią wariancję oraz podaj liczbę obserwacji. Te same parametry wyznacz dla łącznego wektora y. iii) Traktując wektor indeksów klas jako czynnik (factor) dopasuj model liniowy zależności pomiędzy y a tym wektorem klas. Przeprowadź jednoczyn- nikową analizę wariancji (anova) i oceń istotność zmiennej czynnikowej. iv) Zapisz stopnie swobody dla wektora klas i dla błędu jako osobny wek- tor. Dla poziomów istotności 0.05 i 0.01 oceń czy istnieją istotne różnice pomiędzy klasami. v) Korzystając z wyniku procedury anova skonstruuj 95% przedział ufności dla wariancji. W tym celu: - znajdź w wyniku anova sumę kwadratów reszt (Residuals, Sum Sq); - wyznacz kwantyle rzędu 0.025 i 0.975 rozkładu chi-kwadrat z 18 stopniami swobody; - podziel sumę kwadratów reszt przez odpowiednie kwantyle. Uzyskany wynik jest 95% przedziałem ufności dla wariancji wspólnej dla wszystkich grup. Zadania Zadanie 14. Plik coagulation.txt zawiera dane dotyczące tempa krzep- nięcia krwi dla 24 zwierząt. Zwierzętom przypisano w sposób losowy jedną z czterech diet (A, B, C, D). Dane pochodzą z pracy Box, Hunter, Hunter (1978). i) Przedstaw wykresy pudełkowe tempa krzepnięcia krwi (coagulation) w grupach wyznaczonych przez typ zastosowanej diety. Na ich podstawie oceń: - czy w grupach występują obserwacje odstające (osobne punkty poza ’pudełkami’), - czy rozkłady w grupach są skośne (jest tak gdy ’pudełka są w widoczny sposób asymetryczne), - czy wariancje w grupach są w przybliżeniu równe (tj, czy rozmiary pudełek 1 są w przybliżeniu równe). ii) Dopasuj model liniowy zależności pomiędzy zmienną coag a zmienną diet. Przedstaw ocenę dopasowanych współczynników modelu. Czy na pod- stawie uzyskanych p−wartości można stwierdzić istnienie istotnych różnic pomiędzy grupami? iii) Następnie dopasuj model nie zawierający wyrazu wolnego (intercept) oraz model zawierający tylko wyraz wolny. Przeprowadź analizę wariancji (polece- nie anova) oraz oceń wartość statystyki F i p−wartość. Pomiędzy którymi typami diety istnieją istotne różnice? (polecenie pairwise.t.test). iv) Przedstaw i oceń wykres kwantylowo-kwantylowy. Czy rozkład danych

(…)

… reszt ,
- użyj wektora wartości bezwzględnych reszt jako zmiennej objaśnianej w
nowym modelu jednoczynnikowej anovy.
Uzyskanie statystycznie istotnego wyniku w takim teście oznacza, że wariancje nie są stałe (a zatem jeśli p−wartość jest duża, to wariancje w grupach
są jednorodne). Porównaj uzyskany wynik z wynikiem uzyskanym dzięki zastosowaniu testu Bartletta (polecenie bartlett.test).
Zadanie 15…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz