Analiza danych statystycznych - ćwiczenia 2

Nasza ocena:

5
Pobrań: 7
Wyświetleń: 686
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza danych statystycznych - ćwiczenia 2 - strona 1 Analiza danych statystycznych - ćwiczenia 2 - strona 2 Analiza danych statystycznych - ćwiczenia 2 - strona 3

Fragment notatki:

 Obserwacje nietypowe i wpływowe. Regresja nieliniowa Ćwiczenia W podstawowym pakiecie R znajdują się dane stackloss. Dane zawirają 21 obserwacji 4 zmiennych dotyczących utleniania amoniaku do kwasu azo- towego i jego wpływu na wydajność roślin. Air.Flow Przepływ powietrza Water.Temp Temperatura wody krążącej w cewkach roślin. Acid.Conc. Koncentracja kwasu stack.loss Zmienna zależna; miara ogólnej efektywności rośliny Dla tych danych wykonaj następujące polecenia: i) Określ model liniowy zależności między zmienną stack.loss a wielkoś- cią przepływu powietrza. ii) Czy któraś z obserwacji może być uznana za obserwację o dużej dźwigni? iii) Jeśli tak, przedstaw na wykresie prostą regresji dopasowaną do wszys- tkich obserwacji oraz prostą dopasowaną po usunięciu tego punktu. iv) Przedstaw podsumowania obu modeli. Czy usunięcie punktu o dużej dźwigni spowodowało zmianę w dopasowaniu modelu? Podaj dokładność dopasowania dla obu modeli. v) Dla modelu dopasowanego do pełnego zbioru danych wyznacz reszty studentyzowane vi) Wyznacz obserwacje odstające korzystając z wektora reszt studenty- zowanych. vii) Wyznacz obserwacje odstające korzystając z testu outlierTest. viii) Przedstaw i skomentuj wykres wpływów, zaznacz 3 obserwacje o największych odległościach Cooka. ix) Zdecyduj które z zaznaczonych obserwacji są obserwacjami wpły- wowymi. 1 x) Zweryfikuj dokonany wybór za pomocą testu influence.measures xi) Usuń obserwacje wpływowe i ponownie dopasuj model. Zadania Zadanie 3. Dla danych stackloss z powyższego ćwiczenia zadecyduj które ze zmiennych Water.Temp, Acid.Conc. powinny się znaleźć w modelu ze zmienną zależną stackloss (czy jedna z nich (która?) czy też obie). Dla tak wybranego modelu przeprowadź analizę taką jak w ćwiczeniu powyżej (punkty ii)-xi)) Zadanie 4. Plik danych: DANE_Predkosc_reakcji.txt zawiera 7 obserwacji. Dane w nim zawarte opisują predkość reakcji chemicznej dla różnych wartości koncentrcji składowych. Chcemy dopasować model re- gresji opisujący związek między zmiennymi Predkosc i Koncentracja . i) Przedstaw na wykresie punktowym zależność pomiędzy zmienną Predkosc i zmienną Koncentracja. Czy zależność ma charakter liniowy? ii) Zastosuj transformację logarytmiczną dla zmiennej Predkosc, dla obu zmiennych Predkosc i Koncentracja oraz tylko dla zmiennej Koncentracja. Czy któraś z transformacji prowadzi do uzyskania liniowego charakteru za- leżności? Przedstaw odpowiednie wykresy punktowe danych. Przedstaw wykresy reszt dla tych trzech modeli. Czy można zauważyć jakiś trend w

(…)

… Zajęcia 2. Obserwacje nietypowe i wpływowe.
Regresja nieliniowa
Ćwiczenia
W podstawowym pakiecie R znajdują się dane stackloss. Dane zawirają
21 obserwacji 4 zmiennych dotyczących utleniania amoniaku do kwasu azotowego i jego wpływu na wydajność roślin.
Air.Flow
Water.Temp
Acid.Conc.
stack.loss
Przepływ powietrza
Temperatura wody krążącej w cewkach roślin.
Koncentracja kwasu
Zmienna zależna…
… danych. Przedstaw
wykresy reszt dla tych trzech modeli. Czy można zauważyć jakiś trend w
układzie reszt czy też układają się one w sposób losowy? Co to oznacza dla
dopasowanego modelu?
iii) Dopasuj model wielomianowy stosując wielomian stopnia 2 dla zmiennej Koncentracja, tzn model
Predkosc = β0 + β1 ∗ Koncentracja + β2 ∗ (Koncentracja)2
iv) Przedstaw dopasowaną krzywą na wykresie wraz z danymi…
... zobacz całą notatkę

Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz