Fragment notatki:
Wprowadzenie do środowiska R Łukasz Komsta 21 sierpnia 2004 Spis treści 1 Wstęp 3 2 Pierwsze kroki 3 2.1 Najprostsze obliczenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 Przykłady operacji na wektorach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.3 Najprostsza regresja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3 Struktury danych 7 3.1 Wektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.1.1 Generowanie ciągów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.1.2 Indeksowanie wektorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.1.3 Operacje arytmetyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.1.4 Funkcje operujące na wektorach . . . . . . . . . . . . . . . . . . . . . . . . 11 3.2 Faktory i dane kategoryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.3 Tablice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.3.1 Tworzenie i indeksowanie tablic . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.3.2 Operacje na tablicach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.4 Listy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.5 Ramki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4 Rozkłady zmiennych 20 5 Wykresy 21 5.1 Wykresy słupkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 5.2 Wykresy kołowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 5.3 Histogramy i wykresy rozrzutu zmiennej . . . . . . . . . . . . . . . . . . . . . . . . 22 5.4 Wykresy dwuwymiarowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5.5 Wykresy funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 5.6 Ogólne parametry funkcji rysujących . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1 Łukasz Komsta Wprowadzenie do środowiska R
(…)
… testów statystycznych dotyczących dopasowania w regresji:
1. Test „Lack-of-fit”. Można go stosować wyłącznie w przypadku, gdy dla każdego x mamy
kilka wartości y (powtórzone analizy). Polega on na analizie wariancji reszt i stwierdzeniu,
czy wariancja międzygrupowa różni się istotnie od wariancji wewnątrzgrupowej.
2. Test dopasowania Mandella — porównanie testem ANOVA regresji prostoliniowej…
…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
22
22
25
26
26
Łukasz Komsta
Wprowadzenie do środowiska R
6 Najczęściej stosowane testy statystyczne
6.1 Testy dla jednej próby . . . . . . . . . . . . . .
6.2 Testy dla dwóch prób . . . . . . . . . . . . . .
6.3 Testy dla większej ilości prób . . . . . . . . . .
6.4 Dwuczynnikowa ANOVA . . . . . . . . . . . .
6.5 Testy chi-kwadrat dla proporcji . . . . . . . . .
6.5.1 Test chi-kwadrat…
… „problemów” dla początkującego użytkownika R jest fakt, iż program
ten działa na odmiennej zasadzie od arkuszy kalkulacyjnych. Praca odbywa się w trybie komend,
w sposób analogiczny do DOS-a, czy też rozbudowanego kalkulatora. Narzuca to pewną dyscyplinę
w organizacji danych lub nazywaniu zmiennych. Jednak taki system pracy jest nieoceniony w przypadku bardziej zaawansowanych obliczeń. Przy pracy z arkuszem sporo czasu zajmuje zaplanowanie
rozmieszczenia danych i wyników. Tutaj nie musimy tego robić, gdyż takiego rozmieszczenia po
prostu nie ma. Ponadto pakiet R pozwala na wiele obliczeń, których nie da się prosto wykonać
nawet na bardziej zaawansowanych arkuszach kalkulacyjnych. Jego funkcjonalność uzupełniają
dodatkowe biblioteki do konkretnych zastosowań, dostarczane wraz z obszerną dokumentacją.
Celem niniejszego opracowania jest zapoznanie czytelnika z podstawowymi operacjami dokonywanymi przy użyciu pakietu R. Założono także, że czytelnik zna podstawowe pojęcia i testy
statystyczne, a tekt ten pokaże tylko sposób ich przeprowadzenia przy użyciu pakietu. Bardziej
zaawansowane korzystanie z programu pociąga konieczność studiowania dokumentacji anglojęzycznej. Mam nadzieję, że uda mi się w tym opracowaniu…
… jest więcej), estymatory poszczególnych współczynników, ich błędy standardowe, jak również wartość t
oraz odpowiadającą im wartość p dla istotności tych współczynników. Widać wyraźnie, że przecięcie (intercept) jest nieistotne w obu przypadkach. Przy dopasowywaniu do modelu kwadratowego
współczynnik przy x2 jest również nieistotny. Na zakończenie porównujemy oba dopasowania testem Mandella (czyli test ANOVA pomiędzy…
… na tym obiekcie przedstawia kolejno wartości reszt (lub, w przypadku większej
ich liczby, wartości skrajne, medianę i kwartyle), estymatory nachylenia prostej (slope) i przecięcia
z osią y (intercept). Dla każdego z estymatorów podany jest błąd standardowy oraz odpowiadające
2
mu wartości t i p dla jego istotności. Otrzymujemy również współczynnik R2 oraz Radj . Na samym
dole podano również wartości testu F…
… 88.419
2
3 73.836 1
14.583 0.5925 0.4975
>
Na początek umieszczamy poszczególne wartości x i y w odpowiednich wektorach. Następnie
zmiennym lin i sq przypisujemy dopasowanie tych danych do modelu liniowego lub kwadratowego.
Po wyświetleniu podsumowania (summary) każdego z wyników, otrzymujemy tabelę zawierającą
obszerne wyniki dopasowania - wartości R2 , reszty regresji (lub ich kwantyle, gdy danych…
... zobacz całą notatkę
Komentarze użytkowników (0)