Podstawowe zastosowania R

To tylko jedna z 10 stron tej notatki. Zaloguj się aby zobaczyć ten dokument. Zobacz całą notatkę

Podgląd dokumentu

Fragment notatki:

Podstawowe zastosowania R Pakiet MCMCglmm Szymon Drobniak Instalacja R ajnowszą wersję R można ściągnąć ze strony N http://cran.r-project.org/bin/windows/base Po zainstalowaniu w Menu Start pojawi się grupa ‘R’ pozwalająca na uruchomienie konsoli R. Praca w samej konsoli przypomina pracę w DOSie – wpisujemy komendy i po zatwierdzeniu klawiszem enter są one wykonywane. Niestety – z podstawową dystrybucją R dostajemy jedynie najczęściej używane pakiety i procedury statystyczne. Przeprowadzimy za ich pomocą większość testów statystycznych i stworzymy wykresy, są tam nawet funkcje służące do dopasowywania prostych modeli liniowych (glm, lm, lme4). Aby dowiedzieć się czegokolwiek o dowolnym pakiecie (lub w ogólności – obiekcie w R) możemy użyć funkcji help(stat lub po prostu s) ?stats Co zrobić gdy potrzebujemy konkretnego pakietu a nie ma go w podstawowej dystrybucji? Używamy wtedy funkcji install.packages(‘MCMCglmm’) Instrukcja to sprawi, że R połączy się ze swoim repozytorium (poprzez wybrany przez nas serwer) i zainstaluje najnowszą wersję pakietu MCMCglmm (z którym będziemy pracować dzisiaj). W trakcie pracy z R możemy zechcieć ją skończyć. Wydajemy wtedy polecenie q() co zamyka konsolę. Przed zakończeniem program pyta nas czy zapisać zmiany. Jeśli zgodzimy się, utworzone zostaną 2 pliki: .Rdata, zawierający wszystkie utworzone obiekty i zmienne, oraz .Rhistory zawierający wszystkie wydane komendy. Przywrócenie ich jest możliwe za pomocą poleceń load(file=”.Rdata”) oraz loadhistory(file=”.Rhistory”) – pod jednym jednakże warunkiem: R pracuje w tym samym katalogu roboczym co w poprzedniej, zakończonej sesji. O tym jaki katalog jest roboczym przekonać się można wydając polecenie getwd() Do dobrych zwyczajów w trakcie pracy z R należy tworzenie osobnych katalogów roboczych dla poszczególnych analiz – wtedy po uruchomieniu R po prostu przechodzimy do tego katalogu jako do katalogu roboczego: 1 setwd(„C:/R/szkolenie”) i pracujemy w jego wnętrzu, co pozwala m.in. uniknąć podawania za każdym razem pełnej ścieżki do plików. W tym katalogu zapiszą się też wspomniane pliki historii etc. Podstawowe zastosowania R

(…)

….
Zaawansowane specyfikacje formuł omówiono przy okazji modeli dwuzmiennowych.
Typy danych w R
Podstawowym typem danych w R jest wektor – np.:
> c(1,2,3,4,5,6)
[1] 1 2 3 4 5 6
tworzy wektor złożony z 6 liczb. Elementami wektora mogą być też zmienne znakowe
(litery/słowa) oraz zmienne logiczne (prawda/fałsz). Warto pamiętać, że nawet pojedyncza
zmienna jest także jednoelementowym wektorem a nie skalarem.
Inne typy danych to:
array – struktura wielowymiarowa – tablica obiektów o n wymiarach;
matrix – dwuwymiarowa tablica obiektów;
list – pozwala na przechowywanie obiektów różnych typów (np. tekst i liczby),czego
powyższe nie potrafią;
data frame – najbardziej nas interesująca struktura; tablica dwuwymiarowa, gdzie kolumny
reprezentują zmienne zaś wiersze…
…) czwartego wiersza
(wartości wszystkich zmiennych dla czwartego rekordu), (3) wszystkich rekordów danych w
których wartość piątej zmiennej jest równa 44.
> data[,1]
> data[4,]
> data[,data[5]==44]
Do zmiennych można też odwoływać się przez ich nazwy, np:

> data$Chromosome.Number

Polecam lekturę funkcji read.table, write.table oraz funkcji odpowiadających
podstawowym typom danych…
…
estymatorów:

> HPDinterval(model1$Sol)

Przedziały ufności dla daty klucia oraz interakcji obejmują zero – co potwierdza wcześniejsze
spostrzeżenia.

Co z efektami losowymi? Tutaj sprawa jest trudniejsza i wymaga wprowadzenia pojęcia
rozkładu a priori. Jest to jeden elementów statystyki bayesowskiej i nie wdając się w szczegóły
sprowadza się do obliczania rozkładu a posteriori estymowanej wartości…
… niżej).

Diagnoza modeli

Metody oparte na łańcuchach Markova są metodami stochastycznymi. Tak jak z losowaniem kul
z urny – jeśli nie zamieszamy wystarczająco dobrze, kolejne losowania nie będą niezależne od
siebie. W analizie opartej na MCMCglmm taką sytuację określamy jako autokorelację. Wykrycie
jej możliwe jest już po pierwszym spojrzeniu na wykresy serii czasowych: jeśli pojawia…
... zobacz całą notatkę

Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz

Podstawowe zastosowania R

analiza wielowymariowa

Uniwersytet Ekonomiczny w Krakowie

Pobierz ten dokument za darmo

Fragment notatki:

Komentarze użytkowników (0)