Podstawowe zastosowania R

Nasza ocena:

3
Pobrań: 7
Wyświetleń: 749
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Podstawowe zastosowania R  - strona 1 Podstawowe zastosowania R  - strona 2 Podstawowe zastosowania R  - strona 3

Fragment notatki:

Podstawowe zastosowania R  Pakiet MCMCglmm Szymon Drobniak  Instalacja R  ajnowszą wersję R można ściągnąć ze strony  N  http://cran.r-project.org/bin/windows/base  Po  zainstalowaniu  w  Menu  Start  pojawi  się  grupa  ‘R’  pozwalająca  na  uruchomienie  konsoli  R.  Praca  w  samej  konsoli  przypomina  pracę  w  DOSie  –  wpisujemy  komendy  i  po  zatwierdzeniu  klawiszem    enter  są  one  wykonywane.  Niestety  –  z  podstawową  dystrybucją  R  dostajemy  jedynie  najczęściej  używane  pakiety  i  procedury statystyczne.  Przeprowadzimy  za  ich pomocą  większość  testów  statystycznych  i  stworzymy  wykresy,  są  tam  nawet  funkcje  służące  do  dopasowywania prostych modeli liniowych (glm, lm, lme4).  Aby  dowiedzieć  się  czegokolwiek  o  dowolnym  pakiecie  (lub  w  ogólności  –  obiekcie  w  R)  możemy użyć funkcji   help(stat lub po prostu  s)  ?stats  Co  zrobić  gdy  potrzebujemy  konkretnego  pakietu  a  nie  ma  go  w  podstawowej  dystrybucji?  Używamy wtedy funkcji  install.packages(‘MCMCglmm’)  Instrukcja  to  sprawi,  że  R  połączy  się  ze  swoim  repozytorium  (poprzez  wybrany  przez  nas  serwer)  i  zainstaluje  najnowszą  wersję  pakietu  MCMCglmm  (z  którym  będziemy  pracować  dzisiaj).  W trakcie pracy z R możemy zechcieć ją skończyć. Wydajemy wtedy polecenie  q()  co  zamyka  konsolę.  Przed  zakończeniem  program  pyta  nas  czy  zapisać  zmiany.  Jeśli  zgodzimy  się,  utworzone  zostaną  2  pliki:  .Rdata,  zawierający  wszystkie  utworzone  obiekty  i  zmienne,  oraz  .Rhistory  zawierający  wszystkie  wydane  komendy.  Przywrócenie  ich  jest  możliwe  za  pomocą poleceń load(file=”.Rdata”) oraz loadhistory(file=”.Rhistory”) – pod  jednym  jednakże  warunkiem:  R  pracuje  w  tym  samym  katalogu  roboczym  co  w  poprzedniej,  zakończonej sesji. O tym jaki katalog jest roboczym przekonać się można wydając polecenie  getwd()  Do dobrych zwyczajów w trakcie pracy z R należy tworzenie osobnych katalogów roboczych dla  poszczególnych  analiz  –  wtedy  po  uruchomieniu  R  po  prostu  przechodzimy  do  tego  katalogu  jako do katalogu roboczego:  1    setwd(„C:/R/szkolenie”)  i  pracujemy  w  jego  wnętrzu,  co  pozwala  m.in.  uniknąć  podawania  za  każdym  razem  pełnej  ścieżki do plików. W tym katalogu zapiszą się też wspomniane pliki historii etc.  Podstawowe zastosowania R 

(…)

…. 
Zaawansowane specyfikacje formuł omówiono przy okazji modeli dwuzmiennowych. 
Typy danych w R 
Podstawowym typem danych w R jest wektor – np.: 
> c(1,2,3,4,5,6)
[1] 1 2 3 4 5 6
tworzy  wektor  złożony  z  6  liczb.  Elementami  wektora  mogą  być  też  zmienne  znakowe 
(litery/słowa)  oraz  zmienne  logiczne  (prawda/fałsz).  Warto  pamiętać,  że  nawet  pojedyncza 
zmienna jest także jednoelementowym wektorem a nie skalarem. 
Inne typy danych to: 
array – struktura wielowymiarowa – tablica obiektów o n wymiarach; 
matrix – dwuwymiarowa tablica obiektów; 
list  –  pozwala  na  przechowywanie  obiektów  różnych  typów  (np.  tekst  i  liczby),czego 
powyższe nie potrafią; 
data  frame  –  najbardziej  nas  interesująca  struktura;  tablica  dwuwymiarowa,  gdzie  kolumny 
reprezentują zmienne zaś wiersze…
…)  czwartego  wiersza 
(wartości  wszystkich  zmiennych  dla  czwartego  rekordu),  (3)  wszystkich  rekordów  danych  w 
których wartość piątej zmiennej jest równa 44. 
> data[,1]
> data[4,]
> data[,data[5]==44]
Do zmiennych można też odwoływać się przez ich nazwy, np: 
 
> data$Chromosome.Number
 
Polecam  lekturę  funkcji  read.table,  write.table  oraz  funkcji  odpowiadających 
podstawowym typom danych…
… 
estymatorów
 
> HPDinterval(model1$Sol)
 
Przedziały ufności dla daty klucia oraz interakcji obejmują zero – co potwierdza wcześniejsze 
spostrzeżenia. 
 
Co z efektami losowymi? Tutaj sprawa jest trudniejsza i wymaga wprowadzenia pojęcia 
rozkładu a priori. Jest to jeden elementów statystyki bayesowskiej i nie wdając się w szczegóły 
sprowadza się do obliczania rozkładu a posteriori estymowanej wartości…
… niżej). 
 
Diagnoza modeli 
 
Metody oparte na łańcuchach Markova są metodami stochastycznymi. Tak jak z losowaniem kul 
z urny – jeśli nie zamieszamy wystarczająco dobrze, kolejne losowania nie będą niezależne od 
siebie. W analizie opartej na MCMCglmm taką sytuację określamy jako autokorelację. Wykrycie 
jej możliwe jest już po pierwszym spojrzeniu na wykresy serii czasowych: jeśli pojawia…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz