Modele liniowe i mieszane na przykładzie analizy danych biologicznych Ćwiczenie nr 1 1. Do pakietu R wczytać plik zamieszczony na stronie http://theta.edu.pl o nazwie dane.csv. W kolejnych kolumnach znajdują się: numer pacjenta chorego na ostrą niewydolność serca, miejsce hospitalizacji, płeć (0-kobieta, 1-mężczyzna), wiek, wskaźnik hemoglobiny (anemia dla kobiet przy hemoglobinie
(…)
… , a dla mężczyzn <
14) i sTfR (Soluble Transferrin Receptor) oraz dwa allele pewnego markera
genetycznego wpływającego na wzrost wskaźnika sTfR.
2. Więcej osób z niewydolnością serca jest wśród kobiet, czy mężczyzn?
3. Sporządzić wykres obrazujący podział pacjentów na miejsce hospitalizacji?
4. Przedstawić statystyki opisane dla wskaźnika sTfR. Za statystyki opisowe będziemy
uważać średnią, odchylenie standardowe i medianę oraz wartość minimalną i
maksymalną.
5. W którym mieście jest najwięcej ludzi z anemią?
6. Pacjenci z którego miasta mają najwyższy średni wskaźnik sTfR?
7. Dla wskaźnika sTfR sporządzić wykres typu ‘boxplot’ i zinterpretować go.
8. Ile alleli ma rozważany marker genetyczny?
9. Dla każdego pacjenta i każdego markera wyznaczyć genotypy?
10. Dla każdego z genotypów zamienić wartości znakowe na liczbowe tzn. genotyp AA na
wartość -1, genotyp AB na wartość 0 oraz genotyp BB na wartość 1.
11. Wyznaczyć częstości występowania danego genotypu.
12. Zapisać nowo powstały plik na dysku.
…
... zobacz całą notatkę
Komentarze użytkowników (0)