Bioinformatyka CWICZENIE 7 1. Zasady stosowania pakietu SAS - prezentacja. 2. Omówienie programu SAS stosowanego na ćwiczeniach. 3. Samodzielne przygotowanie programu w SAS słuzącego do obliczabia wsp. rekombinacji pomiędzy markerami z własnego zbioru danych: przeliczyć wsp. rekombinacji na cM przy uzyciu funkcji Haldane'a przeliczyć wsp. rekombinacji na cM przy uzyciu funkcji Kosambi Wzór programu: /* czytanie danych */ data REKOMB ; infile "[podać ścieżkę i nazwę pliku z danymi]" ; input @1 ID /* numer osobnika */ @3 L1A1 @4 L1A2 /* allel 1 i 2 w markerze 1 */ @6 L2A1 @7 L2A2 /* allel 1 i 2 w markerze 2 */ @8 L3A1 @9 L3A2 /* allel 1 i 2 w markerze 1 */ [kontynuować dla wszystkich markerów] ; /* tworzenie haplotypów dwumarkerowych */ data REC1 (keep=H12) ; set REC ; H12=L1A1*10+L2A1 ; output ; H12=L1A2*10+L2A2 ; output ; [kontynuować dla pozostałych par markerów: 2-3, 3-4 itd.] run ; /* obliczanie liczebności poszczególnych haplotypów */ proc freq data=REC1 ; tables H12 / out=COUNTHAP12 ; tables H23 / out=COUNTHAP23 ; [dla pozostałych haplotypów] run ; /* sortowanie haplotypów wg liczbności */ proc sort data=COUNTHAP12 ; by COUNT; run ; proc sort data=COUNTHAP23 ; by COUNT; run ; /* obliczanie wsp. rekombinacji i cM wg funkcji Haldane'a */ [kontynuować dla pozostałych haplotypów] data COUNTHAPa12 ; retain N 0 ; set COUNTHAP12 ; N=N+1 ; run ; data REC2 ; retain REC 0 NREC 0 ; set COUNTHAPa12 ; if N=1 or N=2 then REC=REC+COUNT ; else if N=3 or N=4 then NREC=NREC+COUNT ; RECOMBINATION=REC/(REC+NREC) ; HALDANE_CM=-0.5*log(1-2*RECOMBINATION) ; run ; proc print data=REC2 ; run ;
... zobacz całą notatkę
Komentarze użytkowników (0)