Analiza danych statystycznych - ćwiczenia 6

Nasza ocena:

5
Pobrań: 21
Wyświetleń: 826
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza danych statystycznych - ćwiczenia 6 - strona 1 Analiza danych statystycznych - ćwiczenia 6 - strona 2

Fragment notatki:

 Kwadratowa analiza dyskryminacyjna QDA. Metody klasyfikacji oparte na rozkładach prawdopodobieństwa. Ćwiczenia Ćwiczenie korzysta z ćwiczenia dotyczącego analizy LDA z listy zadań 3. Plik dane_kosiarki.txt zawiera dane dotyczące posiadaczy kosiarek jeżdżących do trawy. X1 wysokość dochodu w tysiącach dolarów X2 wielkość działki w tysiącach metrów kwadratowych Y informacja, czy rodzina posiada, czy nie posiada kosiarkę 1- oznacza, że posiada, 2 - że nie posiada kosiarki. Dla tych danych wykonaj następujące polecenia: i) Podziel dane na dwie grupy zależne od wartości zmiennej Y . ii) Przedstaw te dane na rysunku, używając różnych symboli klas. iii) Uzupełnij rysunek kwadratową funkcją klasyfikującą postaci ln π2 π1 + x T (S−1 2 m2 − S −1 1 m1) − 1 2 x T (S−1 2 − S −1 1 )x + k, gdzie k = 1 2 ln |S1| |S2| + 1 2 m T 1 S −1 1 m1 − m T 2 S −1 2 m2 oraz S1, S2 oznaczają próbkowe macierze kowariancji, m1, m2 wektory śred- nich a π1, π2 prawdopodobieństwa a priori w grupach osób posiadających i nie posiadających kosiarki odpowiednio. Aby wykonać rysunek wykonaj kolejno polecenia: 1.) Tak jak w ćwiczeniu z listy 3 stwórz macierze złożone ze zmiennych X1 i X2 dla rodzin posiadających i nie posiadających kosiarki oraz oblicz wektory średnich wartości w klasach i próbkowe macierze kowariancji (S1 oraz S2). 2.) Oblicz macierze odwrotne do S1 oraz S2. Wylicz wartość stałej k. Ustal wartości prawdopodobieństw a priori π1 i π2 na 1 2 . 3.) Dla określenia zakresu osi rysunku ustal zakres wartości osi dla zmi- ennej X1 oraz X2. Dla każdej pary punktów z ustalonego zakresu wyznacz 1 wartość kwadratowej funkcji dyskryminacyjnej. 5.) Przedstaw wyznaczoną krzywą dyskryminacyjną na rysunku wspólnie z danymi oraz wyznaczoną na zajęciach 3 prostą dyskryminacyjną LDA. Zadania Zadanie 10. Dla danych z powyższego ćwiczenia przeprowadź analizę dyskryminacyjną korzystając z funkcji qda w pakiecie MASS. Prawdopodobień- stwa a priori przynależności do klas przyjmij jako równe 1 2 . i) Jakie są średnie wartości w grupach? ii) Przeprowadź predykcję przynależności do klas na zbiorze testowym. iii) Jakie są prawdopodobieństwa przynależności do klas dla dziesiątej ob- serwacji? iv) Do której z klas zostanie zaklasyfikowana ta obserwacja? v) Wyznacz procent właściwie zaklasyfikowanych obiektów. vi) Przedstaw i skomentuj tabelę predykcji. vii) Przeprowadź procedurę kroswalidacji dla metody QDA i wyznacz pro-

(…)

… posiadających oraz nie posiadających kosiarki. Jak zinterpretujesz uzyskane
krzywe?
Zadanie 11. W pakiecie MASS znajdują się dane Pima.te. Zapoznaj
się z zawartością tego zbioru danych. Dla zmiennej objaśnianej przeprowadź
analizę metodą LDA i QDA. Porównaj proporcje błędnych klasyfikacji dokonane przez te dwie metody. Wyznacz i porównaj ze sobą błędy dla tych
metod uzyskane przy zastosowaniu procedury…
... zobacz całą notatkęKomentarze użytkowników (0)

Zaloguj się, aby dodać komentarz