Analiza danych statystycznych - ćwiczenia 3

Nasza ocena:

5
Pobrań: 14
Wyświetleń: 749
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza danych statystycznych - ćwiczenia 3 - strona 1 Analiza danych statystycznych - ćwiczenia 3 - strona 2

Fragment notatki:

 Liniowe metody klasyfikacji. Fisherowska dyskryminacja liniowa Ćwiczenia Plik dane_kosiarki.txt zawiera dane dotyczące posiadaczy kosiarek jeżdżą- cych do trawy. X1 wysokość dochodu w tysiącach dolarów X2 wielkość działki w tysiącach metrów kwadratowych Y informacja, czy rodzina posiada, czy nie posiada kosiarkę 1- oznacza, że posiada, 2 - że nie posiada kosiarki. Dla tych danych wykonaj następujące polecenia: i) Podziel dane na dwie grupy zależne od wartości zmiennej Y . ii) Przedstaw te dane na rysunku, używając różnych symboli klas. ii) Uzypełnij rysunek liniową funkcją klasyfikującą ( prostą dyskrymina- cyjną) otrzymaną przy założeniu o rozkładach normalnych obserwacji w obu grupach. W tym celu : 1.) Stwórz macierze złożone ze zmiennych X1 i X2 dla rodzin posiadają- cych i nie posiadających kosiarki. 2.) Oblicz wektory średnich wartości w klasach, próbkowe macierze kowari- ancji (s1 oraz s2) oraz próbkową macierz kowariancji wspólną dla obu klas W = 1 n − 2 ((n1 − 1) ∗ s1 + (n2 − 1) ∗ s2), gdzie n jest licznością próbki a n1 i n2 odpowiednimi licznościami klas. 3.) Oblicz macierz odwrotną do wspólnej macierzy kowariancji (polecenie solve(W)). 4.) Można wykazać, że wektor maksymalizujący iloraz (aT x1 − ax2) 2 aT W a jest proporcjonalny do wektora W −1(x1 − x2), natomiast regułę klasyfika- cyjną można sformułować jako: 1 Przypisz punkt x do klasy 1, jeśli (x1 − x2) T W −1x  1 2 (x1 − x2) T W −1(x 1 + x2) . Korzystając z tych informacji wyznacz prostą dyskryminacyjną najlepiej rozdzielającą klasy. 5.) Przedstaw wyznaczoną prostą dyskryminacyjną na rysunku wspólnie z danymi. Zadania Zadanie 5. Dla danych z powyższego ćwiczenia przeprowadź analizę dyskryminacyjną korzystając z funkcji lda w pakiecie MASS. Prawdopodobień- stwa a priori przynależności do klas przyjmij jako równe 0.5. i) Jakie są średnie wartości w grupach? ii) Jakie są wartości współczynników funkcji dyskryminacyjnych? iii) Dla każdej z funkcji dyskryminacyjnych określ która ze zmiennych ob- jaśniających jest najbardziej istotna. iv) Jakie są średnie wartości funkcji dyskryminacyjnych w każdej z grup? v) Przeprowadź predykcję przynależności do klas na zbiorze testowym. vi) Jakie są prawdopodobieństwa przynależności do klas dla dwudziestej ob- serwacji? vii) Do której z klas zostanie zaklasyfikowana ta obserwacja? viii) Wyznacz procent właściwie zaklasyfikowanych obiektów. ix) Przedstaw i skomentuj tabelę predykcji. Zadanie 6. Plik dane_wino.txt zawiera dane dotyczące koncentracji

(…)

… 5. Dla danych z powyższego ćwiczenia przeprowadź analizę
dyskryminacyjną korzystając z funkcji lda w pakiecie MASS. Prawdopodobieństwa a priori przynależności do klas przyjmij jako równe 0.5.
i) Jakie są średnie wartości w grupach?
ii) Jakie są wartości współczynników funkcji dyskryminacyjnych?
iii) Dla każdej z funkcji dyskryminacyjnych określ która ze zmiennych objaśniających jest najbardziej…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz