Analiza danych statystycznych - ćwiczenia 5

Nasza ocena:

5
Pobrań: 14
Wyświetleń: 812
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza danych statystycznych - ćwiczenia 5 - strona 1 Analiza danych statystycznych - ćwiczenia 5 - strona 2

Fragment notatki:

 Dyskryminacja oparta na regresji liniowej i logistycznej. Ćwiczenia Plik hsb.txt zawiera dane dotyczące 200 uczniów różnych typów szkół ich statusu ekonomicznego i wyników testów z różnych dziedzin. Zmienną ob- jaśniającą jest zmienna program oznaczająca typ szkoły, za zmienne ob- jaśniające przyjmujemy zmienne status.ek.- status ekonomiczny o trzech poziomach (niski/średni/wysoki) oraz pisanie- wynik testu językowego z pisania. Dla tych danych wykonaj następujące polecenia: i) Wygeneruj podpróbę uczącą o 150 elementach ze zbioru danych. Pozostałe dane przyjmij jako zbiór testowy. ii) Przedstaw tabelę liczności w grupach wyznaczonych przez zmienne status.ek. oraz program w zbiorze uczącym. Przedstaw tabelę wartości średnich i odchyleń standardowych w grupach wyznaczone na podstawie zbioru uczącego. iii) Stosując funkcję multinom dokonaj dopasowania modelu log-liniowego opisującego zależność pomiędzy zmienną program a zmiennymi status.ek. oraz pisanie. iv) Zmiennej pisanie przypisz jej wartość średnią a następnie wyznacz przewidywane prawdopodobieństwa przynależności do klas. Wskaż klasę przewidywaną przez model wyznaczony w punkcie poprzednim w oparciu o regułę Bayesa. v) Przedstaw tabelę klasyfikacji i wyznacz błąd klasyfikacji. vi) Przeprowadź analizę LDA dla badanego modelu, wyznacz bład klasy- fikacji i porównaj z wynikiem uzyskanym w iv). vii) Powtórz analizę modeli 10 razy, za każdym razem generując na nowo próbę uczącą. W każdym kroku wyznacz proporcję poprawnych klasyfikacji dla obu metod. Wylicz średnią proporcję poprawnych klasyfikacji dla obu metod. viii) Wygeneruj nowe wartości dla zmiennych status.ek. oraz pisanie, każdej wartości zmiennej status.ek. przypisując ciąg liczb od 30 do 70 (jako wartości zmiennej pisanie). Wyznacz wartości prawdopodobieństw przy- należności obserwacji do każdej z trzech grup wyznaczonych przez wartości zmiennej program oraz średnie wartości tych prawdopodobieństw w grupach. ix) Przedstaw rysunek przewidywanych wartości prawdopodobieństw w za- leżności od wartości zmiennej pisanie dla trzech poziomów zmiennej status.ek. dla każdego z poziomów zmiennej program. 1 Zadania Zadanie 9. Pododnie jak w powyższym ćwiczeniu przeanalizuj zbiór danych iris (pakiet MASS). Za zmienną objaśnianą przyjmij zmienną Species, za zmienne objaśniające przyjmij zmienne Sepal.Length oraz Petal.Width. Zmienną Sepal.Length przedstaw jako zmienną o trzech możliwych poziomach: krótki, średni, długi dzieląc równomiernie zakres możliwych wartości tej zmi- ennej. Rozmiar próby uczącej ustal na 80% liczby wszystkich obserwacji i ... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz