Regresja wieloraka.

Nasza ocena:

5
Pobrań: 182
Wyświetleń: 1183
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Regresja wieloraka. - strona 1 Regresja wieloraka. - strona 2 Regresja wieloraka. - strona 3

Fragment notatki:

Model wielokrotnej regresji (MR).
Model analizy wariancji (ANOVA) a model wielokrotnej regresji (MR).
Jednym z ważnych i często „blokujących” psychologa założeń modelu MR jest założenie o CO NAJMNIEJ INTERWAŁOWYM poziomie pomiaru zmiennych niezależnych (predyktorów), wprowadzonych przez badacza do modelu MR.
Dlaczego MR?
Koszt badania wzrasta zdecydowanie przy kolejnym dołączaniu nowych zmiennych (nawet wyłącznie dwuwartościowych jak płeć).
Jeśli przebadanie np. każdej osoby jest kosztowne i na dodatek trudno daną osobę pozyskać do badania, to oczywiste jest szukanie modeli mniej „kapitałochłonnych” od modelu ANOVA
Chcąc posłużyć się modelem ANOVA musimy dość często rezygnować z mierzenia danej zmiennej niezależnej na poziomie skali interwałowej czy nawet ilorazowej, i w sposób sztuczny sprawdzać ją na poziom pomiaru skali nominalnej
Najbardziej „kosztowne”, jeżeli chodzi o utratę informacji, są zabiegi dychotomizacji zakresu wartości zmiennej ilościowej
Często jest tak, że część zmiennych niezależnych jest ze swej natury jakościowa (np. płeć), a cześć ilorazowa - więc odwołać się do takiego modelu, który pozwalałby na zachowanie natury pomiarowej zmiennej, tzn. nie wymuszałby zabiegu sprowadzania skali interwałowej (czy ilorazowej) do skali nominalnej Analiza wariancji wykorzystywana jest przez psychologów w wariancie ortogonalnym, który zakłada równą lub proporcjonalną liczebność grup porównawczych („kratel”).
Trafność zewnętrzna planu eksperymentalnego wymaga, aby badanie przeprowadzone było na próbie REPREZENTATYWNEJ dla całej populacji. Rozkład liczebności w poszczególnych grupach porównawczych, odpowiadających wartościom danej zmiennej niezależnej (nominalnej) powinien pokrywać się z analogicznym rozkładem liczebności w populacjach porównawczych. Nie można prowadzić badania w wariancie ortogonalnym ANOVA, jeżeli populacje porównawcze nie mają takich samych rozkładów liczebności.
Jeżeli w populacji ogólnej jest znacząca przewaga liczebności jednej płci w stosunku do drugiej, a płeć jest zmienną istotną dla zmiennej zależnej, to ta przewaga musi być również utrzymana w próbie. W przeciwnym przypadku nie można tej próby uznać za reprezentatywną
Ważnym punktem jest także „liniowość versus krzywoliniowość związku Y i X”
Nie sposób określić, w modelu ANOVA, efektów interakcyjnych dwóch czynników, z których jeden ma charakter ilościowy, a drugi jakościowy, bez uprzedniego sprowadzenia tego pierwszego też do postaci jakościowej
PODSTAWOWE ODMIANY MR.
W pierwszej odmianie modelu MR mamy tylko jedną zmienną niezależną, istotną dla Y. Nazwijmy tę odmianę jednozmiennową. Druga odmiana - wielozmiennowa, obejmuje dwie (i większą liczbę) zmienne niezależne istotne dla Y.


(…)

… (jeśli nie całość) zmienności pierwotnej. Wartość R-kwadrat stanowi wskaźnik jakości dopasowania modelu do danych (R-kwadrat bliskie 1,0 wskazuje, że prawie cała zmienność zmiennej zależnej może być objaśniona przez zmienne niezależne włączone do modelu).
Interpretacja współczynnika korelacji R.Zazwyczaj stopień, w jakim dwie lub więcej zmiennych objaśniających (niezależnych lub X) jest powiązanych ze zmienną
… linii regresji będą bardzo niestabilne i będą się silnie zmieniać wraz ze wzrostem liczby przypadków.
Współliniowość a złe uwarunkowanie macierzy.Jest to typowy problem w wielu przypadkach analiz korelacyjnych. Wyobraźmy sobie, że mamy dwie zmienne objaśniające wzrost osoby (zmienne niezależne X): (1) ciężar w kilogramach i (2) ciężar w dekagramach. Oczywiście takie dwie zmienne są ewidentnie…
… cząstkowa Wartości przewidywane a wartości resztowe Wariancja resztowa a R-kwadrat Interpretacja współczynnika korelacji wielorakiej R Patrz także Techniki zgłębiania danych (data mining) oraz Ogólne modele regresji i Ogólne modele liniowe . Metoda najmniejszych kwadratów.Na wykresie rozrzutu przedstawiamy zmienną niezależną X i zmienną zależną Y. Zmienne te mogą reprezentować np. Iloraz inteligencji (IQ…
…) zmierzony przy pomocy odpowiedniego testu oraz wyniki osiągnięć szkolnych (średnia ocen; ŚO). Każdy punkt na wykresie reprezentuje jednego ucznia to znaczy jego IQ oraz ŚO. Celem procedury regresji liniowej jest dopasowanie linii do tych punktów. Program tak dobierze równanie tej linii, że suma kwadratów odległości punktów na wykresie rozrzutu od linii regresji będzie minimalna. Dzięki tej własności…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz