Statystyka - zagadnienia i interpretacja wzorów

Jaka jest różnica między analizą wariancji a regresji? Analiza wariancji polega na badaniu istotności wpływu wyodrębnionego czynnika klasyfikacyjnego (zabiegu) na zmienną objaśnianą. Hipoteza jaką chcemy weryfikować to: Ho = μ1=μ2=μr czyli wszystkie średnie we wszystkich wyodrębnionych populacjach są identyczne wobec hipotezy alternatywnej H 1 : μi≠μj dla co najmniej jednej pary wskaźników i, j (i≠j).

Y= μ +a i + ε ki μ - jest pewną nie znaną stałą wartością wspólną dla wszystkich populacji i równą ich średniej, a i - jest również nieznaną stałą, która wyraża efekt i-tego poziomu czynnika klasyfikacyjnego na wartość obserwacji, ε ki - jest zmienną losową wyrażającą łączny efekt wpływu różnych innych czynników o charakterze przypadkowym na wartość obserwacji i jest nazywana błędem losowym. Analiza regresji zajmuje się wyznaczaniem funkcji f(x) na podstawie wartości zaobserwowanych Y dla różnych wartości X badamy np. zależność ilości spożywanego masła Y od ceny margaryny X. Regresja - jest zależność zmiennej losowej Y od zmiennej X typu:

Y = f(x) + ε

ε - pewna zmienna losowa której wartość oczekiwana jest zero. Wyjaśnij metodę najmniejszych kwadratów. Jest to najstarsza metoda konstruowania estymatorów.

Idea metody najmniejszych kwadratów jest następująca: jeśli na podstawie próby (x1,x2,...,x n ) szacuje się wartość średnią m. populacji to można opisać x i = m. + ε i , i = 1,...,n

gdzie ε i jest odchyleniem zmiennej X i od m. Należy oczekiwać że odchylenia te są małe gdyż obserwacje dostarczają pewnych informacji o m. Stąd, jako estymatora średniej m. można użyć takiej wielkości m. , która minimalizuje sumę: Na czym polega metoda wszystkich regresji doboru zmiennych. Liczba wszystkich funkcji regresji jest α^p. „Optymalny podzbiór: jest podzbiór o największym poprawionym współczynniku determinacji.

S=r^2-Adekuate (α stat) dla danego α jeżeli:

Rs^2 1-(1-r^2)(1 + dn,p. ^α) jeżeli:

p.jest bardzo dużo i zmiennych niezależnych jest dużo) gdzie:

Jakie wnioski wyprowadzamy na podstawie przedziału ufności w funkcji regresji. Przedział ufności (estymator przedziałowy) - jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru.

Na podstawie przedziału ufności możemy wnioskować o wartościach średnich cechy Y jednocześnie dla wielu wybranych wartości cechy X.

Wyjaśnij co mierzy poprawiony współczynnik determinacji. Współczynnik determinacji

comments powered by Disqus

Przepisz kod z obrazka, aby kontynuować pobieranie

Nie notuj, studiuj!
Dołącz teraz do naszej społeczności.

Jeśli pobieranie nie rozpoczęło się automatycznie, kliknij tutaj.