Pytania i odpowiedzi ze statystyki. 7 stron w formacie doc pytań ze statystyki. Przykładowe pytania:
Jaka jest różnica między analizą wariancji a regresji?
Wyjaśnij metodę najmniejszych kwadratów; Na czym polega metoda wszystkich regresji doboru zmiennych?
Jakie wnioski wyprowadzamy na podstawie przedziału ufności w funkcji regresji?
Wyjaśnij co mierzy poprawiony współczynnik determinacji.
Co to jest reszta w analizie regresji?
Co mierzy współczynnik korelacji wielokrotnej?
W 2 czynnikowej analizie wariancji hipotezę o braku współdziałania czynników A oraz B odrzucono. Zinterpretuj wynik.
Wyjaśnić jakie wnioski można wyprowadzić z analizy normalnego wykresu prawdopodobieństwa.
Ponadto wyjaśnione pojęcia (przykładowe): analiza resztowa, dominanta, cechy ciągłe, estymacja modelu regresji, estymator, funkcja regresji, hipoteza statystyczna, model jednoczynnikowy, obszar predykcji, poziom istotności, predykcja, odchylenie standardowe reszt, regresja łamana, rozkład Poissona, rozkład normalny, rozkład zmiennej losowej, test kołomogorowa, test statystyczny, wariancja reszt, współczynnik determinacji w populacji, współczynnik determinacji w próbie, współczynnik korelacji rang, zmienna dyskretna, zmienna losowa, narzędzia analizy regresji, etapy analizy regresji i inne.
Ponadto wzory na modele liniowe: funkcja regresji, regresja liniowa, regresja wielokrotna, regresja potęgowa, regresja wielomianowa, regresja nieliniowa - funkcja nieliniowa ze względu na parametry.
11. Jaka jest różnica między analizą wariancji a regresji?
Analiza wariancji polega na badaniu istotności wpływu wyodrębnionego czynnika klasyfikacyjnego (zabiegu) na zmienną objaśnianą. Hipoteza jaką chcemy weryfikować to: Ho = μ1=μ2=μr czyli wszystkie średnie we wszystkich wyodrębnionych populacjach są identyczne wobec hipotezy alternatywnej H1:μi≠μj dla co najmniej jednej pary wskaźników i, j (i≠j).
Y=μ+ai+εki
μ - jest pewną nie znaną stałą wartością wspólną dla wszystkich populacji i równą ich średniej, ai - jest również nieznaną stałą, która wyraża efekt i-tego poziomu czynnika klasyfikacyjnego na wartość obserwacji, εki - jest zmienną losową wyrażającą łączny efekt wpływu różnych innych czynników o charakterze przypadkowym na wartość obserwacji i jest nazywana błędem losowym.
Analiza regresji zajmuje się wyznaczaniem funkcji f(x) na podstawie wartości zaobserwowanych Y dla różnych wartości X badamy np. zależność ilości spożywanego masła Y od ceny margaryny X. Regresja - jest zależność zmiennej losowej Y od zmiennej X typu:
Y = f(x) + ε
ε - pewna zmienna losowa której wartość oczekiwana jest zero.
12. Wyjaśnij metodę najmniejszych kwadratów.
Jest to najstarsza metoda konstruowania estymatorów.
Idea metody najmniejszych kwadratów jest następująca: jeśli na podstawie próby (x1,x2,...,xn) szacuje się wartość średnią m. populacji to można opisać xi = m. + εi , i = 1,...,n
gdzie εi jest odchyleniem zmiennej Xi od m.
Należy oczekiwać że odchylenia te są małe gdyż obserwacje dostarczają pewnych informacji o m. Stąd, jako estymatora średniej m. można użyć takiej wielkości m. , która minimalizuje sumę:
14. Na czym polega metoda wszystkich regresji doboru zmiennych.
Liczba wszystkich funkcji regresji jest α^p. „Optymalny podzbiór: jest podzbiór o największym poprawionym współczynniku determinacji.
S=r^2-Adekuate (α stat) dla danego α jeżeli:
Rs^2 > 1-(1-r^2)(1 + dn,p. ^α) jeżeli:
p.jest bardzo dużo i zmiennych niezależnych jest dużo) gdzie:
15. Jakie wnioski wyprowadzamy na pod
(…)
…
Każdej ustalonej wartości jednej zmiennej powiedzmy X druga zmienna losowa czyli Y ma warunkowy rozkład z wartością oczekiwaną.
E (Y[X = x) ax +β
KWANTYL
Kwantylem rzędu p. (0<p.<1) w rozkładzie empirycznym nazywamy taką wartość cechy kp dla której - jako pierwszej - dystrybuanta empiryczna spełnia warunek Fn (kp) >= p.
Kwantyle są rzędu 0,25, 0,5 0,75 i oddzielają one 25% obserwacji o wartościach…
... zobacz całą notatkę
Komentarze użytkowników (0)