Podstawy statystyki - wykład

Nasza ocena:

3
Pobrań: 231
Wyświetleń: 847
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Podstawy statystyki - wykład - strona 1 Podstawy statystyki - wykład - strona 2 Podstawy statystyki - wykład - strona 3

Fragment notatki:

11. Jaka jest różnica między analizą wariancji a regresji?
Analiza wariancji polega na badaniu istotności wpływu wyodrębnionego czynnika klasyfikacyjnego (zabiegu) na zmienną objaśnianą. Hipoteza jaką chcemy weryfikować to: Ho = μ1=μ2=μr czyli wszystkie średnie we wszystkich wyodrębnionych populacjach są identyczne wobec hipotezy alternatywnej H1:μi≠μj dla co najmniej jednej pary wskaźników i, j (i≠j).
Y=μ+ai+εki
μ - jest pewną nie znaną stałą wartością wspólną dla wszystkich populacji i równą ich średniej, ai - jest również nieznaną stałą, która wyraża efekt i-tego poziomu czynnika klasyfikacyjnego na wartość obserwacji, εki - jest zmienną losową wyrażającą łączny efekt wpływu różnych innych czynników o charakterze przypadkowym na wartość obserwacji i jest nazywana błędem losowym.
Analiza regresji zajmuje się wyznaczaniem funkcji f(x) na podstawie wartości zaobserwowanych Y dla różnych wartości X badamy np. zależność ilości spożywanego masła Y od ceny margaryny X. Regresja - jest zależność zmiennej losowej Y od zmiennej X typu:
Y = f(x) + ε
ε - pewna zmienna losowa której wartość oczekiwana jest zero. 12. Wyjaśnij metodę najmniejszych kwadratów.
Jest to najstarsza metoda konstruowania estymatorów.
Idea metody najmniejszych kwadratów jest następująca: jeśli na podstawie próby (x1,x2,...,xn) szacuje się wartość średnią m. populacji to można opisać xi = m. + εi , i = 1,...,n
gdzie εi jest odchyleniem zmiennej Xi od m.
Należy oczekiwać że odchylenia te są małe gdyż obserwacje dostarczają pewnych informacji o m. Stąd, jako estymatora średniej m. można użyć takiej wielkości m. , która minimalizuje sumę:
14. Na czym polega metoda wszystkich regresji doboru zmiennych.
Liczba wszystkich funkcji regresji jest α^p. „Optymalny podzbiór: jest podzbiór o największym poprawionym współczynniku determinacji.
S=r^2-Adekuate (α stat) dla danego α jeżeli:
Rs^2 1-(1-r^2)(1 + dn,p. ^α) jeżeli:
p.jest bardzo dużo i zmiennych niezależnych jest dużo) gdzie:
15. Jakie wnioski wyprowadzamy na podstawie przedziału ufności w funkcji regresji.
Przedział ufności (estymator przedziałowy) - jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru.
Na podstawie przedziału ufności możemy wnioskować o wartościach średnich cechy Y jednocześnie dla wielu wybranych wartości cechy X.
16. Wyjaśnij co mierzy poprawiony współczynnik determinacji.


(…)

… pozwalają uznać sprawdzaną hipotezę za prawdziwą a jakie za fałszywą.
WARIANCJA
Prezentuje parametry charakteryzujące zróżnicowanie cechy w rozkładzie empirycznym.
Wariancją dla x1,x2, itd. nazywamy wyrażenie
gdzie x (z dachem) jest średnią arytmetyczną.
Jest to średnia arytmetyczna kwadratów odchyleń wartości od średniej arytmetycznej z wartości.
WARIANCJA RESZT
W klasycznym modelu regresji liniowej…
… generalnej. Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej.
HIPOTEZA STATYSTYCZNA
dowolne przypuszczenie dot. rozkładu prawdopodobieństwa cechy (oznaczenie Ho).
JEDNOCZYNNIKOWA ANALIZA WARIANCJI:
warunki:
I. zmienne niezależne występują lub nie
II. każda X obserwacji zmiennej Y uzależniona jest tylko od jednej ze zmiennych niezależnych.
KLASYCZYNY MODEL REGRESJI LINIOWEJ
Każdej ustalonej wartości jednej zmiennej powiedzmy X druga zmienna losowa czyli Y ma warunkowy rozkład z wartością oczekiwaną.
E (Y[X = x) ax +β
KWANTYL
Kwantylem rzędu p. (0<p.<1) w rozkładzie empirycznym nazywamy taką wartość cechy kp dla której - jako pierwszej - dystrybuanta empiryczna spełnia warunek Fn (kp) >= p.
Kwantyle są rzędu 0,25, 0,5 0,75 i oddzielają one 25% obserwacji o wartościach…
…) jeśli jej funkcja gęstości ma następującą postać:
-∞ < x < ∞
przy czym σ >0
m - średnia zmiennej losowej X o rozkładzie normalnym,
σ - odchylenie standardowe
ROZKŁAD POISSONA
Przy zastosowaniu takiego rozkładu można w sposób przybliżony charakteryzować takie zjawiska jak liczba usterek w produkowanych urządzeniach, liczba skaz na określonej powierzchni mat..
Zmienna losowa X wartości k = 0,1,2... ma rozkład…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz