Statystyka - zagadnienia i interpretacja wzorów

Nasza ocena:

5
Pobrań: 630
Wyświetleń: 2114
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Statystyka - zagadnienia i interpretacja wzorów  - strona 1 Statystyka - zagadnienia i interpretacja wzorów  - strona 2 Statystyka - zagadnienia i interpretacja wzorów  - strona 3

Fragment notatki:


Jaka jest różnica między analizą wariancji a regresji? Analiza wariancji polega na badaniu istotności wpływu wyodrębnionego czynnika klasyfikacyjnego (zabiegu) na zmienną objaśnianą. Hipoteza jaką chcemy weryfikować to: Ho = μ1=μ2=μr czyli wszystkie średnie we wszystkich wyodrębnionych populacjach są identyczne wobec hipotezy alternatywnej H 1 : μi≠μj dla co najmniej jednej pary wskaźników i, j (i≠j).
Y= μ +a i + ε ki μ - jest pewną nie znaną stałą wartością wspólną dla wszystkich populacji i równą ich średniej, a i - jest również nieznaną stałą, która wyraża efekt i-tego poziomu czynnika klasyfikacyjnego na wartość obserwacji, ε ki - jest zmienną losową wyrażającą łączny efekt wpływu różnych innych czynników o charakterze przypadkowym na wartość obserwacji i jest nazywana błędem losowym. Analiza regresji zajmuje się wyznaczaniem funkcji f(x) na podstawie wartości zaobserwowanych Y dla różnych wartości X badamy np. zależność ilości spożywanego masła Y od ceny margaryny X. Regresja - jest zależność zmiennej losowej Y od zmiennej X typu:
Y = f(x) + ε
ε - pewna zmienna losowa której wartość oczekiwana jest zero. Wyjaśnij metodę najmniejszych kwadratów. Jest to najstarsza metoda konstruowania estymatorów.
Idea metody najmniejszych kwadratów jest następująca: jeśli na podstawie próby (x1,x2,...,x n ) szacuje się wartość średnią m. populacji to można opisać x i = m. + ε i , i = 1,...,n
gdzie ε i jest odchyleniem zmiennej X i od m. Należy oczekiwać że odchylenia te są małe gdyż obserwacje dostarczają pewnych informacji o m. Stąd, jako estymatora średniej m. można użyć takiej wielkości m. , która minimalizuje sumę: Na czym polega metoda wszystkich regresji doboru zmiennych. Liczba wszystkich funkcji regresji jest α^p. „Optymalny podzbiór: jest podzbiór o największym poprawionym współczynniku determinacji.
S=r^2-Adekuate (α stat) dla danego α jeżeli:
Rs^2 1-(1-r^2)(1 + dn,p. ^α) jeżeli:
p.jest bardzo dużo i zmiennych niezależnych jest dużo) gdzie:
Jakie wnioski wyprowadzamy na podstawie przedziału ufności w funkcji regresji. Przedział ufności (estymator przedziałowy) - jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru.
Na podstawie przedziału ufności możemy wnioskować o wartościach średnich cechy Y jednocześnie dla wielu wybranych wartości cechy X.
Wyjaśnij co mierzy poprawiony współczynnik determinacji. Współczynnik determinacji

(…)

… za prawdziwą a jakie za fałszywą.
WARIANCJA
Prezentuje parametry charakteryzujące zróżnicowanie cechy w rozkładzie empirycznym.
Wariancją dla x1,x2, itd. nazywamy wyrażenie
gdzie x (z dachem) jest średnią arytmetyczną.
Jest to średnia arytmetyczna kwadratów odchyleń wartości od średniej arytmetycznej z wartości.
WARIANCJA RESZT
W klasycznym modelu regresji liniowej wyrażenie Se^2 jest nieobciążonym…
… tego przypuszczenia jest oceniana na podstawie wyników próby losowej.
HIPOTEZA STATYSTYCZNA
dowolne przypuszczenie dot. rozkładu prawdopodobieństwa cechy (oznaczenie Ho).
JEDNOCZYNNIKOWA ANALIZA WARIANCJI:
warunki:
I. zmienne niezależne występują lub nie
II. każda X obserwacji zmiennej Y uzależniona jest tylko od jednej ze zmiennych niezależnych.
KLASYCZYNY MODEL REGRESJI LINIOWEJ
Każdej ustalonej wartości jednej zmiennej powiedzmy X druga zmienna losowa czyli Y ma warunkowy rozkład z wartością oczekiwaną.
E (Y[X = x) ax +β
KWANTYL
Kwantylem rzędu p. (0<p.<1) w rozkładzie empirycznym nazywamy taką wartość cechy kp dla której - jako pierwszej - dystrybuanta empiryczna spełnia warunek Fn (kp) >= p.
Kwantyle są rzędu 0,25, 0,5 0,75 i oddzielają one 25% obserwacji o wartościach niższych i 75 obserwacji o wartościach…
… ma następującą postać:
-∞ < x < ∞
przy czym σ >0
m - średnia zmiennej losowej X o rozkładzie normalnym,
σ - odchylenie standardowe
ROZKŁAD POISSONA
Przy zastosowaniu takiego rozkładu można w sposób przybliżony charakteryzować takie zjawiska jak liczba usterek w produkowanych urządzeniach, liczba skaz na określonej powierzchni mat..
Zmienna losowa X wartości k = 0,1,2... ma rozkład Poissona o parametrze λ…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz