Korelacja i regresja liniowa-opracowanie

Nasza ocena:

3
Pobrań: 182
Wyświetleń: 1428
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Korelacja i regresja liniowa-opracowanie - strona 1 Korelacja i regresja liniowa-opracowanie - strona 2 Korelacja i regresja liniowa-opracowanie - strona 3

Fragment notatki:

KORELACJA I REGRESJA LINIOWA
Korelacja (zależność korelacyjna) w statystyce oznacza zależność między cechami (współzależność cech). Zajmujemy się badaniem dwóch cech jednocześnie. Sprawdzamy, czy istnieją zależności (związki) między tymi dwiema cechami.
Korelacja występuje wtedy, gdy określonym wartościom jednej zmiennej (cechy) przyporządkowane są ściśle określone średnie wartości drugiej zmiennej (cechy). Średnie - bo może wystąpić czynnik losowy (zakłócający).
Do mierzenia siły i kierunku korelacji stosuje się następujący współczynnik korelacji: współczynnik korelacji liniowej Pearsona.
Współczynnik korelacji liniowej Pearsona
1. Wzór:
gdzie:
C(X,Y) - kowariancja między cechami X i Y,
- wariancja cechy X,
- wariancja cechy Y,
- odchylenie standardowe cechy X,
- odchylenie standardowe cechy Y.
Powyższy wzór zawiera trzy warianty zapisu współczynnika korelacji Pearsona:
Pierwszy zapis wykorzystujemy w sytuacji, gdy mamy już policzoną kowariancję w zadaniu oraz dwie wariancje - cechy X i Y.
Drugi zapis dotyczy sytuacji, gdy nic nie jest policzone, a tylko są dane wartości w tabeli. Wówczas rozpisujemy tabelę na kolejne kolumny i szukamy sum, które potem podstawiamy do wzoru środkowego.
Trzeci wariant stosujemy wtedy, gdy mamy policzoną kowariancję oraz odchylenia standardowe cech X i Y.
2. Współczynnik ten jest unormowany w przedziale [-1;1], tzn. może przyjmować tylko wartości z tego przedziału. Wartości dodatnie oznaczają korelację dodatnią, co oznacza, że wzrostowi wartości jednej cechy odpowiada wzrost średnich wartości cechy drugiej. Wartości ujemne oznaczają korelację ujemną, czyli wzrostowi wartości jednej cechy odpowiada spadek średnich wartości cechy drugiej.
3. Interpretacja współczynnika korelacji:
♦ jeżeli - nie ma związku liniowego między cechami,
♦ jeżeli - niska (słaba) zależność liniowa,
♦ jeżeli - umiarkowana (średnia) zależność korelacyjna,
♦ jeżeli - znacząca (silna) zależność liniowa,
♦ jeżeli - bardzo silna zależność liniowa,
♦ jeżeli - zależność funkcyjna (1 - funkcja liniowa rosnąca; -1 - funkcja liniowa malejąca),
♦ jeżeli - brak jakiejkolwiek zależności między cechami.
REGRESJA LINIOWA
W każdym zadaniu, w którym mamy dwie zmienne X i Y możemy wyznaczyć dwie linie regresji:


(…)

… liniowa rosnąca; -1 - funkcja liniowa malejąca),
♦ jeżeli - brak jakiejkolwiek zależności między cechami.
REGRESJA LINIOWA
W każdym zadaniu, w którym mamy dwie zmienne X i Y możemy wyznaczyć dwie linie regresji:
I linia regresji II linia regresji
gdzie: gdzie:
x- zmienna objaśniana (zależna), x- zmienna objaśniająca (niezależna),
y - zmienna objaśniająca (niezależna),
- parametr linii regresji (współczynnik kierunkowy prostej),
b - drugi parametr linii regresji.
y - zmienna objaśniana (zależna),
- parametr linii regresji,
b - drugi parametr linii regresji.
W pierwszej linii regresji mamy sytuację, w której zmienna y ma wpływ ma kształtowanie się zmiennej x. Interpretacja parametrów a i b jest następująca:
Parametr a - jeżeli zmienna y wzrośnie o jednostkę, to zmienna x wzrośnie lub spadnie…
… współczynnik korelacji Pearsona, według wzoru:
Aby ocenić dopasowanie prostej regresji do punktów empirycznych (danych z tabeli), należy obliczyć tzw. współczynnik determinacji, według wzoru:
czyli należy podnieść do kwadratu obliczony wcześniej współczynnik korelacji. Współczynnik determinacji jest unormowany w przedziale [0;1]. Im bliżej 1, tym lepsze dopasowanie modelu do rzeczywistości.
Przykład (zad. 1…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz