Analiza korespondencji i odpowiedniości - opracowanie

Nasza ocena:

5
Pobrań: 119
Wyświetleń: 1323
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Analiza korespondencji i odpowiedniości - opracowanie - strona 1

Fragment notatki:

Analiza statystyczna w badaniach rynku prof. dr hab. Eugeniusz Gatnar
Analiza korespondencji
Analiza odpowiedniości
Analiza korespondencji powstała na gruncie psychologii.
Metody analizy korespondencji zostały rozwinięte we wczesnych latach 60-tych a potem 70-tych przez Jean-Paula Benzecri i jego współpracowników, którzy zapoczątkowali serię badań analizy danych.
Hill (1974) w swoim artykule spopularyzował nazwę analiza korespondencji, ale koncentrował się na jednym wymiarze. W latach 80-tych zyskała popularność w krajach anglojęzycznych.
Definicja
Analiza korespondencji jest techniką skalowania wielowymiarowego, która służy do badania struktury powiązanej między kategoriami zmiennych mierzonych na skali nominalnej.
Analiza ta przedstawia kategorie zmiennych we wspólnej przestrzeni, zazwyczaj zdefiniowanej przez dwa lub trzy wymiary w postaci tzw. Mapy przestrzennej.
Algorytm analizy korespondencji
Obliczenie profili wierszowych/kolumnowych (liczebności względnych)
Obliczenie mas wierszowych/kolumnowych (liczebności brzegowe)
Obliczenie odległości między wierszami/kolumnami przy użyciu metryki chi-kwadrat.
Macierz korespondencji masa wierszy i kolumn
Macierz korespondencji P jest zdefiniowana jako macierz elementów tablicy podzielona przez liczebność (n) tj.
Masa wierszy r jest sumą wierszy podzieloną przez liczebność
Masa kolumn c jest sumą kolumn podzielonych przez liczebność
Profile wierszy
Macierz profili wierszowych może być przedstawiana w poniższy sposób:
D jest macierzą diagonalną, której elementy są częstościami brzegowymi wierszy
Rh - masa h-tego wiersza
Phj - częstości obserwowane w h-tym wierszy oraz j-tej kolumnie macierzy P
Profile kolumn
Macierz profili kolumnowych może być przedstawiona w poniższy sposób:
Centroida
Centroida (środek ciężkości) wyznacza początek ukł współrzędnych
- średnie profile wierszy to masy kolumn
- średnie profile kolumn to masy wierszy
Jeśli dany profil różni się znacznie od średniego profilu to taki punkt będzie leżał daleko od początku układu współrzędnych. Natomiast punkty, których profile są zbliżone do średniego profilu, będą położone bliżej centroidy. W przypadku, gdy punkty mają równe profile, to wtedy będą pokrywały się z centroidą, czyli początkiem układu współrzędnych.
Odległość chi kwadrat
Odległość między wierszami h oraz h' jest określona za pomocą poniższego wzoru:


(…)

…. Natomiast punkty, których profile są zbliżone do średniego profilu, będą położone bliżej centroidy. W przypadku, gdy punkty mają równe profile, to wtedy będą pokrywały się z centroidą, czyli początkiem układu współrzędnych.
Odległość chi kwadrat
Odległość między wierszami h oraz h' jest określona za pomocą poniższego wzoru:
Rozkład macierzy według wartości osobliwych (SVD)
Rozkład macierzy według wartości osobliwych stosuje się do macierzy prostokątnych. Polega on na rozkładzie macierzy A o wymiarach H x J na iloczyn trzech macierzy:
A=UDαVT
Gdzie Dα jest macierzą diagonalną o wartościach dodatnich uporządkowanych w sposób malejący:
α1≥ α2≥ α3… Elementy macierzy Dα nazywane są wartościami osobliwymi macierzy A
Macierz U o wymiarach H x K utworzona jest z wektorów własnych odpowiadających kwadratom własności…
… według wartości osobliwych
A=Dr-1/2(P-rcT)Dc-1/2
A=UDαVT
Główne współrzędne
Współrzędne wierszy F oraz kolumn G będą wyznaczane na podstawie poniższych wzorów:
F=Dr-1/2UDα
G=Dc-1/2VDα
Inercja (bezwładność)
Inercja jest statystką chi kwadrat podzieloną przez ilość obserwacji I obliczana jest wg poniższej formuły:
Wartość całkowitej inercji może być również dekomponowana na poszczególne kategorie zmiennych…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz