METODY GRUPOWANIA OBIEKTÓW Cele grupowania: utworzenie jak najbardziej jednorodnych grup obiektów (skupień) ze względu na podobieństwo w zakresie wewnętrznej struktury charakteryzujących je zmiennych. Kryteria grupowania: homogeniczności: obiekty należące do tej samej grupy powinny być do siebie jak najbardziej podobne,
heterogeniczności: obiekty należące do różnych grup powinny być do siebie jak najmniej podobne.
Warunki grupowania: zbiór obiektów O={O 1 ,O 2 ,...,O n } dzielimy na podzbiory (grupy obiektów) spełniające warunki:
zupełności:
, (3.1)
rozłączności:
, r,r'=1,2,...,z , r ≠ r' , (3.2)
niepustości:
∅ , r=1,2,...,z . (3.3)
METODY GRUPOWANIA OBIEKTÓW metody grupowania obiektów uporządkowanych liniowo
metody aglomeracyjne
metody podziału dendrytu
metody podziału dendrogramu
metody deglomeracyjne
metody optymalizacji danego grupowania metody obszarowe
metody taksonomii struktur
METODY GRUPOWANIA OBIEKTÓW UPORZĄDKOWANYCH LINIOWO METODY DIAGRAMOWE METODA PODOLEC Założenia: w optymalnym grupowaniu poszczególne grupy powinny składać się z obiektów, pomiędzy którymi występują wyłącznie tzw. bliskie powiązania, a poza grupami tylko tzw. powiązania dalekie
przez powiązania bliskie rozumiane są powiązania pomiędzy obiektami, którym odpowiadają w diagramie symbole graficzne reprezentujące najniższe klasy odległości obiektów (np. dwie najniższe klasy)
pozostałe powiązania między obiektami, poza powiązaniami bliskimi, należy traktować jako dalekie
Wskaźnik poprawności grupowania: , (3.4)
gdzie:
n w , n z - liczba powiązań odpowiednio wewnątrz i na zewnątrz wyodrębnionych grup obiektów,
n pb , n pd - liczba powiązań odpowiednio bliskich, wewnątrz grup obiektów i dalekich, na zewnątrz grup obiektów.
(…)
… funkcji kryterium dobroci grupowania, którą stanowi stosunek zróżnicowania międzygrupowego do zróżnicowania wewnątrzgrupowego
miara zróżnicowania międzygrupowego najczęściej jest definiowana jako suma odległości środków ciężkości grup obiektów od środka ciężkości wszystkich badanych obiektów
ocenę zróżnicowania wewnątrzgrupowego stanowi suma odległości wewnątrzgrupowych obiektów od środków ciężkości grup, do którego zostały one sklasyfikowane. Wartość funkcji kryterium może mieć także postać statystyki F stosowanej w analizie wariancji w kolejnym kroku obliczamy środki ciężkości dla poszczególnych grup i klasyfikujemy obiekty do grup na podstawie minimalizacji ich odległości od środków grup
następnie sprawdzamy czy wartość funkcji kryterium nie zwiększyła się
gdy zmiana taka nie nastąpiła kończymy procedurę…
… kryterium dobroci grupowania minimalizuje zróżnicowanie obiektów wewnątrz grup, ze względu na charakteryzujące je zmienne:
, (3.7)
gdzie:
- odległość między środkiem ciężkości r-tej grupy i i-tym obiektem należącym do tej grupy.
Rozwiązanie quasi-optymalne
w punkcie wyjścia procedury wszystkie obiekty stanowią oddzielne grupy
w kolejnych iteracjach łączymy dwie sąsiadujące ze sobą grupy obiektów…
… liczby grup obiektów, które chcemy utworzyć
ustalamy wstępny skład poszczególnych grup:
w sposób losowy
korzystając z ocen ekspertów
poprzez wykorzystanie arbitralnie wybranej zmiennej
przyjmując jako wstępne grupowanie, grupowanie otrzymane za pomocą dowolnej metody taksonomicznej
porządkując obiekty według ich odległości od środka ciężkości poszczególnych grup obiektów. Środkami ciężkości grup…
… syntetycznych, liczymy różnice pomiędzy tymi wartościami dla kolejnych par obiektów:
, i=1,...,n-1. (3.10)
ciąg obiektów dzielimy na ustaloną grupę podciągów (grup obiektów) przerywając go w z-1 miejscach odpowiadających z-1 najwyższym wartościom miary (3.10)
METODA ODCHYLEŃ STANDARDOWYCH
zbiór badanych obiektów jest dzielony na cztery grupy, zawierające obiekty o wartościach zmiennej syntetycznej należącej…
… się w sposób arbitralny
METODA KATOWICKA
na wstępie zakres zmienności każdej ze zmiennych dzieli się na k z góry ustalonych, równych części (klas), co jest to tożsame z podziałem na części zakresu zmienności wartości zmiennych na każdej z półosi współrzędnych, wyznaczających przestrzeń klasyfikacji obiektów
każdy z obiektów otrzymuje swój numer identyfikacyjny składający się z m-elementowego ciągu liczb, którego j…
... zobacz całą notatkę
Komentarze użytkowników (0)