Analiza danych - Notatek.pl

To tylko jedna z 11 stron tej notatki. Zaloguj się aby zobaczyć ten dokument. Zobacz całą notatkę

Podgląd dokumentu

Fragment notatki:

Projekt - analiza czynnikowa. Składa się z 9 stron. Poruszone zagadnienia to m.in: wyodrębnienie czynników mających decydujący wpływ na poziom rozwoju gospodarczego Polski oraz porównanie województw pod względem tych czynników, dokonanie selekcji zmiennych wykorzystując procedurę KMO_MSA.r, określenie liczby czynników wspólnych wykorzystując procedurę analiza_czynnikowa.r, metody wyodrębniania czynników wspólnych, rotacja ortogonalna varimax, zastosowanie funkcji plot w celu przedstawienia graficznego badanych obiektów (województw) w przestrzeni określonego czynnika.

PROJEKT - ANALIZA CZYNNIKOWA
Celem badania jest wyodrębnienie czynników mających decydujący wpływ na poziom rozwoju gospodarczego Polski oraz porównanie województw pod względem tych czynników.
Dane przekrojowe wg województw w 2007 roku:
X1 - PKB w mln zł,
X2 - nakłady inwestycyjne ogółem na 1 mieszkańca w zł,
X3 - wartość brutto środków trwałych na 1 mieszkańca w zł,
X4 - nakłady na działalność badawczo- rozwojową na 1 mieszkańca w zł,
X5 - produkcja sprzedana przemysłu na 1 mieszkańca w zł,
X6 - plony zbóż podstawowych z 1 ha w dt.
X7 - przeciętne zatrudnienie w przemyśle na 1000 osób.
Źródło: Rocznik statystyczny województw 2008
dane statystyczne zostały wprowadzono do programu EXCEL w następującym układzie: Plik dane
dane zapisano w formacie csv
Wykorzystanie programu R do obliczeń:
Dokonanie selekcji zmiennych wykorzystując procedurę KMO_MSA.r
[1] KMO - wskaźnik Kaisera-Meyera-Olkina: 0,6952 [1] MSA
x1 x2 x3 x4 x5 x6 x7
[1,] 0,68791 0,84343 0,69979 0,66684 0,71556 0,22538 0,667
Zmienna x6 ma wartość MSA zdecydowanie mniejszą od 0,5 zatem zostanie usunięta z badań. Zbiór danych po selekcji zmiennych został zapisany w nowym pliku dane1.csv. Ponownie przeliczono KMO (procedura KMO_MSA_dane1.r) dla danych bez tej zmiennej (zbiór danych dane1.csv) jego wartość wynosi 0,71983, czyli jest zadowalająca.
Określenie liczby czynników wspólnych wykorzystując procedurę analiza_czynnikowa.r: - kryterium wartości własnej (funkcja nScree dostępna w pakiecie nFactors) - kryterium wyjaśnionej wariancji (funkcja nScree dostępna w pakiecie nFactors)
[1] wyznacz wartości własne macierzy korelacji i wariancję wyjaśnioną przez czynniki
Eigenvalues Prop Cumu Par.Analysis Pred.eig OC Acc.factor
1 4,84224987 0,807041645 0,8070416 1 0,74551460(< OC NA (< AF)
2 0,59888121 0,099813535 0,9068552 1 0,47152556 4,0012185
3 0,35673108 0,059455180 0,9663104 1 0,21515980 0,0329748
4 0,14755575 0,024592624 0,9909030 1 0,07212125 0,1038540
5 0,04223445 0,007039074 0,9979421 1 NA 0,0754345
6 0,01234765 0,002057941 1,0000000 1 NA NA
W kolumnie Eigenvalues znajdują się wartości własne (jedna wartość jest większa od 1). W kolumnie Cumu znajduje się skumulowany procent wyjaśnionej wariancji dla kolejnego czynnika (w zaokrągleniu jeden czynnik wyjaśnia 81% wariancji wszystkich zmiennych).
- wykres osypiska (funkcja plotuScree dostępna w pakiecie

(…)

… 0,995
x2 0,921
x3 0,773
x4 0,842
x5 0,894
x7 0,828
PA1
SS loadings 4,630
Proportion Var 0,772
Test of the hypothesis that 1 factor is sufficient.
The chi square statistic is 36,11 on 9 degrees of freedom.
The p-value is 3,79e-05
Istotne ładunki czynnikowe (większe co do wartości bezwzględnej od 0,6) podkreślono.
- metodę największej wiarygodności (funkcja factanal) bez rotacji
[1] przeprowadź analizę…
... zobacz całą notatkę

Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz