1) Analisis Diskriminan
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive) berdasarkan sejumlah variabel penjelas. Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:
- Sejumlah p variabel penjelas harus berdistribusi normal.
- Matriks varians-covarians variabel penjelas berukuran pxp pada kedua kelompok harus sama.
Jika dianalogikan dengan regresi linier, maka analisis diskriminan merupakan kebalikannya. Pada regresi linier, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. Untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel responnya fixed.
2) Model Analisis Diskriminan
Model dasar analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variable dependen regresi berganda dilambangkan dengan Y, maka dalam analisis diskriminan dilambangkan dengan D. Model dasar analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linear dari berbagai variable independent, yaitu :
D=b0+b1X1+b2X2+b3X3+...+bkXk
Dimana :
D = skor diskriminan
b = koefisien diskriminan atau bobot
X = predictor atau variable independen
Yang diestimasi adalah koefisien "b‟, sehingga nilai "D‟ setiap grup sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (between-group sum of square ) terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan mencapai maksimum. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi.
Merangkum banyak peubah menjadi sebuah indeks atau menjadi sebuah criteria yang terandal akan sangat membantu proses klasifikasi. Namun perlu diingat bahwa kaidah keputusan pengklasifikasian berdasarkan indeks ataupun criteria apapun tidak selalu bisa diharapkan memiliki ketepatan yang sempurna. Artinya, dengan penyusunan indeks atau kriteria ini tetap selalu ada peluang kesalahan klasifikasi. Sewajarnya peluang kesalahan ini yang akan dikendalikan sehingga bisa dibuat sekecil mungkin.
3) Contoh Studi Kasus
Pada tulisan ini ingin dilakukan pengujian dengan analisis diskriminan yang mana ingin diketahui bahwa adakah pengaruh dari sembilan variabel independen terhadap variabel dependen. Dimana, variabel independen yang digunakan adalah tentang data penanaman kacang panjang saat masa tanam 60 hari pada bulan mei, yakni sebagai berikut :
1. Kelembaban udara/Rh (X1)
2. Tekanan udara/P(X2)
3. Curah hujan/R(X3)
4. Penyinaran matahari/Solar(X4)
5. Suhu udara rata-rata/Tmean(X5)
6. Suhu udara minimum/Tmin(X6)
7. Suhu udara maximum/Tmax(X7)
8. Kecepatan angin rata-rata/Winmean(X8)
9. Kecepatan angin terbesar/Winmax(X9)
Sedangkan variabel dependennya adalah produktivitas sayuran yaitu “grup 0” jika produktivitas sayuran rendah atau “grup 1” jika produktivitas sayuran tinggi. Untuk proses analisis digunakan program SPSS sehingga menghasilkan fungsi diskriminan dan kriteria pengelompokkan grup dari sayuran kacang panjang yang ada di kota Makassar.
Data Kacang Panjang Di setiap Bulan Mei dari tahun 1993-2011
Tahun
|
Variabel Bebas
|
Observasi
|
||||||||
X1
|
X2
|
X3
|
X4
|
X5
|
X6
|
X7
|
X8
|
X9
|
Produktivitas
|
|
1993
|
76
|
1010
|
44
|
79
|
28
|
24.7
|
32.3
|
3
|
9
|
0
|
1994
|
77
|
1011
|
87
|
75
|
27.3
|
24.2
|
31.6
|
2
|
8
|
0
|
1995
|
78
|
1010
|
181
|
67
|
27.7
|
25
|
31.8
|
3
|
8
|
0
|
1996
|
78
|
1011
|
6
|
81
|
27.8
|
24.4
|
32.5
|
4
|
9
|
0
|
1997
|
77
|
1011
|
20
|
88
|
28
|
24.6
|
32.4
|
4
|
9
|
0
|
1998
|
87
|
1010
|
87
|
76
|
28.6
|
26
|
32.7
|
4
|
10
|
0
|
1999
|
85
|
1010
|
138
|
61
|
27.5
|
24.3
|
31.7
|
4
|
9
|
0
|
2000
|
85
|
1010
|
46
|
95
|
28
|
24.9
|
32.2
|
4
|
10
|
0
|
2001
|
82
|
1009
|
11
|
85
|
28.4
|
25
|
32.9
|
4
|
9
|
0
|
2002
|
84
|
1010
|
87
|
82
|
28
|
24.8
|
32.1
|
4
|
10
|
0
|
2003
|
86
|
1011
|
150
|
81
|
28
|
24.9
|
32.2
|
3
|
10
|
0
|
2004
|
86
|
1010
|
59
|
78
|
28.2
|
25.2
|
32.3
|
2
|
9
|
1
|
2005
|
74
|
1011
|
6
|
77
|
28.6
|
25.4
|
33.2
|
3
|
10
|
1
|
2006
|
81
|
1011
|
44
|
6
|
28.2
|
25.3
|
32.9
|
2
|
9
|
1
|
2007
|
76
|
1011
|
36
|
78
|
28.4
|
25
|
33.1
|
5
|
10
|
1
|
2008
|
78
|
1011
|
62
|
76
|
28.1
|
24.7
|
32.5
|
4
|
9
|
1
|
2009
|
79
|
1010
|
50
|
82
|
28.5
|
25.4
|
32.9
|
5
|
11
|
1
|
2010
|
83
|
1009
|
144
|
58
|
28.5
|
25.8
|
32.9
|
3
|
14
|
1
|
2011
|
76
|
1010
|
161.7
|
75
|
28.5
|
25.1
|
32.9
|
4
|
22
|
1
|
4) Langkah Analisis
- Membuka program R
- Masukkan data dengan cara mencopy data, kemudian mempaste ke dalam program R dengan cara mengetikkan perintah "read.delim("clipboard)" seperti berikut:
abtohi <- read.delim ("clipboard")
- Untuk melihat summary data, maka ketikkan summary(abtohi) pada program R. Maka hasilnya sebagai berikut :
- Untuk mendeteksi data outlier dapat dilakukan dengan cara mengetikkan perintah library(MVN) kemudian ketikkan outlier <- mvOutlier(abtohi, qqplot = TRUE, method = "quan"). Maka hasilnya seperti gambar berikut:
- Berdasarkan gambar di atas, terdapat 5 data outlier, selanjutnya untuk menangani data outlier, cara yang dapat digunakan adalah menghapus baris data yang memuat data outlier dengan cara mengetikkan perintah databaru <- outlier$newData
- Kemudian untuk menguji normal multivariat maka ketikkan: normalitas <-roystonTest(databaru, qqplot=FALSE) sehingga setelah hasil dipanggil, hasilnya seperti gambar berikut:
- Setelah itu, buka program SPSS
- Selanjutnya, buat variabel X1 sampai X9 dan variabel Produktivitas, kemudian masukkan data dengan cara mengetikkan seperti berikut:
- Definisikan value pada variabel produktivitas dengan 1 sebagai tinggi dan 0 sebagai rendah.
- Pilih menu Analyze->Classify->Discriminant.
- Tentukan grouping variable dan independents, kemudian klik define range untuk menentukan batas minimum dan maksimum kelompok, seperti pada gambar berikut :
- Klik Statistics dan isikan beri tanda ceklis pada bagian Descriptives, Matrices dan Function Coefficients seperti gambar berikut:
- Untuk menyimpan hasil skor diskriminan misalnya, maka dapat digunakan menu save, seperti gambar berikut:
- Klik Continue kemudian klik OK
Sekian, pembahasannya menyusul pada postingan berikutnya
Semoga bermanfaat :)
1 comments:
Write commentskenapa pada paket r saya setelah install MVN tidak ada paket mvOutlier seperti milik anda?
Reply:) :( hihi :-) :D =D :-d ;( ;-( @-) :P :o -_- (o) :p :-? (p) :-s (m) 8-) :-t :-b b-( :-# =p~ $-) (y) (f) x-) (k) (h) cheer lol rock angry @@ :ng pin poop :* :v 100