Analisis Diskriminan dengan Software R dan SPSS

1) Analisis Diskriminan

Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive) berdasarkan sejumlah variabel penjelas. Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:

  • Sejumlah p variabel penjelas harus berdistribusi normal. 
  • Matriks varians-covarians variabel penjelas berukuran pxp pada kedua kelompok harus sama
Jika dianalogikan dengan regresi linier, maka analisis diskriminan merupakan kebalikannya. Pada regresi linier, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. Untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel responnya fixed. 

2) Model Analisis Diskriminan

Model dasar analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variable dependen regresi berganda dilambangkan dengan Y, maka dalam analisis diskriminan dilambangkan dengan D. Model dasar analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linear dari berbagai variable independent, yaitu : 

D=b0+b1X1+b2X2+b3X3+...+bkXk

Dimana : 
D = skor diskriminan 
b = koefisien diskriminan atau bobot 
X = predictor atau variable independen 

Yang diestimasi adalah koefisien "b‟, sehingga nilai "D‟ setiap grup sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (between-group sum of square ) terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan mencapai maksimum. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi.

Merangkum banyak peubah menjadi sebuah indeks atau menjadi sebuah criteria yang terandal akan sangat membantu proses klasifikasi. Namun perlu diingat bahwa kaidah keputusan pengklasifikasian berdasarkan indeks ataupun criteria apapun tidak selalu bisa diharapkan memiliki ketepatan yang sempurna. Artinya, dengan penyusunan indeks atau kriteria ini tetap selalu ada peluang kesalahan klasifikasi. Sewajarnya peluang kesalahan ini yang akan dikendalikan sehingga bisa dibuat sekecil mungkin.

3) Contoh Studi Kasus

Pada tulisan ini ingin dilakukan pengujian dengan analisis diskriminan yang mana ingin diketahui bahwa adakah pengaruh dari sembilan variabel independen terhadap variabel dependen. Dimana, variabel independen yang digunakan adalah tentang data penanaman kacang panjang saat masa tanam 60 hari pada bulan mei, yakni sebagai berikut : 

1. Kelembaban udara/Rh (X1)
2. Tekanan udara/P(X2)
3. Curah hujan/R(X3)
4. Penyinaran matahari/Solar(X4)
5. Suhu udara rata-rata/Tmean(X5)
6. Suhu udara minimum/Tmin(X6)
7. Suhu udara maximum/Tmax(X7)
8. Kecepatan angin rata-rata/Winmean(X8)
9. Kecepatan angin terbesar/Winmax(X9)

Sedangkan variabel dependennya adalah produktivitas sayuran yaitu “grup 0” jika produktivitas sayuran rendah atau “grup 1” jika produktivitas sayuran tinggi. Untuk proses analisis digunakan program SPSS sehingga menghasilkan fungsi diskriminan dan kriteria pengelompokkan grup dari sayuran kacang panjang yang ada di kota Makassar.

Data Kacang Panjang Di setiap Bulan Mei dari tahun 1993-2011

Tahun
Variabel Bebas
Observasi
X1
X2
X3
X4
X5
X6
X7
X8
X9
Produktivitas
1993
76
1010
44
79
28
24.7
32.3
3
9
0
1994
77
1011
87
75
27.3
24.2
31.6
2
8
0
1995
78
1010
181
67
27.7
25
31.8
3
8
0
1996
78
1011
6
81
27.8
24.4
32.5
4
9
0
1997
77
1011
20
88
28
24.6
32.4
4
9
0
1998
87
1010
87
76
28.6
26
32.7
4
10
0
1999
85
1010
138
61
27.5
24.3
31.7
4
9
0
2000
85
1010
46
95
28
24.9
32.2
4
10
0
2001
82
1009
11
85
28.4
25
32.9
4
9
0
2002
84
1010
87
82
28
24.8
32.1
4
10
0
2003
86
1011
150
81
28
24.9
32.2
3
10
0
2004
86
1010
59
78
28.2
25.2
32.3
2
9
1
2005
74
1011
6
77
28.6
25.4
33.2
3
10
1
2006
81
1011
44
6
28.2
25.3
32.9
2
9
1
2007
76
1011
36
78
28.4
25
33.1
5
10
1
2008
78
1011
62
76
28.1
24.7
32.5
4
9
1
2009
79
1010
50
82
28.5
25.4
32.9
5
11
1
2010
83
1009
144
58
28.5
25.8
32.9
3
14
1
2011
76
1010
161.7
75
28.5
25.1
32.9
4
22
1
4) Langkah Analisis
  • Membuka program R
  • Masukkan data dengan cara mencopy data, kemudian mempaste ke dalam program R dengan cara mengetikkan perintah "read.delim("clipboard)" seperti berikut:
abtohi <- read.delim ("clipboard")
  • Untuk melihat summary data, maka ketikkan  summary(abtohi) pada program R. Maka hasilnya sebagai berikut :
  • Untuk mendeteksi data outlier dapat dilakukan dengan cara mengetikkan perintah library(MVN) kemudian ketikkan outlier <- mvOutlier(abtohi, qqplot = TRUE, method = "quan").  Maka hasilnya seperti gambar berikut:
  • Berdasarkan gambar di atas, terdapat 5 data outlier, selanjutnya untuk menangani data outlier, cara yang dapat digunakan adalah menghapus baris data yang memuat data outlier dengan cara mengetikkan  perintah databaru <- outlier$newData
  • Kemudian untuk menguji normal multivariat maka ketikkan: normalitas <-roystonTest(databaru, qqplot=FALSE) sehingga setelah hasil dipanggil, hasilnya seperti gambar berikut:
  • Setelah itu, buka program SPSS
  • Selanjutnya, buat variabel X1 sampai X9 dan variabel Produktivitas, kemudian masukkan data dengan cara mengetikkan seperti berikut:


  • Definisikan value pada variabel produktivitas dengan 1 sebagai tinggi dan 0 sebagai rendah.
  • Pilih menu Analyze->Classify->Discriminant.
  • Tentukan grouping variable dan independents, kemudian klik define range untuk menentukan batas minimum dan maksimum kelompok, seperti pada gambar berikut :
  • Klik Statistics dan isikan beri tanda ceklis pada bagian Descriptives, Matrices dan Function Coefficients seperti gambar berikut:
  • Klik continue, kemudian klik classify dan beri tanda centang pada bagian seperti gambar berikut:
  • Untuk menyimpan hasil skor diskriminan misalnya, maka dapat digunakan menu save, seperti gambar berikut:
  • Klik Continue kemudian klik OK

Sekian, pembahasannya menyusul pada postingan berikutnya

Semoga bermanfaat :)
Previous
Next Post »

1 comments:

Write comments
Anonymous
AUTHOR
May 7, 2020 at 10:58 AM delete

kenapa pada paket r saya setelah install MVN tidak ada paket mvOutlier seperti milik anda?

Reply
avatar


:) :( hihi :-) :D =D :-d ;( ;-( @-) :P :o -_- (o) :p :-? (p) :-s (m) 8-) :-t :-b b-( :-# =p~ $-) (y) (f) x-) (k) (h) cheer lol rock angry @@ :ng pin poop :* :v 100

Weekly