Analisis Diskriminan dengan Software R dan SPSS

1) Analisis Diskriminan

Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data kualitatif dan variabel penjelas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive) berdasarkan sejumlah variabel penjelas. Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:

Sejumlah p variabel penjelas harus berdistribusi normal.
Matriks varians-covarians variabel penjelas berukuran pxp pada kedua kelompok harus sama.

Jika dianalogikan dengan regresi linier, maka analisis diskriminan merupakan kebalikannya. Pada regresi linier, variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. Untuk analisis diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel responnya fixed.

2) Model Analisis Diskriminan

Model dasar analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variable dependen regresi berganda dilambangkan dengan Y, maka dalam analisis diskriminan dilambangkan dengan D. Model dasar analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linear dari berbagai variable independent, yaitu :

D=b0+b1X1+b2X2+b3X3+...+bkXk

Dimana :

D = skor diskriminan

b = koefisien diskriminan atau bobot

X = predictor atau variable independen

Yang diestimasi adalah koefisien "b‟, sehingga nilai "D‟ setiap grup sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (between-group sum of square ) terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan mencapai maksimum. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi.

Merangkum banyak peubah menjadi sebuah indeks atau menjadi sebuah criteria yang terandal akan sangat membantu proses klasifikasi. Namun perlu diingat bahwa kaidah keputusan pengklasifikasian berdasarkan indeks ataupun criteria apapun tidak selalu bisa diharapkan memiliki ketepatan yang sempurna. Artinya, dengan penyusunan indeks atau kriteria ini tetap selalu ada peluang kesalahan klasifikasi. Sewajarnya peluang kesalahan ini yang akan dikendalikan sehingga bisa dibuat sekecil mungkin.

3) Contoh Studi Kasus

Pada tulisan ini ingin dilakukan pengujian dengan analisis diskriminan yang mana ingin diketahui bahwa adakah pengaruh dari sembilan variabel independen terhadap variabel dependen. Dimana, variabel independen yang digunakan adalah tentang data penanaman kacang panjang saat masa tanam 60 hari pada bulan mei, yakni sebagai berikut :

1. Kelembaban udara/Rh (X1)

2. Tekanan udara/P(X2)

3. Curah hujan/R(X3)

4. Penyinaran matahari/Solar(X4)

5. Suhu udara rata-rata/Tmean(X5)

6. Suhu udara minimum/Tmin(X6)

7. Suhu udara maximum/Tmax(X7)

8. Kecepatan angin rata-rata/Winmean(X8)

9. Kecepatan angin terbesar/Winmax(X9)

Sedangkan variabel dependennya adalah produktivitas sayuran yaitu “grup 0” jika produktivitas sayuran rendah atau “grup 1” jika produktivitas sayuran tinggi. Untuk proses analisis digunakan program SPSS sehingga menghasilkan fungsi diskriminan dan kriteria pengelompokkan grup dari sayuran kacang panjang yang ada di kota Makassar.

Data Kacang Panjang Di setiap Bulan Mei dari tahun 1993-2011

Tahun	Variabel Bebas									Observasi
Tahun	X1	X2	X3	X4	X5	X6	X7	X8	X9	Produktivitas
1993	76	1010	44	79	28	24.7	32.3	3	9	0
1994	77	1011	87	75	27.3	24.2	31.6	2	8	0
1995	78	1010	181	67	27.7	25	31.8	3	8	0
1996	78	1011	6	81	27.8	24.4	32.5	4	9	0
1997	77	1011	20	88	28	24.6	32.4	4	9	0
1998	87	1010	87	76	28.6	26	32.7	4	10	0
1999	85	1010	138	61	27.5	24.3	31.7	4	9	0
2000	85	1010	46	95	28	24.9	32.2	4	10	0
2001	82	1009	11	85	28.4	25	32.9	4	9	0
2002	84	1010	87	82	28	24.8	32.1	4	10	0
2003	86	1011	150	81	28	24.9	32.2	3	10	0
2004	86	1010	59	78	28.2	25.2	32.3	2	9	1
2005	74	1011	6	77	28.6	25.4	33.2	3	10	1
2006	81	1011	44	6	28.2	25.3	32.9	2	9	1
2007	76	1011	36	78	28.4	25	33.1	5	10	1
2008	78	1011	62	76	28.1	24.7	32.5	4	9	1
2009	79	1010	50	82	28.5	25.4	32.9	5	11	1
2010	83	1009	144	58	28.5	25.8	32.9	3	14	1
2011	76	1010	161.7	75	28.5	25.1	32.9	4	22	1

4) Langkah Analisis

Membuka program R
Masukkan data dengan cara mencopy data, kemudian mempaste ke dalam program R dengan cara mengetikkan perintah "read.delim("clipboard)" seperti berikut:

abtohi <- read.delim ("clipboard")

Untuk melihat summary data, maka ketikkan summary(abtohi) pada program R. Maka hasilnya sebagai berikut :

Untuk mendeteksi data outlier dapat dilakukan dengan cara mengetikkan perintah library(MVN) kemudian ketikkan outlier <- mvOutlier(abtohi, qqplot = TRUE, method = "quan"). Maka hasilnya seperti gambar berikut:

Berdasarkan gambar di atas, terdapat 5 data outlier, selanjutnya untuk menangani data outlier, cara yang dapat digunakan adalah menghapus baris data yang memuat data outlier dengan cara mengetikkan perintah databaru <- outlier$newData
Kemudian untuk menguji normal multivariat maka ketikkan: normalitas <-roystonTest(databaru, qqplot=FALSE) sehingga setelah hasil dipanggil, hasilnya seperti gambar berikut:

Setelah itu, buka program SPSS
Selanjutnya, buat variabel X1 sampai X9 dan variabel Produktivitas, kemudian masukkan data dengan cara mengetikkan seperti berikut:

Definisikan value pada variabel produktivitas dengan 1 sebagai tinggi dan 0 sebagai rendah.

Pilih menu Analyze->Classify->Discriminant.

Tentukan grouping variable dan independents, kemudian klik define range untuk menentukan batas minimum dan maksimum kelompok, seperti pada gambar berikut :

Klik Statistics dan isikan beri tanda ceklis pada bagian Descriptives, Matrices dan Function Coefficients seperti gambar berikut:

Klik continue, kemudian klik classify dan beri tanda centang pada bagian seperti gambar berikut:

Untuk menyimpan hasil skor diskriminan misalnya, maka dapat digunakan menu save, seperti gambar berikut:

Klik Continue kemudian klik OK

Sekian, pembahasannya menyusul pada postingan berikutnya

Semoga bermanfaat :)

1 comments:

Write comments

Anonymous

AUTHOR

May 7, 2020 at 10:58 AM delete

kenapa pada paket r saya setelah install MVN tidak ada paket mvOutlier seperti milik anda?

:) :( hihi :-) :D =D :-d ;( ;-( @-) :P :o -_- (o) :p :-? (p) :-s (m) 8-) :-t :-b b-( :-# =p~ $-) (y) (f) x-) (k) (h) cheer lol rock angry @@ :ng pin poop :* :v 100

Data Analysis

Analisis Diskriminan dengan Software R dan SPSS

1 comments:

Weekly

Data Analysis

Analisis Diskriminan dengan Software R dan SPSS

Artikel Menarik Lainnya

1 comments:

Weekly