[Pembahasan] Analisis Diskriminan dengan Software R dan SPSS

Pada postingan ini saya akan menjelaskan hasil (output) pada analisis diskriminan untuk mengetahui adakah pengaruh dari sembilan variabel independen terhadap variabel dependen. Dimana, variabel independen yang digunakan pada penelitian analisis diskriminan adalah variabel pada kasus penanaman kacang panjang, dengan variabel dependennya adalah produktivitas kacang panjang. Software analisis yang digunakan adalah software R dan SPSS. 
Dalam analisis diskriminan, terdapat beberapa asumsi diantaranya adalah asumsi normalitas multivariat dan asumsi homoskedastisitas. Adapun hasil dari uji normal multivariat dapat dilihat pada gambar berikut:

Gambar 1

1)  Hipotesis
     H0 : Data berdistribusi normal multivariat
     H1 : Data tidak berdistribusi normal 
2)   Tingkat signifikasi
     Î± = 5 %
3)  Daerah kritis
     P-Value < 0,05 maka tolak H0
4)  Statistik Uji
     0,000 < 0,05 (P-Value < α)
5)  Keputusan
     Karena P-Value (0,00) < 0,05 maka tolak H0
6)  Kesimpulan
     Dengan menggunakan tingkat signifikansi 5%, keputusan uji menolak H0 
     yang berarti data tidak berdistribusi normal multivariat.

Adapun hasil pengujian asumsi homoskedastisitas dapat dilihat pada gambar berikut:
Gambar 2
1)  Hipotesis
     H0 : Homoskedastisitas
     H1 : Heteroskedastisitas
2)  Tingkat signifikasi
     Î± = 5 %
3)  Daerah kritis
     P-Value < 0,05 maka tolak H0
4)  Statistik Uji
     0,394 > 0,05 (P-Value > α)
5)  Keputusan
     Karena P-Value (0,394) > 0,05 maka gagal tolak H0
6)  Kesimpulan
     Dengan menggunakan tingkat signifikansi 5%, keputusan uji gagal menolak 
     H0 yang berarti data yang digunakan bersifat homoskedastisitas.

Setelah dilakukan pengujian homoskedastisitas, selanjutnya adalah melihat variabel yang signifikan. Adapun output yang digunakan adalah sebagai berikut:
Gambar 3

Berdasarkan diatas, terlihat bahwa hanya terdapat satu variabel yang masuk dalam model diskriminan, yakni variabel X7 (Suhu udara maksimum). Setelah mengetahui variabel yang signifikan terhadap model, selanjutnya adalah menentukan canonical discriminant dengan cara melihat output eigenvalue seperti berikut :

Gambar 4

Gambar 4 menggambarkan bahwa Canonical Correlation (CC)=0.662, artinya bahwa hubungan antara variabel diskriminan dengan variabel independen secara multivariat sebesar 0.662 atau besarnya (CC)2= (0.662)2=0.4382. Jadi dapat disimpulkan bahwa 43,82% variasi antara produktivitas kacang panjang tinggi dan produktivitas kacang panjang rendah yang dapat dijelaskan oleh variabel diskriminan (Kelembaban udara/Rh (X1), Tekanan udara/P(X2), Curah hujan/R(X3), Penyinaran matahari/Solar(X4), Suhu udara rata-rata/Tmean(X5), Suhu udara minimum/Tmin(X6¬), Suhu udara maximum/Tmax(X7), Kecepatan angin rata-rata/Winmean(X8), dan Kecepatan angin terbesar/Winmax(X9)).

Setelah dilakukan pengujian Canonical Discriminant, selanjutnya adalah melakukan pengujian ANOVA untuk mengetahui perbedaan rata-rata skor diskriminan, adapun output ANOVA dapat dilihat pada output wilk’s lambda sebagai berikut:

Gambar 5
1)  Hipotesis
     H0 :µ1 = µ2 (Tidak terdapat perbedaan rata-rata skor diskriminan                          antar produktivitas secara multivariat)
     H1 : µ1 ≠ µ2 (Terdapat perbedaan rata-rata skor diskriminan antar 
                 produktivitas secara multivariat)
2)  Tingkat signifikasi
     Î± = 5 %
3)  Daerah kritis
     P-Value < 0,05 maka tolak H0
4)  Statistik Uji
     0,002 < 0,05 (P-Value < α)
5)  Keputusan
     Karena P-Value (0,002) > 0,05 maka tolak H0
6)  Kesimpulan
     Dengan menggunakan tingkat signifikansi 5%, keputusan uji menolak H0  
     yang berarti terdapat perbedaan rata-rata skor diskriminan antar 
     produktivitas secara multivariat.

Kemudian, penentuan model diskriminan dapat dilihat pada output Canonical Discriminant Function Coefficients, yakni sebagai berikut:

Gambar 6

Berdasarkan Gambar 6, variabel diskriminan dapat membentuk satu fungsi diskriminan kanonik (belum distandarkan) sebagai berikut :

W=-88,782+2,734X7

Keterangan : 
X7 = Suhu udara maksimum

Gambar 7

Berdasarkan Gambar 7, nilai centroid untuk Produktivitas kacang panjang rendah (0) adalah sebesar -0,713, dan nilai centroid untuk produktivitas tinggi adalah sebesar 0,980. Centroid digunakan untuk mengklasifikasi ulang observasi ke dalam kelompok. Klasifikasi dilakukan berdasarkan kedekatan dengan centroid.  

Setelah diperoleh modelnya dan diketahui centroid-nya, langkah selanjutnya adalah menentukan hasil klasifikasinya.adapun output hasil klasifikasi dapat dilihat pada gambar berikut:

Gambar 8

Berdasarkan Gambar 8, apabila tidak menggunakan cross-validation (original) maka ketepatan pengelompokan mencapai 100%. Demikian juga jika menggunakan cross-validation. Angka tersebut menggambarkan bahwa fungsi diskriminan yang dihasilkan dapat digunakan untuk mengestimasi dan mengklasifikasikan suatu serigala baru.

Demikian

Terimakasih

Semoga bermanfaat, have fun :)

Previous
Next Post »


:) :( hihi :-) :D =D :-d ;( ;-( @-) :P :o -_- (o) :p :-? (p) :-s (m) 8-) :-t :-b b-( :-# =p~ $-) (y) (f) x-) (k) (h) cheer lol rock angry @@ :ng pin poop :* :v 100

Weekly