Selamat datang di blog analisis data, kali ini saya akan
memberikan contoh dan pembahasan penggunaan Uji Mann-Whitney, dimana pada
postingan sebelumnya, saya telah menjelaskan secara detail teori Uji
Mann-Whitney. Ada dua macam contoh yang akan dibahas, yakni penggunaan Uji
Mann-Whitney pada sampel kecil (n1 atau n2 ≤ 20), dan pada sampel besar (n1 atau n2
> 20), dimana antara antara kelompok sampel 1 dan
kelompok sampel 2 saling independen.
Contoh kasus sampel
kecil (n1 atau n2 ≤ 20)
Berikut adalah contoh sampel data nilai ulangan Matematika
pada kelas A dan kelas B.
Kelas A
|
Kelas B
|
64
|
62
|
100
|
58
|
87
|
81
|
96
|
75
|
91
|
95
|
64
|
82
|
91
|
75
|
91
|
73
|
99
|
|
75
|
Berdasarkan data pada tabel diatas, tim analisis data ingin
melakukan pengujian apakah terdapat perbedaan nilai yang signifikan antara
kelas A dan kelas B. Dalam kasus ini, tim analisis menggunakan taraf
signifikansi sebesar 5% (α = 0,05).
Pembahasan
Melakukan
penyusunan Hipotesis
H0 : Nilai ulangan kelas A
sama dengan nilai ulangan kelas B
H1 : Nilai ulangan kelas A
berbeda dengan nilai ulangan kelas B
Nilai
|
Kelas
|
Nilai
|
Kelas
|
|
64
|
Kelas A
|
58
|
Kelas B
|
|
100
|
Kelas A
|
62
|
Kelas B
|
|
87
|
Kelas A
|
64
|
Kelas A
|
|
96
|
Kelas A
|
64
|
Kelas A
|
|
91
|
Kelas A
|
73
|
Kelas B
|
|
64
|
Kelas A
|
75
|
Kelas A
|
|
91
|
Kelas A
|
75
|
Kelas B
|
|
91
|
Kelas A
|
>>
|
75
|
Kelas B
|
99
|
Kelas A
|
81
|
Kelas B
|
|
75
|
Kelas A
|
82
|
Kelas B
|
|
62
|
Kelas B
|
87
|
Kelas A
|
|
58
|
Kelas B
|
91
|
Kelas A
|
|
81
|
Kelas B
|
91
|
Kelas A
|
|
75
|
Kelas B
|
91
|
Kelas A
|
|
95
|
Kelas B
|
95
|
Kelas B
|
|
82
|
Kelas B
|
96
|
Kelas A
|
|
75
|
Kelas B
|
99
|
Kelas A
|
|
73
|
Kelas B
|
100
|
Kelas A
|
Nilai
|
Kelas
|
Ranking
|
58
|
Kelas B
|
1
|
62
|
Kelas B
|
2
|
64
|
Kelas A
|
(2+3)/2=2,5
|
64
|
Kelas A
|
(2+3)/2=2,5
|
73
|
Kelas B
|
5
|
75
|
Kelas A
|
(6+7+8)/3=7
|
75
|
Kelas B
|
(6+7+8)/3=7
|
75
|
Kelas B
|
(6+7+8)/3=7
|
81
|
Kelas B
|
9
|
82
|
Kelas B
|
10
|
87
|
Kelas A
|
11
|
91
|
Kelas A
|
(12+13+14)/3=13
|
91
|
Kelas A
|
(12+13+14)/3=13
|
91
|
Kelas A
|
(12+13+14)/3=13
|
95
|
Kelas B
|
15
|
96
|
Kelas A
|
16
|
99
|
Kelas A
|
17
|
100
|
Kelas A
|
18
|
Memberikan ranking pada masing-masing nilai (note : perhitungan
ranking pada nilai yang sama dilakukan dengan cara menghitung rata-rata
rankingnya)
Kelas A
|
Ranking
|
Kelas B
|
Ranking
|
64
|
2,5
|
58
|
1
|
64
|
2,5
|
62
|
2
|
75
|
7
|
73
|
5
|
87
|
11
|
75
|
7
|
91
|
13
|
75
|
7
|
91
|
13
|
81
|
9
|
91
|
13
|
82
|
10
|
96
|
16
|
95
|
15
|
99
|
17
|
||
100
|
18
|
||
Jumlah
|
113
|
56
|
Setelah diperoleh nilai statistik Uji U,
kemudian pilih nilai terkecil dari kedua nilai U1 dan U2.
Dari kedua nilai tersebut diketahui nilai 22 lebih kecil dari 60, sehingga
dipilih nilai 22 untuk dibandingkan dengan nilai pada U tabel. Berikut lampiran
U tabel :
Berdasarkan tabel U, untuk sampel n1
= 10, n2 = 8 dengan α = 0,05,
diperoleh nilai U tabel sebesar 17, dimana nilai tersebut lebih kecil
daripada nilai U terpilih, yakni 22 (U hitung > U tabel).
Adapun
daerah kritis (kriteria penolakan H0) adalah :
- H0
diterima apabila U hitung > U tabel (α; n1, n2)
- H0
ditolak apabila U hitung ≤ U tabel (α; n1, n2)
Sehingga berdasarkan kriteria diatas,
maka keputusannya H0 diterima, artinya nilai ulangan kelas A sama
dengan nilai ulangan kelas B.
Proses perhitungan menggunakan R
Diperoleh nilai p-value sebesar 0.08173, yakni lebih besar dari
nilai α = 0,05, sehingga H0 diterima, artinya nilai ulangan
kelas A sama dengan nilai ulangan kelas B.
Contoh kasus sampel
kecil (n1 atau n2 > 20)
Berikut adalah contoh sampel data rata-rata durasi seseorang
membuka/menggunakan akun instagram dalam
satu hari yang diamati pada 24 orang laki-laki dan 24 orang perempuan yang
dinyatakan dalam menit.
Laki-laki
|
Perempuan
|
Laki-laki
|
Perempuan
|
8,3
|
46,3
|
6,7
|
4,5
|
31,4
|
46
|
21,3
|
49,8
|
33,1
|
51,2
|
25
|
54,7
|
7
|
39,5
|
8
|
11
|
15,3
|
57,3
|
12,4
|
52
|
44,2
|
26,3
|
20,2
|
23,4
|
32,3
|
43,2
|
7,3
|
22,4
|
7,2
|
18,2
|
27,1
|
10,8
|
8,9
|
20,3
|
27
|
17,2
|
20,1
|
34,5
|
19
|
39
|
22,3
|
4,2
|
35,4
|
50,3
|
14,5
|
12,3
|
42
|
34,7
|
Berdasarkan sampel data diatas, akan dilakukan pengamatan
untuk mengetahui apakah terdapat perbedaan rata-rata durasi penggunaan instagram
antara laki-laki dan perempuan.
Pembahasan
Sama halnya dengan pembahasan pada sampel data kecil,
mula-mula dilakukan penggabungan data, sorting, ranking dan menjumlahkan
ranking dari masing-masing kelompok data, sehingga diperoleh hasil seperti
tabel berikut:
Laki Laki
|
Ranking
|
Perempuan
|
Ranking
|
6,7
|
3
|
4,2
|
1
|
7
|
4
|
4,5
|
2
|
7,2
|
5
|
10,8
|
10
|
7,3
|
6
|
11
|
11
|
8
|
7
|
12,3
|
12
|
8,3
|
8
|
17,2
|
16
|
8,9
|
9
|
18,2
|
17
|
12,4
|
13
|
20,3
|
21
|
14,5
|
14
|
22,4
|
24
|
15,3
|
15
|
23,4
|
25
|
19
|
18
|
26,3
|
27
|
20,1
|
19
|
34,5
|
33
|
20,2
|
20
|
34,7
|
34
|
21,3
|
22
|
39
|
36
|
22,3
|
23
|
39,5
|
37
|
25
|
26
|
43,2
|
39
|
27
|
28
|
46
|
41
|
27,1
|
29
|
46,3
|
42
|
31,4
|
30
|
49,8
|
43
|
32,3
|
31
|
50,3
|
44
|
33,1
|
32
|
51,2
|
45
|
35,4
|
35
|
52
|
46
|
42
|
38
|
54,7
|
47
|
44,2
|
40
|
57,3
|
48
|
Jumlah
|
475
|
701
|
Hipotesis
H0 :
Rata-rata durasi penggunaan instagram laki-laki dan perempuan sama
H1: Rata-rata durasi penggunaan instagram laki-laki
dan perempuan berbeda
Menghitung Statistik Uji
Dalam kasus ini (sampel > 20), proses perhitungan statistik
uji tidak menggunakan perbandingan nilai U dengan nilai U Tabel Mann Whitney,
melainkan menggunakan perbandingan dengan tabel Z karena distribusinya
mendekati normal. Hal pertama yang dilakukan adalah sama seperti sebelumnya,
yakni mencari nilai U1 dan nilai U2:
Setelah diperoleh nilai
U1 dan U2, diperoleh nilai U terkecil yakni 175. Kemudian
dilakukan perhitungan nilai Z seperti berikut:
Sedangkan apabila dimasukkan
nilai U1 (401) maka akan diperoleh kebalikannya yakni 2,33002. Dari
kedua nilai Z tersebut, maka yang diambil adalah yang bernilai positif, yakni
2,33002 kemudian dibandingkan dengan nilai pada Z tabel uji dua arah, dengan
menggunakan α = 0,05, dan diperoleh nilai Z sebesar 1,96.
Kesimpulan
Berdasarkan hasil
perbandingan nilai Z hitung dengan Z tabel, diketahui bahwa nilai Z hitung
lebih besar dari Z tabel, yakni 2,33002 > 1,96, sehingga kesimpulannya H0
ditolak, yang artinya terdapat perbedaan rata-rata durasi penggunaan instagram
antara laki-laki dan perempuan.
Hasil perhitungan
menggunakan R
Berdasarkan hasil perhitungan menggunakan R diperoleh nilai
p-value sebesar 0,01937, yakni lebih kecil dari nilai α = 0,05, yang artinya H0
ditolak, yakni terdapat perbedaan rata-rata durasi penggunaan instagram antara
laki-laki dan perempuan.
:) :( hihi :-) :D =D :-d ;( ;-( @-) :P :o -_- (o) :p :-? (p) :-s (m) 8-) :-t :-b b-( :-# =p~ $-) (y) (f) x-) (k) (h) cheer lol rock angry @@ :ng pin poop :* :v 100