Analisis Diskriminan Ganda

PADA analisis diskriminan ganda (multiple discriminant analysis), grup yang dimiliki tidak lagi dua, akan tetapi tiga, empat, atau lebih grup.  Kalau diaplikasikan pada dua grup, maka persamaan diskriminan yang dibentuk hanya ada satu.  Sedangkan kalau kita memiliki tiga atau lebih grup, maka persamaan diskriminan yang dibentuk adalah jumlah grup itu dikurang satu.  Jadi, kalau grup ada tiga grup sebagai variabel dependen, maka persamaan diskriminan yang dibentuk adalah dua, kalau grup ada lima, persamaan diskriminan ada empat, demikian seterusnya.

Apa yang dilakukan pada analisis diskriminan berganda, sama saja dengan yang dilakukan pada analisis disriminan dua grup.  Perbedaannya, selain  jumlah fungsi diskriminan, juga menyangkut cara memprediksi grup sebuah kasus atau seorang responden.

Kasus 6. Penjelasan selanjutnya tentang konsep ini dilakukan dengan memakai contoh berikut. Seorang peneliti tertarik untuk mengetahui faktor-faktor apa yang mempengaruhi pilihan orang untuk berlibur. Dia mengamati bahwa pada masa liburan anak sekolah, tujuan berlibur ada tiga, yaitu: (1) di dalam kota, (2) ke luar kota, (3) ke luar pulau.

Variabel-variabel independen yang dipakai sebagai prediktor adalah pendapatan keluarga (X1), sikap tentang pentingnya liburan untuk anak (X2), sikap terhadap perjalanan (X3), jumlah anak (X4) rata-rata usia anak (X5) dan  asal kepala keluarga (X6).

Tabel 6.5.  Tujuan Berlibur dan Faktor-faktor Yang Mempengaruhi

RESP X1 X2 X3 X4 X5 X6 Tujuan  Berlibur
1 47.1 2 5 3 14 1 1
2 69.1 7 6 3 12 2 3
3 42.3 3 3 2 11 1 1
4 57 8 3 2 7 2 2
5 75 8 7 4 15 3 3
6 43.2 2 5 2 16 2 2
7 56.2 1 8 4 14 1 2
8 37.3 2 7 4 14 2 1
9 49.3 4 2 3 15 3 3
10 32.1 5 4 3 16 2 1
11 37.5 3 2 3 11 1 1
12 70.3 6 7 4 19 2 3
13 35 6 4 4 17 3 1
14 57 2 4 5 14 2 2
15 50.4 5 2 3 6 1 2
16 38.3 6 6 2 14 2 1
17 62.9 7 5 3 18 3 3
18 71.9 5 8 4 20 2 3
19 48.5 7 5 4 6 1 1
20 52.7 6 6 4 15 3 3
21 46.2 5 3 3 21 3 2
22 64.1 7 5 4 17 3 3
23 50.2 5 8 3 10 2 2
24 73.4 6 7 5 5 2 2
25 62 5 6 2 22 3 3
26 36.2 4 3 2 20 2 1
27 44.1 6 6 3 9 1 2
28 55 1 2 2 25 2 1
29 41.8 5 1 3 17 2 2
30 33.4 6 8 2 21 1 1

Hasil analisis dengan SPSS ditampilkan pada Tabel 6.2.  Sekarang mari kita interpretasi arti hasil analisis itu step-by-step.

Tabel 6.6.   Hasil Analisis Berupa Predicted Group, Z Scores dan Peluang Keanggotaan Subjek.

RESP. X1 X2 X3 X4 X5 X6 D PG ZF1 ZF2 pG1 pG2 pG3
1 47.1 2 5 3 14 1 1 1 -1.780 -0.487 0.672 0.328 0.000
2 69.1 7 6 3 12 2 3 3 2.184 -0.576 0.001 0.063 0.936
3 42.3 3 3 2 11 1 1 1 -2.193 -0.965 0.674 0.326 0.000
4 57 8 3 2 7 2 2 2 0.880 -1.309 0.020 0.774 0.207
5 75 8 7 4 15 3 3 3 3.901 -0.007 0.000 0.001 1.000
6 43.2 2 5 2 16 2 2 2 -0.996 -0.482 0.423 0.574 0.003
7 56.2 1 8 4 14 1 2 2 -0.940 -0.828 0.317 0.680 0.003
8 37.3 2 7 4 14 2 1 1 -1.912 -0.311 0.747 0.252 0.000
9 49.3 4 2 3 15 3 3 2 0.558 -0.766 0.056 0.788 0.156
10 32.1 5 4 3 16 2 1 1 -2.029 1.004 0.937 0.063 0.000
11 37.5 3 2 3 11 1 1 1 -2.920 -0.682 0.880 0.120 0.000
12 70.3 6 7 4 19 2 3 3 2.275 0.931 0.001 0.013 0.987
13 35 6 4 4 17 3 1 1 -0.740 1.156 0.758 0.231 0.011
14 57 2 4 5 14 2 2 2 -0.100 -1.054 0.105 0.870 0.025
15 50.4 5 2 3 6 1 2 2 -1.426 -1.706 0.249 0.751 0.000
16 38.3 6 6 2 14 2 1 1 -1.035 0.571 0.713 0.284 0.004
17 62.9 7 5 3 18 3 3 3 2.624 0.568 0.000 0.007 0.993
18 71.9 5 8 4 20 2 3 3 2.400 0.841 0.000 0.010 0.990
19 48.5 7 5 4 6 1 1 1 -1.397 -0.668 0.503 0.496 0.001
20 52.7 6 6 4 15 3 3 3 1.205 0.128 0.023 0.286 0.691
21 46.2 5 3 3 21 3 2 3 0.566 1.151 0.206 0.349 0.445
22 64.1 7 5 4 17 3 3 3 2.563 0.444 0.000 0.010 0.990
23 50.2 5 8 3 10 2 2 2 -0.056 -0.879 0.118 0.850 0.032
24 73.4 6 7 5 5 2 2 3 2.052 -2.350 0.001 0.341 0.658
25 62 5 6 2 22 3 3 3 2.602 0.803 0.000 0.006 0.994
26 36.2 4 3 2 20 2 1 1 -1.486 1.265 0.907 0.092 0.001
27 44.1 6 6 3 9 1 2 1 -1.700 -0.217 0.713 0.287 0.000
28 55 1 2 2 25 2 1 2 0.257 0.726 0.284 0.516 0.200
29 41.8 5 1 3 17 2 2 1 -1.103 0.715 0.761 0.236 0.003
30 33.4 6 8 2 21 1 1 1 -2.253 2.984 0.994 0.005 0.000

 

Sumber: Diolah dengan SPSS dari Tabel 6.1

Keterangan: D=Tujuan berlibur

PG=Predicted group

ZF1=Z scores fungsi 1

ZF2=Z scores fungsi 2

pG1=Peluang keanggotaan objek (responden) pada grup 1

pG2=Peluang keanggotaan objek (responden) pada grup 2

pG3=Peluang keanggotaan objek (responden) pada grup 3

Langkah-langkah Analisis dengan SPSS

Prosedur yang digunakan sama saja dengan analisis diskriminan dua grup.  Hanya saja, pada langkah kedua, pada kotak dialog Define range, pada sel minimum isikan angka 1 dan pada sel minimum isikan angka 3.  Lalu, ikuti langkah ke-3 dan langkah ke-4.  Setelah langkah ke-4, tambahkan satu langkah (sebelum langkah ke-5 pada), yaitu meng-klik menu Classify agar muncul kotak dialog Classification.  Lalu, tandai pilihan seperti pada gambar berikut.  Kemudian, klik Continue.

Outputnya dipaparkan pada bagian berikut:

Group Statistics

Group statistik  berisikan data tentang rata-rata dan standar deviasi setiap grup dan total sampel.  Data ini memberikan gambaran awal tentang diskriminasi sampel.  Artinya, sampel yang kita miliki akan terdiskriminasi dengan baik kalau data memenuhi dua hal.  Pertama, rata-rata variabel setiap grup berbeda . Kedua,  kalau standar deviasi dalam grup lebih rendah dibanding standar deviasi total karena kita mengharapkan homogenitas dalam grup yang tinggi (standar deviasi lebih rendah), sebaliknya antara grup yang satu dengan grup lainnya, kita mengharapkan heterogenitas yang tinggi (standar deviasi lebih tinggi).

Rata-rata setiap variabel berbeda pada ketiga grup merupakan  indikasi bahwa sampel memang layak didiskriminasi. Namun, data standar deviasi tidak memenuhi syarat ideal di atas.  Sebab, standar deviasi X2 dan X5 lebih tinggi pada grup 1 dibanding pada total sampel.  Pada group statistics  terlihat bahwa standar deviasi X2, X3, X4, dan X5 pada grup 2 lebih tinggi ketimbang pada total sampel.  Hasil ini menimbulkan kecurigaan jangan-jangan keempat variabel tidak memiliki peran diskriminasi.  Untuk memastikannya, simak penjelasan test of equality of group means berikut.

Test of Equality of Group Means

Kebimbangan di atas terjawab dengan memeriksa signifikansi setiap variabel secara sendiri-sendiri.  Dengan memakai uji F, terlihat hanya X1 dan X6 yang memiliki signifikansi melewati batas µ=0.05 – batas tingkat kesalahan maksimal yang paling banyak dipakai.

Hipothesis nol yang diuji menyatakan bahwa koefisien diskriminasi setiap variabel sama dengan nol. Pada tingkat kesalahan 0,05 (kepercayaan 95%), kita tidak punya bukti untuk menolak hipothesis itu pada variabel-variabel X2, X3, X4 dan X5.

Mau diapakan variabel-variabel itu?  Tergantung tujuan kita.  Kalau hanya sekedar memprediksi grup setiap objek, tidak jadi masalah memasukkan variabel-variabel itu dalam model diskriminan.  Akan tetapi, kalau untuk membangun model diskriminasi, variabel-variabel tersebut dapat dieliminasi.  Akan tetapi, ada baiknya kita melakukan metoda stepwise discriminant analysis untuk memastikan apakah model baru yang dibangun (dengan membuang variabel-variabel itu satu demi satu) lebih baik dari model awal kita.

Pooled Within-Group Matrices

Data ini menunjukkan korelasi antar-variabel.  Idealnya, secara teori, dalam analisis diskriminan, tidak terdapat kolinearitas antar-variabel.  Namun, pada Output 3 terlihat bahwa korelasi antara X1 dan X4 (r=0,353), X2 dan X5 (r=-0,387), X5 dan X4 (r=-0,294) serta antara X3 dan X4 (r=0,288), mencurigakan cukup tinggi.

Memang, persoalan tinggi-rendahnya koefisien korelasi bersifat relatif.  Oleh karena itu, mari kita lakukan uji t untuk memastikan apakah koefisien r signifikan ataukah tidak.

Hipothesis yang diuji adalah:

H0: t=0

Ha: t¹0 (uji dua sisi)

Batas tingkat kesalahan: µ=0,05

Derajat kebebasan (dk)=n-2=30-2=28

Nilai t tabel: tµ/2,28=2,048

Nilai thitung dihasilkan oleh persamaan:

Dari pada repot menguji satu-satu koefisien-koefisien r itu, lebih baik kita cari berapa nilai r yang menyebabkan t hitung=ttabel. Tujuannya, mencari batas tertinggi nilai r yang menyebabkan Ha ditolak.  Caranya,

Kesimpulannya, ternyata dari semua pasangan yang dicurigai, dengan uji t,  terlihat bahwa korelasi pasangan X2 dan X5 signifikan pada µ=0,05 dan df=28.

Eigenvalues

Dari nilai eigenvalue yang tertera pada Output 4 terlihat bahwa fungsi 1 (function 1), dengan eigenvalue sebesar 2,757,  dapat menjelaskan 91 % varian.  Hal ini menunjukkan bahwa fungsi 1 memiliki kekuatan diskriminasi yang mumpuni.  Sebaliknya, fungsi 2 (function 2), dengan eigenvalue sebesar 0,274, hanya dapat menjelaskan 9% varian.    Memang, dalam analisis diskriminan berganda, tidak semua fungsi signifikan. Biasanya, kekuatan fungsi dalam analisis diskriminan ganda memang tidak sama.

Wilks’ Lamda

Apakah kedua fungsi signifikan?  Lihat nilai Wilks Lambda pada Output 5.  Terlihat nilai Wilks’ Lambda untuk kedua fungsi (1 through 2) sebesar 0,209.  Nilai ini ditransfer menjadi nilai chi-square sebesar 38,355 yang memiliki tingkat signifikansi 0,000.  Tingkat signifikansi ini tentunya jauh di atas 0,05 yang umumnya diterima  sebagai batas maksimal tingkat kesalahan atau alpha. Dengan demikian dapat disimpulkan bahwa fungsi dan fungsi 2 dapat melakukan fungsi diskriminasi terhadap sampel.

Standardized Canonical Discriminant Function Coefficient

Pada Output 6 terlihat bahwa fungsi 1 memiliki koefisien yang relatif besar pada variabel X1 dan X6.  Artinya, kedua variabel inilah yang paling berperan dalam melakukan diskriminasi melalui fungsi 1.  Fungsi 2 memiliki koefisien yang besar pada variabel X2 dan X5.

Output 6

Structure Matrix

Data pada structure matrix (Output 7) menunjukkan korelasi antara setiap variabel dengan kedua fungsi diskriminan.  Sekalipun komputer sudah memberikan hasilnya, data ini dapat kita hitung secara manual. Caranya, dengan meng-korelasikan nilai-nilai setiap variabel secara sendiri-sendiri dengan skor masing-masing fungsi diskriminan.

Output 7

Dari structure matrix terlihat lebih condong ke fungsi mana setiap variabel. Lihat tanda bintang pada koefisien korelasi.  Tanda bintang itu menandai dengan fungsi mana setiap variabel berkoalisi. Fungsi 1 berkorelasi paling tinggi dengan (sesuai urutan) X1, X6, X2 dan X3.  Dua variabel lain, yaitu X5 dan X4 (sesuai urutan) berkorelasi paling dekat dengan fungsi 2.

Canonical Discriminant Function Coefficients

Data ini menyatakan koefisien setiap variabel dalam kedua fungsi.  Sekali pun hanya X1, X6, X2 dan X3 yang berkoalisi dengan fungsi 1, tetapi dalam model diskriminan fungsi 1 semua variabel dilibatkan. Demikian pula pada model diskriminan fungsi 2.

Data pada Output 7 sebenarnya tidak salah. Namun, karena hanya tiga angka di belakang koma, kalau data ini dipakai untuk membangun model untuk menghitung Z score, maka skor diskriminan yang dihasilkan bisa berbeda dari hasil yang disajikan pada Tabel 6.6, sekali pun tidak berbeda jauh.  Supaya puas, kopi dulu canonical discriminant function dari output SPSS ke Excel.  Pada Excel, kita bisa mengatur berapa pun angka di belakang koma.  Pada Tabel 6.7, kita peroleh koefisien lima angka di belakang koma.

Output 8

Dengan data Tabel 6.7, kedua fungsi memiliki persamaan sebagai berikut.

Fungsi 1:

Fungsi 2:

Dengan kedua persamaan ini, pada setiap responden, kita dapat menghitung skor diskriminan dengan fungsi 1 maupun untuk fungsi 2 (balik ke Tabel 6.6 di atas).

Bagaimana kita memprediksi keanggotaan setiap responden?  Untungnya, data tentang keanggotaan responden juga diberikan oleh komputer berdasarkan peluang.  Responden 1 aslinya grup 1, diprediksi masuk grup 1 (kelompok yang berlibur di dalam kota) karena memang peluang ke grup 1 paling besar, yaitu 0,672. Responden 2, diprediksi masuk grup 3. Aslinya memang grup 3 (kelompok yang berlibur ke luar pulau). Peluang responden 2 masuk grup 3 sangat besar, yakni 0,936. Sedangkan ke grup 1 dan grup 2, peluang keanggotaan responden 2 kecil, masing-masing hanya 0,001 dan 0,063.

Responden 9 merupakan salah satu yang salah prediksi. Aslinya, dia ini masuk grup 3, akan tetapi tetapi diprediksi masuk grup 2 (kelompok yang berlibur ke luar kota). Salah prediksi seperti ini biasa dalam analisis diskriminan.

Functions at Group Centroid

Data ini menjelaskan rata-rata skor setiap grup, baik berdasarkan fungsi satu maupun berdasarkan fungsi dua. Mari kita ambil skor diskriminan dari Tabel 6.6 untuk menghitung centroid.  Karena keperluannya hanya untuk memperagakan, maka perhitungan hanya dilakukan untuk grup 1 (Tabel 6.8).  Coba lakukan pada grup 2 dan 3 sebagai latihan.

Tabel 6.8. Perhitungan Centroid pada Grup 1


Classification Statistics

Cendroid grup (Output 8) diperlihatkan dalam territorial map.  Dengan menggunakan fungsi 1 dan fungsi 2 sebagai sumbu, setiap grup memiliki memiliki posisi, di mana titik koordinatnya adalah cendroid itu sendiri.

Berbeda dengan analisis diskriminan dua grup, pada model tiga grup atau lebih, cutting score tidak lagi dapat dipakai sebagai kriteria untuk memprediksi keanggotaan setiap objek (responden).

Untungnya, program sudah melakukan prediksi, selain memberikan peluang keanggotaan setiap objek.

Satu alat lagi untuk melihat keanggotaan setiap objek adalah dengan memeriksa peta teritorial.  Pada peta ini diperlihatkan teritorial setiap grup.  Kalau ada anggota grup masuk pada teritorial grupnya, berarti keanggotaan anggota itu diprediksi dengan tepat. Kalau aslinya anggota grup 1, tetapi masuk teritori grup 2, berarti keanggotaan anggota itu salah prediksi.

Bagaimana melihat apakah anggota-anggota setiap grup berada di dalam ataukah di luar teritorialnya?  Caranya dengan menggabungkan teritorial map (Output 9) dengan scattergram (Output 10).  Sebelumnya, skala kedua gambar itu harus disamakan terlebih dahulu agar sesuai. Hasilnya adalah Gambar 6.1.

Pada Gambar 6.1, dari 11 anggota grup 1, yang masuk area grup 2 ada 1.  Jadi, yang diprediksi tepat adalah 10 anggota (90,91%).

Dari 10 anggota grup 2, yang masuk ke teritorial grup 1 ada 2 dan ke teritorial grup 3 juga 2 anggota.  Yang diprediksi dengan tepat adalah 6 anggota (60%).  Dari 9 anggota grup 3, masuk wilayah grup 2 ada satu. Jadi, yang diprediksi tepat  8 anggota (88,89%).

Akhirnya, dari 30 total sampel, 24 orang diprediksi secata tepat keanggotaannya.  Artinya, hit ratio adalah 80%. Kesimpulan yang sama terdapat pada classification result (Output 11). Pertanyaannya, apakah kedua fungsi akurat dalam melakukan tugasnya?

Output 9

SPSS sendiri memberikan hasil klasifikasi (Output 11). Terlihat bahwa dari 30 total sampel, 24 orang (10 + 6 + 8) diprediksi secata tepat keanggotaannya.  Artinya, hit ratio adalah 80%. Kesimpulan yang sama terdapat pada classification result (Output 11). Pertanyaan selanjutnya, apakah kedua fungsi akurat dalam melakukan tugasnya? Mari kita jawab pertanyaan ini dengan menghitung Cpro.

Output 11

Perhitungan proportional chance criterion adalah:

CPRO=(11/30)2+(10/30)2+(9/30)2=33,56%.

Karena hit ratio jauh di atas CPRO, maka kedua fungsi diskriminan ini telah melakukan tugas dengan akurat.