MDS Similarity berbasis Atribut

Selain dengan kesan umum, kesamaan juga dapat dinilai berbasis atribut. Untuk pendekatan ini, penilaian kesamaan dilakukan secara tidak langsung atau diturunkan dari data variabel lain melalui mana kesamaan dapat disimpulan (derived similarity). Metoda ini disebut juga metoda decompositional, seperti dijelaskan di sini.

Misalkan kita ingin memetakan lima merek susu kental yang beredar di pasaran. Adapun atribut yang kita gunakan sebagai pembanding adalah rasa, aroma, kekentalan dan harga. Dengan skala numerik berskala tujuh kita memperoleh data seperti pada Tabel 1.

Tabel 1. Contoh Data Similarity berbasis Atribut

AtributPersepsi Merek Susu Kental
Merek AMerek BMerek CMerek DMerek E
Rasa67667
Aroma57667
Kekentalan66666
Harga76667

Langkah-langkah Analisis

  1. Ketik data Tabel 1 di dalam SPSS. Di SPSS, penulisan nama merek harus diberi tanda slash. Merek A ditulis sebagai Merek_A.
  2. Lakukan proses berikut: Analyze>Scale>Multidimension Scaling>Proxscall.
  3. Pada jendela dialog yang muncul pilih ‘Create proximities from data‘ dan ‘One matrix source‘.
  4. Highlight dan drag semua merek ke dalam sel Variables.
  5. Pastikan meminta Common space, Common Space Coordinated, Distances, dan Multiple stress measures.
  6. Execute.

Hasil dan Interpretasinya

Tabel output pertama SPSS memberikan informasi berikut.

Ringkasan 

Case Processing Summary
Cases5
Sources1
Objects5
ProximitiesTotal Proximities10a
Missing Proximities0
Active Proximitiesb10

Tabel ini menginformasikan bahwa jumlah objek (merek) yang diolah adalah lima, sumbernya satu matriks (responden) dan proximity atau  jarak (distance) yang dihasilkan ada 10. Rinciannya dapat dilihat pada tabel distance di bawah.

Goodness-of-fit

Setiap pembentukan dalam ilmu statistika selalu disertai oleh pemeriksaan apakah model yang dihasilkan baik atau tidak. Tabel di bawah ini berisikan informasi yang diperlukan untuk menjawab kebutuhan dimaksud. Penjelasan tentang kriteria Goodness-of-fit MDS disajikan di sini. Yang kita butuhkan sesuai dengan data kita adalah Normalized Raw Stress (NRS) dan Dispersion Accounted For (D.A.F.). Nilai NRS=0.0009 dan DAF=0.99991 menunjukkan bahwa model kita adalah sempurna (perfect).

Final Coordinates
Dimension
12
Merek_A.798.339
Merek_B-.650-.170
Merek_C.208-.309
Merek_D.208-.309
Merek_E-.564.448

Peceptual map diberikan dalam bentuk koordinat dan gambar (common space). Tampak bahwa merek C dan D memiliki titik yang sama karena memang pada tabel data di atas, data keduanya sama persis.

Distances

Tabel distances menyatakan jarak Euclidean, yaitu jarak geometri antar merek. Jarak ini tidak memiliki satuan panjang dan hanya dipakai untuk menilai secara kesamaan dan ketidaksamaan merek secara relatif. Semakin tinggi angka berarti jarak semakin jauh dan merek semakin tidak sama. Terlihat pada tabel bahwa jarak antara Merek C dan D adalah 0.000, yang berarti kedua merek tidak memiliki jarak, sehingga memiliki satu posisi seperti pada perceptual map di atas. Jarak terjauh adalah antara Merek A dan merek B. Berarti kedua merek inilah yang paling tidak sama.

Distances
Merek_AMerek_BMerek_CMerek_DMerek_E
Merek_A.000
Merek_B1.535.000
Merek_C.876.869.000
Merek_D.876.869.000.000
Merek_E1.367.6241.0811.081.000

Reminder

Proses MDS yang ditampilkan di sini dilakukan untuk data seorang responden saja (one matrix source). Pertanyaan, bagaimana kalau responden banyak? Kita tidak bisa melakukan MDS sekaligus untuk semua responden, tetapi satu-satu. Kemudian, titik koordinat merek, yang dihasilkan MDS dari setiap responden dirata-ratakan. Kemudian, dengan koordinat rata-rata itulah dibuat peta persepsi.



MDS berbasis Anchor Point Clustering Method

Dengan anchor point clustering method, kita menggunakan  satu merek sebagai patokan.  Lalu, responden menilai kemiripan sejumlah merek yang paling mirip dengan merek referensi. Jawaban bisa berupa angka satu (untuk sekian banyak merek paling mirip) atau ranking.  Matrik yang kita peroleh conditional  sebab kita tidak bisa membandingkan baris dengan baris.  Jadi, matrik tidak simetrik.

Pertanyaan:

Pilih lima merek  yang paling mirip dengan oli Top One dengan memberi tanda ‘√’ pada tempat yang disediakan.

Pen Zoil                          ____
Mesran Super                ____
Mesran Prima               ____
Mesran Prima XP         ____
Evalube                           ____
Repsol                              ____
Fastron                            ____
Synthium                        ____
Quatron                           ____
Agip                                  ____
Shell                                 ____

Dari 10 responden, diperoleh hasil seperti pada Tabel 8.4. Hasilnya adalah Gambar 8.6.

Tabel 8.4. Data Anchoring Clustering Method

RESP.ABCDEFGHIJKL
1110000110101
2110000111011
3110011100100
4100010010111
5110001100011
6110001100011
7110111000001
8110101110000
9110001100011
10110000011011

Keterangan: A: Top One, B=Penzoil,  C=Mesran Super, D=Mesran Prima, E=Meran Prima XP, F=Evalube, G=Repsol, H=Fastron, I=Synthium, J=Quatro, K=Agip, K=Shell

Langkah-langkah analisis dengan SPSS

1. Buka layar SPSS lalu ketikkan data Tabel 8.4. Kalau sudah diketik pada program lain (yang under Windows),  Copy data pada program itu, lalu Paste pada layar SPSS. Tampak pada layar:

2. Pada menu utama, pilih Analyze, Scale, lalu klik Multidimen-sionscaling (PROXSCALL). Pada kotak dialog yang muncul, pada Data format, pilih Creates proximities from data. Kemudian, pada Number of source, pilih One matrix source. Lalu, klik define.

3. Pada kotak dialog yang muncul setelah langkah ke-2, drag semua merek lalu masukkan dalam area Variables.

4. Pada kotak dialog di atas, klik Measure, lalu pada kotak dialog yang muncul sesudahnya, pada Measure, klik Binari. Pastikan sel Present berisikan angka 1 dan absent angka 0. Lalu, klik Continue untuk kembali ke kotak dialog utama. Catatan: Kita pilih binari karena data kita hanya 1 (dipilih paling mirip) dan 0 (tidak dipilih). Pastikan sel Present berisikan angka 1 dan absent angka 0.

5. Klik Plot dan tandai Common space.

6. Klik Output dan tandai Comonspace coordinates, Multiple stress measure, dan Distances.

7. Pada kotak dialog utama, klik OK.

Goodness-of-fit

Apakah model MDS kita baik? Karena hanya menggunakan seorang responden, kita dapat menggunakan Normalized Raw Stress dan Dispersion Accounted For (D.A.F.) dari tabel berikut.

Stress and Fit Measures
Normalized Raw Stress.04272
Stress-I.20670a
Stress-II.56907a
S-Stress.08192b
Dispersion Accounted For (D.A.F.).95728
Tucker’s Coefficient of Congruence.97840
PROXSCAL minimizes Normalized Raw Stress.
a. Optimal scaling factor = 1.045.
b. Optimal scaling factor = .952.

Stress mengindikasikan proporsi varian perbedaan (disparity) yang tidak dijelaskan oleh model. Semakin rendah stress, semakin baik model MDS yang dihasilkan”.  Pertanyaannya, sampai nilai berapa stress masih mengindikasikan model yang baik? Untuk menjawab pertanyaan ini, Dugard et al. (2010) memberi ketentuan seperti di bawah ini.

100 x Stress (Percent)Goodness of Fit
20% or abovePoor
10%-19.9%Fair
5%-9.9%Good
2.5%-4.9%Excellent
0%-2.4%Near Perfect

Pada output di atas, ada tiga nilai stress, yaitu  Normalized Raw Stress, Stress I, Stress II, dan S-Stress. Yang menjadi perhatian kita adalah S-Stress dan Normalized Raw Stress. S-stress dihitung berdasarkan squared distance, sedangkan  Normalized Raw Stress (NRStress) dihitung berdasarkan distances. Yang terbaik di antara keduanya adalah NRStress (Borg & Groenen, 1997). Pada kasus kita, nilai NR-Stress=.04272 adalah excellent.

Dispersion Accounted For (DAF) digunakan untuk mengevaluasi kesesuaian peta persepsi dengan data yang mendasarinya. DAF diperoleh dari NR-Stress dengan rumus:  DAF = 1 – NRStress.  Dengan demikian, DAF dapat berkisar dari 0 hingga 1 dan nilai yang lebih tinggi menunjukkan kecocokan yang lebih baik. Pada model kita, DAF=.95728 yang mengindikasikan model MDS kita sangat baik.

Perceptual Map

Final Coordinates
Dimension
12
Top_One-.672-.018
Penzoil-.656.212
Mesran_Super.744-.080
Mesran_Prima.444.554
Mesran_Prima_XP.582.310
Evalube-.189.691
Repsol-.438.406
Fastron.142-.631
Synthium.463-.499
Quatron.461-.004
Agip-.323-.569
Shell-.558-.371

Pertanyaannya, mana yang paling dekat dengan Top One? Pernyataan ini dapat dijawab dengan menggunakan data Distances. Seperti terlihat pada tabel di bawah, yang paling dekat dengan Top One adalah Penzoil dengan distance sebesar 0.231. 

Distances
Top OnePenzoilMesran SuperMesran PrimaMesran Prima XPEvalubeRepsolFastronSynthiumQuatronAgipShell
Top_One.000
Penzoil.231.000
Mesran_Super1.4171.430.000
Mesran_Prima1.2541.151.702.000
Mesran_Prima_XP1.2961.241.423.280.000
Evalube.858.6681.210.647.859.000
Repsol.484.2911.278.8941.024.378.000
Fastron1.0191.161.8151.2221.0381.3621.188.000
Synthium1.2321.325.5041.053.8181.3561.277.346.000
Quatron1.1331.138.293.558.336.951.988.703.495.000
Agip.652.8491.1741.3601.2621.267.982.470.789.967.000
Shell.371.5921.3341.3631.3281.124.786.7471.0291.083.307.000


REFERENSI

Borg, I., Groenen, P. (1997). MDS fit measures, their relations, and some algorithms. In: Modern Multidimensional Scaling. Springer Series in Statistics. Springer, New York, NY. https://doi.org/10.1007/978-1-4757-2711-1_11

Dugard, P., Todman, J., & Staines, H. (2010). Approaching Multivariate Analysis. A Practical Introduction. Second Edition. Routledge: New York. This text has example analyses using SPSS.

MDS Similarity berbasis Skala Numerik dan Semantic Diferential

Kalau jumlah objek banyak, misalnya sepuluh merek, akan ada 10(10-1)/2=45 pasangan merek. Tentu, membuat peringkat kesamaan sedemikian banyak pasangan merupakan pekerjaan merepotkan. Oleh karena itu, teknik dengan menggunakan skala numerik ataupun semantic differential, dapat dipertimbangkan.

Berikan pendapat anda tentang kemiripan pasangan-pasangan koran nasional berikut:

Kompas-Koran TempoSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-RepublikaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-Suara PembaruanSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-Bisnis IndonesiaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-Pos KotaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Kompas-Rakyat MerdekaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-RepublikaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-Suara PembaruanSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-Bisnis IndonesiaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-Pos KotaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Koran Tempo-Rakyat MerdekaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Republika-Suara PembaruanSangat beda 1  2  3  4  5  6  7   Sangat mirip
Republika-Bisnis IndonesiaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Republika-Pos KotaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Republika-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Republika-Rakyat MerdekaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Suara Pembaruan-Bisnis Indo.Sangat beda 1  2  3  4  5  6  7   Sangat mirip
Suara Pembaruan-Pos KotaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Suara Pembaruan-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Suara Pembaruan-Rakyar MrdSangat beda 1  2  3  4  5  6  7   Sangat mirip
Bisnis Indonesia- Pos KotaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Bisnis Indonesia-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Bisnis Indonesia-Rakyat MrdkaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Pos Kota-Lampu MerahSangat beda 1  2  3  4  5  6  7   Sangat mirip
Pos Kota-Rakyat MerdekaSangat beda 1  2  3  4  5  6  7   Sangat mirip
Lampu Merah-Rakyat MerdekaSangat beda 1  2  3  4  5  6  7   Sangat mirip

Metoda ini menguntungkan karena lebih mudah, sebab responden tidak perlu membandingkan peringkat satu pasangan dengan pasangan lain.  Masalahnya, dengan metoda ini, kita tidak mengetahui peringkat kemiripan pasangan, sebab terdapat kemungkinan adanya skor yang sama.

Tabel 8.2 berisikan data mentah yang diperoleh dari konsumen. Untuk pengolahan, data ini kita ubah menjadi data ranking, seperti  pada Tabel 8.2A.  Cara meranking tidak dijelaskan di sini.  Konsep tersebut dapat didalami pada buku-buku statistika.

Bisnis IndonesiaKompasKoran TempoLampu MerahSuara PembaruanPos KotaRakyat MerdekaRepublika
Bisnis Ind.......
Kompas6......
Koran Tempo66.....
Lampu Merah111....
Pembaruan4671...
Pos Kota11161..
Rakyat Merdeka111535.
Republika4451231

Langkah-langkah Analisis

1. Ketik data di atas di SPSS. Urutan nama merek pada kolom harus menurut abjad untuk menghindari interpretasi ‘missing data‘ oleh SPSS. Tampilan data adalah seperti di bawah ini. Perlu diketahui bahwa data ini hanya dari seorang responden.

2. Pada menu utama SPSS, pilih analyze, lalu Scale, setelah itu klik multimension scaling (PROXSCALL). Dalam SPSS, ada dua pilihan MDS.  Selain PROXSCALL, satu lagi adalah ASCALL. Untuk bentuk matrik seperti di atas,  PROXSCALL memberikan hasil lebih baik karena ada koordinat merek-merek mudah di-copy.  Jadi, kita pilih program ini.

3. Pada kotak dialog yang muncul, pilih: The data are proximities, One matrix sources, Proximities are in a matrix across column, lalu klik Define.

4. Pada kotak dialog yang muncul, masukkan semua merek pada sel proximities.

5. Klik Model. Pada langkah ini:

  • Pastikan Shape adalah Lower-triangular matrix. Parena pola data kita dapat membentuk dua segitiga, yaitu di atas dan di bawah diagonal. Data di atas mengambil pola setiga bagian bawah.
  • Pastikan  Proximities adalah Similarities. SPSS menginterpretasi bahwa semakin tinggi angka, semakin tinggi nilainya. Nah, dengan skala yang kita gunakan, semakin tinggi nilai data, semakin tinggi similarity (kesamaan).
  • Pastikan Proximities transformation adalah Ratio.

6. Klik Plot dan tandai Common space.

7. Klik Output dan tandai Comonspace coordinates, Multiple stress measure, dan Distances.

8. Klik OK. Sekarang kita interpretasi hasilnya.

Goodness of Fit

Apakah model MDS kita baik? Karena hanya menggunakan seorang responden, kita dapat menggunakan Normalized Raw Stress dan Dispersion Accounted For (D.A.F.) dari tabel berikut.

Stress and Fit Measures
Normalized Raw Stress.07524
Stress-I.27430a
Stress-II.81850a
S-Stress.18375b
Dispersion Accounted For (D.A.F.).92476
Tucker’s Coefficient of Congruence.96165
PROXSCAL minimizes Normalized Raw Stress.
a. Optimal scaling factor = 1.081.
b. Optimal scaling factor = .949.

Stress mengindikasikan proporsi varian perbedaan (disparity) yang tidak dijelaskan oleh model. Semakin rendah stress, semakin baik model MDS yang dihasilkan”.  Pertanyaannya, sampai nilai berapa stress masih mengindikasikan model yang baik? Untuk menjawab pertanyaan ini, Dugard et al. (2010) memberi ketentuan seperti di bawah ini.

100 X Stress (Percent)Goodness of Fit
20% or abovePoor
10%-19.9%Fair
5%-9.9%Good
2.5%-4.9%Excellent
0%-2.4%Near Perfect

Pada output di atas, ada tiga nilai stress, yaitu  Normalized Raw Stress, Stress I, Stress II, dan S-Stress. Yang menjadi perhatian kita adalah S-Stress dan Normalized Raw Stress. S-stress dihitung berdasarkan squared distance, sedangkan  Normalized Raw Stress (NRStress) dihitung berdasarkan distances. Yang terbaik di antara keduanya adalah NRStress (Borg & Groenen, 1997). Pada kasus kita, nilai NR-Stress=.07524 adalah good.

Dispersion Accounted For (DAF) digunakan untuk mengevaluasi kesesuaian peta persepsi dengan data sumbernya. DAF diperoleh dari NR-Stress dengan rumus:  DAF = 1 – NRStress.  Dengan demikian, DAF dapat berkisar dari 0 hingga 1 dan nilai yang lebih tinggi menunjukkan kecocokan yang lebih baik. Pada model kita, DAF=.92476. Lagi pula, kalau menurut NRStress, model MDS adalah good-fit, maka DAF harus menunjukkan hasil yang sama.

Nilai Tucker’s Coefficient of Congruence=0.96165. Nilai menyatakan korelasi antar dimensi MDS multi sampel. Karena data kita adalah one sample, maka nilai ini tidak perlu diinterpretasi.

Perceptual Map

Program SPSS menghasilkan perceptual map dan koordinatnya seperti di bawah ini. Coba kita perhatikan Kompas. Terlihat bahwa koran Lampu Merah menempati posisi sendiri.

Dimension
12
Bisnis_Indonesia-.112.174
Kompas-.358.603
Koran_Tempo-.212-.705
Lampu_Merah-.818.006
Suara_Pembaruan.877.065
Pos_Kota.427-.367
Rakyat_Merdeka-.145-.233
Republika.342.457

Semakin sama merek, semakin tinggi persaingan di antara mereka. Bila premis ini dipakai, maka yang bersaing paling dekat adalah yang memilik jarak (distance) paling rendah, yaitu antara Bisnis Indonesia dan Rakyat Merdeka. Harap diingat bahwa data yang dioleh adalah hasil simulasi untuk pembelajaran dan tidak mencerminkan keadaan sebenarnya.

Distances
Bisnis IndonesiaKompasKoran TempoLampu MerahSuara PembaruanPos KotaRakyat MerdekaRepublika
Bisnis_Indonesia.000
Kompas.494.000
Koran_Tempo.8851.316.000
Lampu_Merah.726.754.934.000
Suara_Pembaruan.9951.3471.3331.696.000
Pos_Kota.7641.247.7231.299.623.000
Rakyat_Merdeka.409.863.476.7141.064.587.000
Republika.535.7151.2881.245.663.828.845.000

Bagaimana kalau responden lebih dari satu? Kita bisa menggunakan prosedur seperti yang dijelaskan pada link ini.



REFERENSI

Borg, I., Groenen, P. (1997). MDS fit measures, their relations, and some algorithms. In: Modern Multidimensional Scaling. Springer Series in Statistics. Springer, New York, NY. https://doi.org/10.1007/978-1-4757-2711-1_11

Dugard, P., Todman, J., & Staines, H. (2010). Approaching Multivariate Analysis. A Practical Introduction. Second Edition. Routledge: New York. This text has example analyses using SPSS.

MDS Non-Atribut berbasis Ranking Similarity

Membuat RankingMultiple Matrix Source | One Matrix Source | Stress and Fit Measures | Memberi Nama Dimensi

Pada postingan ini telah digambarkan adanya dua pendekatan MDS, yaitu pendekatan atribut dan non-atribut. Dengan pendekatan atribut, maka pembuatan peta persepsi dilakukan dengan membandingkan atribut-atribut sebuah merek dibanding merek lain. Dalam pendekatan non-atribut, yang kita gunakan ada dua, yaitu persepsi kesamaan (similarity approach) antar merek dan preferensi (preference approach) terhadap merek-merek yang berada dalam suatu competitive framework.

Ada beberapa cara mengukur kesamaan, yaitu meranking, menggunakan skala numerik atau semantic differential, mengelompokkan secara subjektif, anchoring clustering method, membandingkan pasangan dan mengukur perilaku secara langsung (direct behavior method). Dua metoda pertama paling banyak dibahas dalam buku-buku riset pemasaran.

Berikut ini dilakukan pembahasan pada empat metoda pertama. Dua metoda terakhir tidak dibahas karena tidak praktis dalam penerapannya.

Membuat Ranking

Kita bisa meminta responden untuk meranking semua pa-sangan objek-objek yang mungkin (all possible pairs). Misalkan kita meriset delapan merek: Sosro, Tekita, Es Tea, Fruit Tea, Lipton Ice Tea, dan Fresh Tea. Jika dipasang-pasangkan akan ada 15 pasangan, yang ditampilkan dalam pertanyaan (yang disertai simulasi jawaban) sebagai berikut:

Instruksi: Berikan peringkat (ranking) tingkat kesamaan pasangan-pasangan merek teh botol berikut. Catatan: peringkat 1 adalah yang paling mirip.

Tabel Hasil pengisian kuesioner seorang responden

Pasangan MerekRanking
Sosro vs. Tekita5
Sosro vs. Es Tea6
Sosro vs. Fruit Tea14
Sosro vs. Lipton Ice Tea15
Sosro vs. Fresh Tea7
Tekita vs. Es Tea1
Tekita vs. Fruit Tea8
Tekita vs. Lipton Ice Tea9
Tekita vs. Fresh Tea2
Es Tea vs. Fruit Tea10
Es Tea vs. Lipton Ice Tea11
Es Tea vs. Fresh Tea4
Fruit Tea vs. Lipton Ice Tea3
Fruit Tea vs. Fresh Tea12
Lipton Ice Tea vs. Fresh Tea13

Dengan   pertanyaan serta simulasi data  di atas, kita hasilkan data seperti pada Tabel 8.1. Lalu, dengan data ini, kita hasilkan perceptual map  Gambar 8.3.

Tabel 2. Simulasi Peringkat Kesamaan Merek-merek Teh Botol dari seorang responden

EsteaFresh TeaFruit TeaLiptonSosroTekita
Estea
Fresh Tea4....
Fruit Tea1012...
Lipton11133..
Sosro147155.
Tekita12896

 

Download data  dari sini. Data ini dari beberapa responden. Perlu diingat bahwa kita bisa mengolah MDS dengan jenis data seperti ini dari seorang (one matrix source) atau lebih dari satu responden (multiple matrix source). Kali ini kita mengolah data berupa multile matrix source.

Multiple Matrix Source

Langkah-langkah

1. Download data SPSS dari sini dan buka di SPSS. Tampil datanya seperti ini.

2. Pada menu utama SPSS, pilih analyze, lalu Scale, setelah itu klik multimension scaling (PROXSCALL). Dalam SPSS, ada dua pilihan MDS.  Selain PROXSCALL, satu lagi adalah ASCALL. Untuk bentuk matrik seperti di atas,  PROXSCALL memberikan hasil lebih baik karena ada koordinat merek-merek mudah di-copy.  Jadi, kita pilih program ini.

3. Pada kotak dialog yang ditampilkan, pilih: The data are proximities, Multiple matrix sources, Proximities are stacked in a matrix across column, lalu klik Define.

4. Pada kotak dialog yang muncul, masukkan semua merek pada sel proximities.

5. Klik Model. Pada langkah ini:

  • Pastikan Shape adalah Lower-triangular matrix. Parena pola data kita dapat membentuk dua segitiga, yaitu di atas dan di bawah diagonal. Data di atas mengambil pola setiga bagian bawah.
  • Pastikan  Proximities adalah Dissimilarities. Bukankah judul menyatakan bahwa perceptual map yang kita bangun adalah berbasis Similarity? Betul. Namun, SPSS menginterpretasi bahwa semakin tinggi angka, semakin tinggi nilainya. Nah, pada data kita, semakin rendah angka, semakin tinggi similarity (kesamaan). Semakin tinggi angka, semakin tinggi dissimilarity (perbedaan).
  • Pastikan Proximities transformation adalah Ratio.

6. Klik Plot dan tandai Common space.

7. Klik Output dan tandai Comonspace coordinates, Multiple stress measure, dan Distances.

8. Klik OK. Sekarang kita interpretasi hasilnya.

 

Interpretasi Output

Stress and Fit Measures

Normalized Raw Stress.03689
Stress-I.19206a
Stress-II.54700a
S-Stress.09282b
Dispersion Accounted For (D.A.F.).96311
Tucker’s Coefficient of Congruence.98138
PROXSCAL minimizes Normalized Raw Stress.
a. Optimal scaling factor = 1.038.
b. Optimal scaling factor = 1.059.

Stress

Stress mengindikasikan proporsi varian perbedaan (disparity) yang tidak dijelaskan oleh model. Semakin rendah stress, semakin baik model MDS yang dihasilkan”.  Pertanyaannya, sampai nilai berapa stress masih mengindikasikan model yang baik? Untuk menjawab pertanyaan ini, Dugard et al. (2010) memberi ketentuan seperti di bawah ini.

100 x Stress (Percent)Goodness of Fit
20% or abovePoor
10%-19.9%Fair
5%-9.9%Good
2.5%-4.9%Excellent
0%-2.4%Near Perfect

Pada output di atas, ada tiga nilai stress, yaitu  Normalized Raw Stress, Stress I, Stress II, dan S-Stress. Yang menjadi perhatian kita adalah S-Stress dan Normalized Raw Stress. S-stress dihitung berdasarkan squared distance, sedangkan  Normalized Raw Stress (NRStress) dihitung berdasarkan distances. Yang terbaik di antara keduanya adalah NRStress (Borg & Groenen, 1997). Pada kasus kita ini, nilai NR-Stress=0.037 atau 3.7% dan termasuk excellent.

Tucker coefficient of congruence

Coba kita telaah namanya: multidimensional scaling. Kita memang hanya menggunakan aspek input similarity. Namun, kita perlu memahami bahwa persepsi similarity tersebut didasarkan pada berbagai aspek yang tidak terinci. Sama saja kala kita tanya seorang bapak: “Di antara empat anakmu itu, anak nomor berapa yang paling mirip dengan anda? Misalnya bapak itu menjawab: “Anak nomor empat.” Tentu, jawaban bapak itu didasarkan pada berbagai aspek, yang jumlahnya bisa puluhan, seperti: bentuk hidung, warna rambut, postur tubuh, kepatuhan, kepintaran, religiusitas, hobi, prestasi, dan lain-lain. Namun, waktu memberi jawaban, bapak tadi tidak perlu merinci alasan-alasannya.

Demikian pula perbandingan merek dalam kasus ini, kita harus percaya bahwa kesamaan didasarkan pada berbagai aspek. Kemudian, berbagai aspek hipothetik tersebut digabung ke dalam sejumlah dimensi, yang mirip dengan “faktor” dalam analisis faktor. Berapa jumlah “faktor” atau dimensi yang diekstrak? SPSS secara default akan menghasilkan dua dimensi. Namun pada dasarnya, jumlah dimensi dapat diminta satu, dua, tiga, empat, bahkan lebih. Namun, kalau tujuannya adalah menghasilkan peta persepsi, maka jumlah dimensi yang dapat digambarkan adalah satu sampai tiga.

Pada kesempatan ini kita menggunakan dua dimensi. Kedua dimensi itu dapat diperoleh dengan hanya menggunakan satu responden (disebut one sample oleh SPSS) atau lebih dari satu responden (disebut multiple sample oleh SPSS) (Catatan: Seperti telah dijelaskan, aspek one sample ini adalah salah satu kelebihan MDS. Umumnya teknik-teknik statistik yang lain, seperti regresi, analisis faktor, analisis diskriminan, dan lain-lain, menggunakan banyak responden).

Nah, apabila kita menggunakan multisample, nilai Tucker coefficient of congruence (TCC) menyatakan kesamaan atau korelasi antar faktor dari sampel-sampel yang kita gunakan. Oh ya, dalam MDS multisample, data seorang responden dianggap satu sampel. Otomatis, kalau kita menggunakan satu responden, TCC tidak perlu diinterpretasi, walaupun kita temukan pada output.

Nilai TCC dalam kisaran 0,85–0,90 dianggap wajar. Nilai 0.90 sampai 0.94 dianggap tinggi. Nilai 0.95 atau lebih tinggi dianggap sama atau identik. Pada kasus kita ini, dengan TCC=0.98, kesamaan atau korelasi kedua dimensi yang dihasilkan dari kelima sampel adalah identik. Artinya, MDS dari kelima responden adalah identik.

Dispersion Accounted For (DAF)

Dispersion Accounted For (DAF) digunakan untuk mengevaluasi kesesuaian peta persepsi dengan data sumbernya. DAF diperoleh dari NR-Stress dengan rumus:  DAF = 1 – NRStress.  Dengan demikian, DAF dapat berkisar dari 0 hingga 1. Semakin tinggi nilai DAF,  kecocokan model (model fit) semakin baik. Pada model kita, DAF=0.96311. Artinya model baik karena angka ini mendekati 1. Lagi pula, kalau menurut NRStress model MDS adalah good-fit, maka DAF seharus menunjukkan hasil yang sama.

Perceptual Map

Final Coordinates

Out ini berisikan posisi setiap merek (x, y) dalam diagram kartesius. Lihat gambar yang digambar secara manual berdasarkan final coordinate. Hasilnya sama dengan perceptual map yang dberikan oleh SPSS.

Dimension
12
Estea-.565-.329
Fresh_Tea-.541.075
Fruit_Tea.594-.516
Lipton.663.075
Sosro.152.708
Tekita-.303-.013


Gambar 1. Perceptual Map dalam Diagram Kartesius berdasarkan Final Coordinates


Gambar 2. Perceptual map output SPSS. Keterangan: Gambar diedit dengan SPSS untuk memperindah tampilan

Mana bersaing paling dekat mana?

Pertanyaan ini dapat dijawab dengan menggunakan perceptual map dan data distances. Secara visual dalam perceptual map terlihat bahwa merek yang posisinya paling berdekatan adalah Fresh Tea dan Tekita. Kedua merek inilah yang bersaing paling dekat. Kesimpulan ini diperkuat oleh data distance, di mana distance paling rendah adalah antar kedua merek, yaitu 0.253. Distance paling tinggi adalah antara Sosro dan Lipton, yaitu 1.302. Berarti kedua merek inilah yang paling tidak bersaing.

Distances
EsteaFresh_TeaFruit_TeaLiptonSosroTekita
Estea.000
Fresh_Tea.405.000
Fruit_Tea1.1741.280.000
Lipton1.2931.204.595.000
Sosro1.261.9391.302.814.000
Tekita.411.2531.029.970.853.000

Perlu diketahui bahwa distance dimaksud adalah jarak dalam diagram Kartesius. Jarak ini dapat dihitung secara manual karena ada rumusnya. Silakan dicari rumusnya apabila dibutuhkan pembuktian output SPSS melalui perhitungan manual.

 

Memberi Nama Dimensi

Apa nama dimensi kesatu dan kedua? Dengan kata lain, berdasarkan apa peta persepsi tersebut dibentuk? Kita bisa menjawab kedua pertanyaan ini dengan memberi nama dimensi kesatu dan kedua. Pemberian nama dilakukan melalui pertimbangan (judgment) berdasarkan posisi setiap merek. Mari kita perhatikan Gambar 1 (Catatan: Gambar 1 dan Gambar 2 sama, namun Gambar 1 lebih mudah dilihat karena diberi sumbu).

Apabila berpatokan ke Sumbu X, Tekita, Fresh Tea dan Estea ada disebelah kiri, sedangkan Sosor, Lipton, dan Fruit Tea ada di sebelah kanan. Apa kira-kira dimensi yang membuat perbedaan demikian? Katakanlah rasa manis, di mana semakin ke kiri, rasanya lebih manis, semakin ke kanan, rasa manis berkurang.

Apabila berpatokan ke sumbu Y, maka Sosro berada di bagian atas dan Fruit Tea pada ujung bawah sumbu. Sebagaimana diketahui, Sosro adalah diposisikan teh merah klasik sedangkan Fruit Tea, sesuai namanya adalah teh rasa buah. Karena itu, kita bisa menamakan sumbu Y sebagai rasa teh, di mana semakin ke atas, semakin terasa sebagai teh merah dan semakin ke bawah semakin terasa sebagai rasa buah, seperti terlihat pada Gambar 3.

 

One Matrix Source

1. Download data dari sini. Buka data di SPSS.  Tampil datanya seperti ini.

2. Pada menu utama SPSS, pilih analyze, lalu Scale, setelah itu klik multimension scaling (PROXSCALL). Dalam SPSS, ada dua pilihan MDS.  Selain PROXSCALL, satu lagi adalah ASCALL. Untuk bentuk matrik seperti di atas,  PROXSCALL memberikan hasil lebih baik karena ada koordinat merek-merek mudah di-copy.  Jadi, kita pilih program ini.

3. Pada kotak dialog yang muncul, pilih: The data are proximities, One matrix source, Proximities are in a matrix across column, lalu klik Define.

4. Pada kotak dialog yang muncul, masukkan semua merek pada sel proximities.

5. Klik Model. Pada langkah ini:

  • Pastikan Shape adalah Lower-triangular matrix. Parena pola data kita dapat membentuk dua segitiga, yaitu di atas dan di bawah diagonal. Data di atas mengambil pola setiga bagian bawah.
  • Pastikan  Proximities adalah Dissimilarities. Bukankah judul menyatakan bahwa perceptual map yang kita bangun adalah berbasis Similarity? Betul. Namun, SPSS menginterpretasi bahwa semakin tinggi angka, semakin tinggi nilainya. Nah, pada data kita, semakin rendah angka, semakin tinggi similarity (kesamaan). Semakin tinggi angka, semakin tinggi dissimilarity (perbedaan).
  • Pastikan Proximities transformation adalah Ratio.

6. Klik Plot dan tandai Common space.

7. Klik Output dan tandai Comonspace coordinates, multiple stress source, dan Distances.

8. Klik OK. Sekarang kita interpretasi hasilnya.

Output

NRStress=0.03665 dan D.A.F=0.96335, artinya model adalah Good fit. Tucker coefficient of congruence tidak perlu diinterpretasi karena sumber kita hanya satu matrix. SPSS memberikan final coordinates, commonspace, dan distances. Cara menginterpretasinya sama seperti kasus multiple source matrix di atas. Silakan dicoba sendiri.

Single Matrix versus Multiple Matrix Source

Berbicara mana yang dipakai tergantung kebutuhan. Sebagaimana diketahui, persepsi ada yang bersifat individual, ada pula yang bersifat publik. Apabila meneliti persepsi individual, misalnya posisi merek di benak individu, gunakan one matrix source. Apabila menginvestigasi persepsi sejumlah orang, gunakan multiple matrix sources.


REFERENSI

Borg, I., Groenen, P. (1997). MDS fit measures, their relations, and some algorithms. In: Modern Multidimensional Scaling. Springer Series in Statistics. Springer, New York, NY. https://doi.org/10.1007/978-1-4757-2711-1_11

Dugard, P., Todman, J., & Staines, H. (2010). Approaching Multivariate Analysis. A Practical Introduction. Second Edition. Routledge: New York. This text has example analyses using SPSS.

Multidimensional Scaling: Understanding

PERSEPSI adalah suatu proses, dengan mana seseorang menerima, menyeleksi dan menginterpretasi stimuli untuk membentuk gambaran yang menyeluruh dan berarti tentang dunia (Schiffman & Wisenblit, 2005).  Proses persepsi itu berlangsung dalam benak konsumen. Jadi sifatnya abstrak.  Sekali pun individu pemersepsi dapat memberikan deskripsi, tetapi persepsi yang kita tangkap, tidaklah objektif, melainkan subjektif.

Walaupun persepsi sulit diukur secara pasti karena sifatnya yang abstrak, para ahli tetap berusaha untuk memperoleh gambaran persepsi seseorang tentang suatu objek secara relatif dibanding dengan objek-objek lainnya. Objek bisa berupa produk, merek, toko, orang, partai politik, dan lain-lain.  Teknik yang digunakan dinamakan  multidimension scaling (MDS).

Sebagai salah satu teknik multivariat dalam golongan interdependenced technique, MDS adalah salah satu posedur yang digunakan untuk memetakan persepsi dan preferensi para responden secara visual dalam peta geometri.

Peta geometri tersebut, yang disebut spatial map atau perceptual map, merupakan penjabaran berbagai dimensi yang berhubungan.  Katakanlah kita memakai peta geometri berupa diagram kartesius. Peta ini dibentuk dengan dua dimensi, satu pada sumbu horisontal (sumbu X), satunya lagi pada sumbu vertikal (sumbu Y).

Setiap dimensi, yaitu X dan Y, sebenarnya mewakili berbagai atribut yang terlibat dalam pembentukan persepsi.  Bisa saja kita menilai sekumpulan merek berdasarkan sepuluh atribut.  Dalam MDS, kesepuluh atribut ini akan dipadatkan menjadi dua, tiga, empat atau lebih dimensi, tergantung kebutuhan. Konsepnya demikian, tetapi kalau dimensi berjumlah empat atau lebih, interpretasi sulit dilakukan.  Karena itulah, dalam MDS, umumnya dipakai dua atau tiga dimensi.

Memang, dalam pemasaran, MDS umumnya dipakai dalam  memetakan persepsi. Namun, menurut Malhotra (2020), informasi yang diberikan MDS dipakai dalam berbagai aplikasi pemasaran lainnya, seperti:

  1. Pengukuran citra (image measurement). Kita tahu bahwa imej adalah persepsi yang bersifat publik. Kalau peta persepsi setiap individu kita ukur, lalu kita lakukan perbandingan antar-individu, objek-objek yang menempati posisi yang relatif sama pada sebagian besar atau semua individu, tentu sudah memiliki imej yang kuat.
  2. Segmentasi pasar. Merek dan dan konsumen dapat diposisikan dalam peta yang sama (in the same space),  kemudian kelompok-kelompok konsumen dengan persepsi yang relatif homogen dapat diidentifikasi.
  3. Pengembangan produk baru (new product development). Melalui spatial map dapat terlihat area-area yang masih kosong atau yang pemainnya belum ada.  MDS dapat dipakai untuk mengevaluasi konsep-konsep produk baru dan merek-merek saat ini untuk mengetahui bagaimana konsumen mempersepsikan konsep-konsep baru.  Proporsi preferensi untuk setiap produk baru adalah sebuah indikator untuk mengetahui kesuksesannya.
  4. Menilai keefektifan iklan. Kalau iklan ditujukan untuk membentuk “brand position”, MDS dapat dipakai untuk mengukur apakah posisi yang diinginkan sudah tercapai, dengan kata lain, apakah iklan efektif dalam membentuk “brand position”.
  5. Analisis harga. Buatlah ‘spatial map’ dengan dan ‘tanpa memasukkan’ faktor harga.  Lalu, bandingkan kedua spatial maps.  Beda antara keduanya, mencerminkan dampak harga terhadap persepsi konsumen.
  6. Keputusan saluran (channel decision). Kalau kita melakukan judgement tentang kompatibilitas (compatibility) atas sejumlah merek dengan outlet yang berbeda-beda, maka informasi dari spatial maps yang terkait saluran distribusi tersebut, dapat dipakai sebagai bahan pertimbangan.  Misalnya begini.  Melalui MDS kita petakan sejumlah merek.  Ada sebuah merek, katakan merek A, menarik perhatian kita.  Lalu, kita ingin agar posisi merek kita sama dengan posisi merek A.  Lalu, kita selidiki praktek-praktek pemasaran yang dilakukan merek A, termasuk saluran distribusinya, lalu dijadikan sebagai bahan acuan dalam mendesain saluran distribusi merek kita.
  7. Konstruksi skala sikap. Teknik MDS dapat dipakai untuk mengembangkan skala pengukuran sikap.

MDS Dibanding Teknik-teknik Multivariate Lainnya

Ada dua keunikan MDS dibanding teknik-teknik multivariate lainnya. Pertama, analisis MDS dapat dilakukan pada level individu (disebut disaggregate analysis), selain level segmen maupun level agregat (disebut aggregate analysis).  Dalam disaggregate analysis, perceptual map diproduksi sebanyak objek atau subjek.

Teknik-teknik multivariat lain tidak ada yang seperti ini (mampu melakukan analisis disaggregat).

Kedua, kemampuan MDS untuk “menghasilkan” dimensi-dimensi tanpa keharusan mendeskripsikan atribut-atribut produk. Kata “menghasilkan” dibuat dalam tanda kutip bermakna bahwa MDS tidak menyatakan dimensi-dimensi itu secara eksplisit, akan tetapi melalui pertimbangan (judgement) peneliti.

ISU-ISU MDS

Sebelum melakukan MDS, ada beberapa isu yang perlu diperhatikan  oleh peneliti, seperti berikut ini.

Identifikasi Objek Relevan

 Peneliti perlu memeriksa objek-objek yang relevan.  Objek-objek yang tidak relevan akan mengganggu peta persepsi serta mempersulit interpretasi dimensi-dimensi perseptual di antara objek-objek yang diuji.  Sekiranya  ingin meneliti brand position Mitsubishi Kuda, tentu kita harus menyertakan merek-merek relevan, seperti Kijang, Panther, Taruna, Avanza, dan Xenia.

Batasan merek relevan bersifat subjektif. Untuk mempe-rolehnya, kita dapat melakukan riset pendahuluan, bisa pula berdasarkan data sekunder berupa data yang dipakai oleh pihak lain (misalnya majalah atau tabloid) sebelumnya.

Identifikasi Segmen Relevan

Seyogianya MDS dilakukan secara segmented, terutama bila tujuannya adalah mengidentifikasi brand position dan competitive position suatu merek. Informasi menyangkut kedua variabel ini lebih berharga apabila dinyatakan oleh segmen yang menjadi target pemasaran produk kita. Lagi pula, apabila pengambilan responden dilakukan sembarangan,  hasil penelitian berbasis analisis agregat tidak bisa dipertanggungjawabkan secara ilmiah.

Similarity Versus Preferensi

Setelah objek ditentukan, perlu pula ditentukan, berdasarkan apa persepsi terhadap objek-objek tersebut dipetakan, berdasarkan kesamaan (similarity) ataukah preferensi (preference)? Kedua jenis input data akan menghasilkan peta persepsi yang berbeda.

Dengan similarity, memang dimensi-dimensi objek dapat digali, akan tetapi determinasi pilihan tidak terungkap.  Artinya, kita tidak mengetahui kecenderungan pilihan responden.

Dengan preferensi memang pilihan terefleksi, akan tetapi, sulit membandingkan kesamaan antara satu objek dengan objek lain, sebab dimensi yang dipakai untuk membangun preferensi, bisa saja berbeda untuk objek yang berbeda. Misalnya, Roberto menempatkan mobil Jazz sebagai pilihan pertama karena irit bahan bakar. Pilihan kedua adalah Terrano karena desainnya yang gagah.  Sulit membandingkan kesamaan kedua merek tersebut dalam peta persepsi karena atribut dasar pembentukan preferensi berbeda.

Desain Riset

Perlu ditentukan, apakah dalam MDS kita meng-gunakan desain decompositional (attribute-free) ataukah compositional (atrribute-based).  Desain  decompositional kita  hanya mengukur kesan umum (general impression).  Pada saat membandingkan Kuda dan Kijang, kesamaan di antara keduanya, ataupun preferensi pada keduanya, oleh responden dihasilkan hanya berdasarkan kesan umum.  Artinya, responden tak perlu menguraikan alasan atas persepsi atau pun prefensinya.

Dengan metoda compositional, kita mengukur kesan  atas sejumlah merek berdasarkan sekumpulan atribut. Dengan menggunakan teknik pengukuran tertentu (biasanya skala numerik ataupun semantic differential scale), kita meminta responden memberikan peringkat (rating) setiap merek pada sejumlah atribut.

Kesamaan diukur dengan membandingkan data setiap objek, umumnya dengan cara melakukan korelasi antar-objek.  Kesa-maan turunan (derived similarity) kemudian diolah dengan menggunakan analisis faktor ataupun analisis diskriminan untuk mengidentifikasi dimensi-dimensi yang dipakai responden untuk membedakan objek-objek tersebut.

Berdasarkan isu-isu di atas, kita dapat mengetengahkan berbagai metoda dalam membuat peta persepsi.  Namun, perlu diingat bahwa MDS hanya salah satu cara untuk membuat pemetaan persepsi (perceptual mapping) (Gambar 1).

Gambar 1. Pendekatan Membuat Perceptual Map

BENTUK-BENTUK MATRIK

Proksimiti (proximity), yang disebut juga jarak psikologis (psychological distance), merupakan ukuran empiris kedekatan atau kesamaan pasangan-pasangan objek. Tabel-tabel yang berisikan data proksimiti disebut matrik.  Ada tiga bentuk matrik yang umum dijumpai dalam MDS, seperti dijelaskan berikut ini.

Intact unconditional proximity matrix.  Disebut utuh (intact)  karena setiap sel (kecuali diagonal utama) berisikan data yang mengindikasikan tingkat kesamaan (similarity) ataupun ketidak-samaan (dissimilarity) suatu pasangan stimuli relatif terhadap pasangan-pasangan stimuli lain. Disebut unconditional  karena setiap sel dapat dibandingkan dengan sel lain secara langsung. Karena jumlah baris dan kolom sama, sebagai matrik, tabel-tabel tersebut juga tergolong sebagai matrik simertis (symmetric).

Tabel 1. Contoh Intact unconditional proximity matrix.

EsteaFresh TeaFruit TeaLiptonSosroTekita
Estea
Fresh Tea4....
Fruit Tea1012...
Lipton11133..
Sosro147155.
Tekita12896

Intact conditional proximity matrix adalah tabel yang kesamaan atau ketidaksamaan hanya dapat dinilai pada suatu kondisi, yaitu antar  baris atau kolom kolom saja. Pada Tabel 2, yang dijadikan sebagai contoh, kesamaan atau perbedaan antar merek (kolom) dievaluasi berdasarkan atribut (baris).  Misalnya, untuk atribut rasa, , kita membandingkan peringkat setiap merek atribut tersebut, yang secara tidak langsung menyatakan  kesamaan atau perbedaan dengan merek lain pada atribut yang sama.  Otomatis, angka-angka pada baris pertama, tidak bisa dibandingkan dengan angka-angka pada baris kedua dan lainnya.  Yang bisa dibandingkan hanya data antar kolom. Karena kesamaan hanya dapat dinilai pada suatu kondisi (hanya antar  baris saja atau kolom), maka  matrik demikian disebut intact conditional proximity matrix.

Tabel 2. Contoh Intact conditional proximity matrix

AtributPersepsi Merek Susu Kental
ABCDE
Rasa67557
Aroma57667
Kekentalan66556
Harga75657

Tabel seperti ini cocok untuk metoda compositional. Seperti dijelaskan sebelumnya, dalam metoda ini, kita mengukur kesan  atas sejumlah merek berdasarkan sekumpulan atribut, biasanya dengan menggunakan teknik pengukuran tertentu, seperti skala numerik ataupun semantic differential scale.

Yang ketiga, objek-objek (disebut juga stimuli) ditempatkan pada kolom, sedangkan pada baris, ditempatkan responden (orang). Misalkan, kita ingin meminta responden untuk memberikan preferensi pada sejumlah objek, seperti ditampilkan pada Tabel 3.  Dengan demikian kita memperoleh off-diagonal conditional proximity matrix. Sama seperti pada matrik sebelumnya, pada matrik ini kita tidak bisa membandingkan nilai antar baris, yang bisa hanya data antar kolom.

Tabel 3. Contoh off-diagonal conditional proximity matrix

RespondenAtozAvanzaKarimunPicantoSparkXenia
1514362
2154236
3254316
4243561
5524361
6164236
7621453
8516243
9621543
10645123

Data preferensi pada Tabel 3 dapat diperoleh secara langsung maupun tidak langsung. Metoda tidak langsung dapat menggunakan model kompensatori dan pair-wise comparison.



 

Analisis Diskriminan Berganda

PADA analisis diskriminan ganda (multiple discriminant analysis), grup yang dimiliki tidak lagi dua, akan tetapi tiga, empat, atau lebih grup.  Kalau diaplikasikan pada dua grup, maka persamaan diskriminan yang dibentuk hanya ada satu.  Sedangkan kalau kita memiliki tiga atau lebih grup, maka persamaan diskriminan yang dibentuk adalah jumlah grup itu dikurang satu.  Jadi, kalau grup ada tiga grup sebagai variabel dependen, maka persamaan diskriminan yang dibentuk adalah dua, kalau grup ada lima, persamaan diskriminan ada empat, demikian seterusnya.

Apa yang dilakukan pada analisis diskriminan berganda, sama saja dengan yang dilakukan pada analisis disriminan dua grup.  Perbedaannya, selain  jumlah fungsi diskriminan, juga menyangkut cara memprediksi grup sebuah kasus atau seorang responden.

Penjelasan selanjutnya tentang konsep ini dilakukan dengan memakai contoh berikut. Seorang peneliti tertarik untuk mengetahui faktor-faktor apa yang mempengaruhi pilihan orang untuk berlibur. Dia mengamati bahwa pada masa liburan anak sekolah, tujuan berlibur ada tiga, yaitu: (1) di dalam kota, (2) ke luar kota, (3) ke luar pulau. Variabel-variabel independen yang dipakai sebagai prediktor adalah pendapatan keluarga (X1), sikap tentang pentingnya liburan untuk anak (X2), sikap terhadap perjalanan (X3), jumlah anak (X4) rata-rata usia anak (X5) dan  asal kepala keluarga (X6). Datanya dapat di-download dari sini. Ini datanya:

Tabel 1. Data yang Diolah

RespondenX1X2X3X4X5X6Tujuan  Berlibur
147.12531411
269.17631223
342.33321111
457832722
5758741533
643.22521622
756.21841412
837.32741421
949.34231533
1032.15431621
1137.53231111
1270.36741923
13356441731
14572451422
1550.4523612
1638.36621421
1762.97531833
1871.95842023
1948.5754611
2052.76641533
2146.25332132
2264.17541733
2350.25831022
2473.4675522
25625622233
2636.24322021
2744.1663912
28551222521
2941.85131722
3033.46822111

Sekarang mari kita interpretasi arti hasil analisis itu step-by-step.

Langkah-langkah Analisis dengan SPSS

Prosedur yang digunakan sama saja dengan analisis diskriminan dua grup.  Hanya saja, pada langkah kedua, pada kotak dialog Define range, pada sel minimum isikan angka 1 dan pada sel minimum isikan angka 3.  Lalu, ikuti langkah ke-3 dan langkah ke-4.  Setelah langkah ke-4, tambahkan satu langkah (sebelum langkah ke-5 pada), yaitu meng-klik menu Classify agar muncul kotak dialog Classification.  Lalu, tandai pilihan seperti pada gambar berikut.  Kemudian, klik Continue.

Interpretasi Output

Group Statistics

Group statistik  berisikan data tentang rata-rata dan standar deviasi setiap grup dan total sampel.  Data ini memberikan gambaran awal tentang diskriminasi sampel.  Artinya, sampel yang kita miliki akan terdiskriminasi dengan baik kalau data memenuhi dua hal.  Pertama, rata-rata variabel setiap grup berbeda . Kedua,  kalau standar deviasi dalam grup lebih rendah dibanding standar deviasi total karena kita mengharapkan homogenitas dalam grup yang tinggi (standar deviasi lebih rendah), sebaliknya antara grup yang satu dengan grup lainnya, kita mengharapkan heterogenitas yang tinggi (standar deviasi lebih tinggi).

Tabel 2. Group Statistics
Tujuan tempat berliburMeanStd. DeviationValid N (listwise)
UnweightedWeighted
1.00Pendapatan keluarga40.24557.170271111.000
Pentingnya liburan bagi anak4.09092.022601111.000
Sikap terhadap jalan-jalan4.45451.967921111.000
Jumlah anak2.8182.873861111.000
Rata-rata usia anak15.36365.296651111.000
Lama berumah tangga1.6364.674201111.000
2.00Pendapatan keluarga51.95009.480421010.000
Pentingnya liburan bagi anak4.50002.173071010.000
Sikap terhadap jalan-jalan4.70002.496661010.000
Jumlah anak3.30001.059351010.000
Rata-rata usia anak11.90005.300941010.000
Lama berumah tangga1.8000.632461010.000
3.00Pendapatan keluarga64.14448.6452599.000
Pentingnya liburan bagi anak6.11111.2693099.000
Sikap terhadap jalan-jalan5.77781.7159499.000
Jumlah anak3.4444.7264899.000
Rata-rata usia anak17.00003.0822199.000
Lama berumah tangga2.6667.5000099.000
TotalPendapatan keluarga51.316712.803853030.000
Pentingnya liburan bagi anak4.83332.018593030.000
Sikap terhadap jalan-jalan4.93332.099813030.000
Jumlah anak3.1667.912873030.000
Rata-rata usia anak14.70005.052483030.000
Lama berumah tangga2.0000.742783030.000

Rata-rata setiap variabel berbeda pada ketiga grup merupakan  indikasi bahwa sampel memang layak didiskriminasi. Namun, data standar deviasi tidak memenuhi syarat ideal di atas.  Sebab, standar deviasi X2 dan X5 lebih tinggi pada grup 1 dibanding pada total sampel.  Pada group statistics  terlihat bahwa standar deviasi X2, X3, X4, dan X5 pada grup 2 lebih tinggi ketimbang pada total sampel.  Hasil ini menimbulkan kecurigaan jangan-jangan keempat variabel tidak memiliki peran diskriminasi.  Untuk memastikannya, simak penjelasan test of equality of group means berikut.

Test of Equality of Group Means

Kebimbangan di atas terjawab dengan memeriksa signifikansi setiap variabel secara sendiri-sendiri.  Dengan memakai uji F, terlihat hanya X1 dan X6 yang memiliki signifikansi melewati batas µ=0.05 – batas tingkat kesalahan maksimal yang paling banyak dipakai.

Tabel 3. Tests of Equality of Group Means
Wilks’ LambdaFdf1df2Sig.
Pendapatan keluarga.40419.912227.000
Pentingnya liburan bagi anak.8153.066227.063
Sikap terhadap jalan-jalan.9261.082227.353
Jumlah anak.9091.358227.274
Rata-rata usia anak.8232.899227.072
Lama berumah tangga.6347.790227.002

Hipothesis nol yang diuji menyatakan bahwa koefisien diskriminasi setiap variabel sama dengan nol. Pada tingkat kesalahan 0,05 (kepercayaan 95%), kita tidak punya bukti untuk menolak hipothesis itu pada variabel-variabel X2, X3, X4 dan X5.

Mau diapakan variabel-variabel itu?  Tergantung tujuan kita.  Kalau tujuannya adalah menguji hipothesis tentang pengaruh variabel-variabel independen terhadap independen, maka semua variabel harus dilibatkan.  Akan tetapi, kalau untuk membangun model diskriminasi yang efektif, variabel-variabel tersebut dapat dieliminasi.  Akan tetapi, ada baiknya kita melakukan metoda stepwise discriminant analysis untuk memastikan apakah model baru yang dibangun (dengan membuang variabel-variabel itu satu demi satu atau sekaligus) lebih baik dari model awal kita.

Pooled Within-Group Matrices

Data ini menunjukkan korelasi antar-variabel.  Idealnya, secara teori, dalam analisis diskriminan, tidak terdapat kolinearitas antar-variabel.  Namun, pada Tabel 4 terlihat bahwa korelasi antara X1 dan X4 (r=0,353), X2 dan X5 (r=-0,387), X5 dan X4 (r=-0,294) serta antara X3 dan X4 (r=0,288). Angka-angka ini  mencurigakan cukup tinggi, yang menandakan adanya multikoniaritas di antara variabel-variabel tersebut, yang membuat model tidak efisien. Apakah kecurigaan ini terbukti bila dilakukan stepwise discriminant analysis, dengan mana variabel-variabel independen yang terlibat hubungan sesama (multikolinearitas) dapat dikeluarkan.

Tabel 4. Pooled Within-Groups Matrices

Pendapatan keluargaPentingnya liburan bagi anakSikap terhadap jalan-jalanJumlah anakRata-rata usia anakLama berumah tangga
CorrelationPendapatan keluarga1.000.022.273.353-.216-.231
Pentingnya liburan bagi anak.0221.000.077-.017-.387.118
Sikap terhadap jalan-jalan.273.0771.000.288-.082-.244
Jumlah anak.353-.017.2881.000-.294.014
Rata-rata usia anak-.216-.387-.082-.2941.000.397
Lama berumah tangga-.231.118-.244.014.3971.000

Box’s M

Box’s M test equality of group means bertujuan untuk mengetahui apakah ketiga kelompok sampel berasal dari populasi yang sama. Memang, syaratnya adalah semua unit analisis (anggota sampel) haruslah berasal dari populasi yang sama. Input yang digunakan adalah covariance.  Box’s M menguji Ho: Covariance ketiga grup adalah sama. Untuk memutuskan menerima ataukah menolah Ho digunakan nilai Box’s M yang didekati dengan nilai F. Dalam analisis diskriminan yang kita lakukan, nilai Box’s M=57.282 yang didekati dengan nilai F=0.904, dengan nilai Sig.=0.649. Dengan demikian, pada ∝=0.05, cukup bukti untuk menerima H0 bahwa covariance ketiga grup adalah sama.

Tabel 5. Nilai Box’s M

Box’s M57.282
FApprox..904
df142
df22038.359
Sig..649

Eigenvalues

Dari nilai eigenvalue yang tertera pada Tabel 6 terlihat bahwa fungsi 1 (function 1), dengan eigenvalue sebesar 2,757,  dapat menjelaskan 91 % varian.  Hal ini menunjukkan bahwa fungsi 1 memiliki kekuatan diskriminasi yang mumpuni.  Sebaliknya, fungsi 2 (function 2), dengan eigenvalue sebesar 0,274, hanya dapat menjelaskan 9% varian.    Memang, dalam analisis diskriminan berganda, tidak semua fungsi signifikan (Malhotra, 2020). Biasanya, kekuatan fungsi dalam analisis diskriminan ganda memang tidak sama.

Tabel 6. Eigenvalues

FunctionEigenvalue% of VarianceCumulative %Canonical Correlation
12.757a91.091.0.857
2.274a9.0100.0.463
a. First 2 canonical discriminant functions were used in the analysis.

Canonical correlation menunjukkan keeratan hubungan antara variabel-variabel independen dengan persamaan 1 (sebesar 0.857) dan persamaan 2 (sebesar 0.463).Canonical Correlation

Wilks’ Lamda

Apakah kedua fungsi signifikan?  Lihat nilai Wilks Lambda pada Tabel 7.  Terlihat nilai Wilks’ Lambda untuk kedua fungsi (1 through 2) sebesar 0,209.  Nilai ini ditransfer menjadi nilai Chi-square sebesar 38,355 yang memiliki tingkat signifikansi 0,000.  Tingkat signifikansi ini tentunya jauh di atas 0,05 yang umumnya diterima  sebagai batas maksimal tingkat kesalahan.

Tabel 7.  Wilks’ Lambda

Test of Function(s)Wilks’ LambdaChi-squaredfSig.
1 through 2.20938.35512.000
2.7855.9255.314

Sekiranya fungsi 1 dikeluarkan, maka fungsi 2 hanya memiliki Wilks’ Lambda sebesar 0.785, yang kalau dalam chi-square nilainya menjadi 5,517 dengan tingkat signifikansi 0,314 dan tergolong tidak signifikan.  Jadi, kalau hanya mengandalkan fungsi 2, maka proses diskriminasi tidak berguna.

Standardized Canonical Discriminant Function Coefficient

Pada Tabel 8 terlihat bahwa fungsi 1 memiliki koefisien yang relatif besar pada variabel X1 dan X6.  Artinya, kedua variabel inilah yang paling berperan dalam melakukan diskriminasi melalui fungsi 1.  Fungsi 2 memiliki koefisien yang besar pada variabel X2 dan X5.

Tabel 8.  Standardized Coefficients

Function
12
Pendapatan keluarga.907-.316
Pentingnya liburan bagi anak.234.609
Sikap terhadap jalan-jalan.102.114
Jumlah anak-.146.143
Rata-rata usia anak.1341.128
Lama berumah tangga.604-.281

Structure Matrix

Data pada structure matrix (Tabel 9) menunjukkan korelasi antara setiap variabel dengan kedua fungsi diskriminan.  Sekalipun komputer sudah memberikan hasilnya, data ini dapat kita hitung secara manual. Caranya, dengan meng-korelasikan nilai-nilai setiap variabel secara sendiri-sendiri dengan skor masing-masing fungsi diskriminan.

Tabel 9. Structure Matrix

Function
12
Pendapatan keluarga.720*-.400
Lama berumah tangga.448*.287
Pentingnya liburan bagi anak.284*.139
Sikap terhadap jalan-jalan.168*.092
Rata-rata usia anak.122.797*
Jumlah anak.169-.281*

Dari structure matrix terlihat lebih condong ke fungsi mana setiap variabel. Lihat tanda bintang pada koefisien korelasi.  Tanda bintang itu menandai dengan fungsi mana setiap variabel berkoalisi. Fungsi 1 berkorelasi paling tinggi dengan (sesuai urutan) X1, X6, X2 dan X3.  Dua variabel lain, yaitu X5 dan X4 (sesuai urutan) berkorelasi paling dekat dengan fungsi 2.

Canonical Discriminant Function Coefficients

Data ini menyatakan koefisien setiap variabel dalam kedua fungsi.  Sekali pun hanya X1, X6, X2 dan X3 yang berkoalisi dengan fungsi 1, tetapi dalam model diskriminan fungsi 1 semua variabel dilibatkan. Demikian pula pada model diskriminan fungsi 2.

Data pada output SPSS sebenarnya tidak salah. Namun, karena hanya tiga angka di belakang koma, kalau data ini dipakai untuk membangun model untuk menghitung Z score, maka skor diskriminan yang dihasilkan perhitungan manual bisa berbeda dari hasil SPSS, sekali pun tidak berbeda jauh.  Supaya puas, kopi dulu canonical discriminant function dari output SPSS ke Excel.  Pada Excel, kita bisa mengatur berapa pun angka di belakang koma.  Pada Tabel 10 kita peroleh koefisien lima angka di belakang koma dari Excel.

Tabel 10. Canonical Discriminant Function Coefficients Lima Angka di Belakang Koma.

Function
12
X10.107589-0.03744
X20.1238140.32258
X30.0488050.05467
X4-0.1613650.15813
X50.0282170.23740
X60.985852-0.45767
(Constant)-8.235827-2.98282

Unstandardized coefficients

Dengan data pada tabel, kedua fungsi memiliki persamaan sebagai berikut.

Dengan kedua persamaan ini, pada setiap responden, kita dapat menghitung skor diskriminan dengan fungsi 1 maupun untuk fungsi 2. Mari kita contohkan pada Responden 1. Ini datanya dari Tabel 1: X1=47.1, X2=2, X3=5, X4=3, X5=14, dan X6=1.

D1=-8.235827–0.107589(47.1)+0.123814(2)+ 0.048805(5)-0.161365(3)+0.028217(14)+0.985852(1)=-1.77994

D2=-2.98282–0.03744(47.1)+0.32258(2)+ 0.05467(5)+0.15813(3)+0.23740(14)-0.45767(1)=-0.48741

Dengan cara demikianlah skor diskriminan semua responden diperoleh, seperti ditampilkan pada Tabel 12 untuk Grup 1.  Buat apa skor ini? Skor ini dipakai untuk menempatkan responden 1 dalam diagram kartesius dengan koordinat (-1.77994,-0.48741). Lihat pada pembahasan tentang teritoral map.

Prediksi Keanggotaan Setiap Responden

Bagaimana kita memprediksi keanggotaan setiap responden?  Untungnya, data tentang keanggotaan responden juga diberikan oleh komputer berdasarkan peluang.  Responden 1 aslinya grup 1, diprediksi masuk grup 1 (kelompok yang berlibur di dalam kota) karena memang peluang ke grup 1 paling besar, yaitu 0,672. Responden 2, diprediksi masuk grup 3. Aslinya memang grup 3 (kelompok yang berlibur ke luar pulau). Peluang responden 2 masuk grup 3 sangat besar, yakni 0,936. Sedangkan ke grup 1 dan grup 2, peluang keanggotaan responden 2 kecil, masing-masing hanya 0,001 dan 0,063.

Responden 9 merupakan salah satu yang salah prediksi. Aslinya, dia ini masuk grup 3, akan tetapi tetapi diprediksi masuk grup 2 (kelompok yang berlibur ke luar kota). Salah prediksi seperti ini biasa dalam analisis diskriminan.

Functions at Group Centroid

Data ini menjelaskan rata-rata skor setiap grup, baik berdasarkan fungsi satu maupun berdasarkan fungsi dua. Mari kita ambil skor diskriminan dari Tabel 6.6 untuk menghitung centroid.  Karena keperluannya hanya untuk memperagakan, maka perhitungan hanya dilakukan untuk grup 1. Coba lakukan pada grup 2 dan 3 sebagai latihan.

Tabel 11. Functions at Group Centroids

Tujuan tempat berliburFunction
12
1.00-1.590.418
2.00-.282-.696
3.002.257.263

Tabel 12. Perhitungan Centroid Grup 1.

RespondenSkor diskriminan Fungsi 1Skor diskriminan Fungsi 2
1-1.78-0.487
3-2.193-0.965
8-1.912-0.311
10-2.0291.004
11-2.92-0.682
13-0.741.156
16-1.0350.571
19-1.397-0.668
26-1.4861.265
280.2570.726
30-2.2532.984
Rata-rata-1.5900.418

Classification Statistics

Cendroid grup diperlihatkan dalam territorial map.  Dengan menggunakan fungsi 1 dan fungsi 2 sebagai sumbu, setiap grup memiliki memiliki posisi, di mana titik koordinatnya adalah cendroid itu sendiri.

Berbeda dengan analisis diskriminan dua grup, pada model tiga grup atau lebih, cutting score tidak lagi dapat dipakai sebagai kriteria untuk memprediksi keanggotaan setiap objek (responden).

Untungnya, program sudah melakukan prediksi, selain memberikan peluang keanggotaan setiap objek.

Satu alat lagi untuk melihat keanggotaan setiap objek adalah dengan memeriksa peta teritorial.  Pada peta ini diperlihatkan teritorial setiap grup.  Kalau ada anggota grup masuk pada teritorial grupnya, berarti keanggotaan anggota itu diprediksi dengan tepat. Kalau aslinya anggota grup 1, tetapi masuk teritori grup 2, berarti keanggotaan anggota itu salah prediksi.

Bagaimana melihat apakah anggota-anggota setiap grup berada di dalam ataukah di luar teritorialnya?  Caranya dengan menggabungkan teritorial map  dengan scattergram.  Sebelumnya, skala kedua gambar itu harus disamakan terlebih dahulu agar sesuai.

Pertama-tama, kita buat dulu Scattergram semua responden berdasarkan skor D1 dan D2 yang dijadikan sebagai titik koordinat. Skor D1 dan D2 ada di tabel SPSS ya? Cara membuat scattergram dengan SPSS dapat dilihat di video ini (underconstruction). Ini Scattergram-nya.

Ini Teritorial Map yang diberikan SPSS

Kalau teritorial map ditimpakan ke scattergram, hasilnya begini.

Terlihat pada gambar di atas, ada 11 anggota Grup 1 yang diprediksi tepat masuk Grup 1. Yang salah prediksi masuk Grup 2 ada satu, yaitu responden nomor 28. Anggota Grup 2 yang diprediksi tepat ke Grup 2 adalah enam responden, dua salah prediksi ke Grup 1 (nomor 27 dan 29) dan ke Grup 3 dua responden (nomor 21 dan 24). Anggota Grup 3 yang tepat diprediksi ke Grup 3 ada delapan orang. Satu responden salah prediksi ke Grup 2, yaitu nomor 9. Hasil ini diperlihatkan pada Tabel 13 di bawah.

Dari 10 anggota grup 2, yang masuk ke teritorial grup 1 ada 2 dan ke teritorial grup 3 juga 2 anggota.  Yang diprediksi dengan tepat adalah 6 anggota (60%).  Dari 9 anggota grup 3, masuk wilayah grup 2 ada satu. Jadi, yang diprediksi tepat  8 anggota (88,89%).

Akhirnya, dari 30 total sampel, 24 orang diprediksi secata tepat keanggotaannya.  Artinya, hit ratio adalah 80%. Kesimpulan yang sama terdapat pada classification result (Output 11). Pertanyaannya, apakah kedua fungsi akurat dalam melakukan tugasnya?

Tabel 13. Classification Resultsa

Tujuan tempat berliburPredicted Group MembershipTotal
1.002.003.00
OriginalCount1.00101011
2.0026210
3.000189
%1.0090.99.1.0100.0
2.0020.060.020.0100.0
3.00.011.188.9100.0

a. 80.0% of original grouped cases correctly classified.


REFERENSI

Malhotra, N.K. (2020). Marketing Research: An Applied Orientation. Harlow, United Kingdom: Pearson Education

Analisis Diskriminan

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Pendahuluan

Sebagai dependence technic, analisis diskriminan sama regresi linier berganda (multivariabel regression), namun berbeda tujuan. Analisis diskriminan merupakan teknik yang akurat dalam memprediksi termasuk dalam kategori apa seseorang, dengan catatan data-data yang dilibatkan terjamin keakuratannya.  Dengan teknik ini, sebuah perusahaan asuransi, misalnya, dapat memprediksi apakah seorang nasabah baru akan bertahan terus sesuai dengan program ataukah berhenti membayar polis di tengah jalan.  Tentu dengan catatan model diskriminan yang dipakai akurat. Dengan teknik ini sebuah perusahaan juga dapat memprediksi apakah seorang karyawan baru akan memiliki produktivitas yang tinggi atau tidak.

Dalam analisis diskriminan variabel dependen adalah bersifat kategoris (menggunakan skala ordinal ataupun nominal) dan variabel independent menggunakan skala metrik (interval dan rasio).  Sama seperti regresi berganda, dalam analisis diskriminan, variabel dependen hanya satu, sedangkan variabel independent dua atau lebih (multiple). Misalnya, variabel dependen adalah pilihan merek mobil: Avanza, Xpander, Ertiga dan Xenia.  Variabel independen adalah rating setiap merek pada sejumlah atribut (misalnya: konsumsi bahan bakar, tenaga mesin, eksterior, interior, harga jual kembali, spare-part, dan lain-lain), dengan skala numerik (internal atau rasio).

Dalam analisis diskriminan, variabel dependen dapat berupa variabel dua kategori (misalnya: nasabah bertahan, nasabah keluar di tengah jalan).  Teknik demikian dinamakan two-group discriminant analysis. Seringkali variabel dependen lebih dari dua kategori (misalnya, sangat loyal, cukup loyal, tidak loyal).  Teknik ini dinamakan multiple discriminant analysis.

PendahuluanIstilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Model Analisis Diskriminan

Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independent. Model dasar analisis diskriminan mirip dengan regresi berganda.  Bedanya, kalau variabel dependen regresi berganda dilambangkan dengan Y, maka dalam analisis diskriminan dilambangkan dengan D, yaitu:

D=b0+b1X1 + b2X2 + … bkXk

Di mana, D= skor diskriminan, b= konstanda, bi= koefisien diskriminan atatu bobot, dan Xk= prediktor atau variabel independent.

Dalam analisis diskriminan yang diestimasi adalah koefisien ‘b’, sehingga nilai ‘D’ setiap grup sedapat mungkin berbeda, yang terjadi saat rasio jumlah kuadrat antar grup (between-group sum of squares) terhadap jumlah kuadrat dalam grup (within-group sum of squares) untuk skor diskriminan setiap objek atau subjek, mencapai maksimum.  Berdasarkan nilai D itulah keanggotaan suatu objek atau subjek diprediksi.

Pendahuluan | Model Analisis Diskriminan | Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Istilah-istilah yang Digunakan

Sebelum membicarakan analisis diskriminan lebih jauh, ada baiknya kita membiasakan diri dengan koefisien-koefisien statistik yang dipakai untuk berbagai keperluan.

  1. Korelasi kanonikal (canonical correlation), mengukur tingkat asosiasi antara skor diskriminan dengan grup. Koefisien ini merupakan ukuran hubungan  fungsi diskriminan tunggal dengan sejumlah variabel dummy yang menyatakan keanggotaan grup.
  2. Centroid, adalah nilai rata-rata (mean) skor diskriminan untuk grup tertentu. Banyaknya centroid sama dengan banyaknya grup. Setiap centroid mewakili satu grup. Rata-rata untuk sebuah grup berdasarkan semua fungsi disebut group centroids.
  3. Cutting score adalah nilai rata-rata centroid yang dapat dipakai sebagai patokan mengelompokkan objek. Misalnya, kalau dalam analisis diskriminan dua grup cutting score adalah 0.15, maka keanggotaan suatu objek dapat dilihat apakah skor diskriminan objek tersebut di bawah ataukah di atas cutting score.
  4. Discriminant loadings (disebut juga structure correlations) merupakan korelasi linier sederhana antara setiap variabel independen dengan skor diskriminan untuk setiap fungsi diskriminan.
  5. Hit ratio merupakan nilai yang dapat menjawab: “Berapa persen objek yang dapat diklasifikasi secara tepat dari jumlah total objek”? Hit ratio merupakan salah satu kriteria untuk menilai kekuatan persamaan diskriminan dalam mengelompokkan objek.
  6. Matrik klasifikasi (classification matrix). Sering juga disebut confusion atau prediction matrix.  Matrik klasifikasi berisikan jumlah kasus yang diklasifikasikan secara tepat dan yang diklasifikasikan secara salah (misclassified).  Kasus yang diklassifikasi secara tepat muncul dalam diagonal matrik, tempat di mana  grup prediksi (predicted group) dan grup sebenarnya (actual group) sama.
  7. Koefisien fungsi diskriminan (discriminant coefficient function). Koefisien fungsi diskriminan (tidak distandarisasi) adalah pengali (multipliers) variabel, di mana variabel adalah dalam nilai asli pengukuran.
  8. Skor diskriminan (discriminant score). Koefisien yang tidak distandarisasi (unstandardized score) dikalikan dengan nilai-nilai variabel.
  9. Eigenvalue. Untuk setiap fungsi diskriminan, eigenvalue adalah rasio antara jumlah kuadrat antar kelompok (sums of squares between group) dengan jumlah kuadrat dalam kelompok (sums of squares within group).  Eigenvalue yang  besar menunjukkan fungsi yang semakin baik.
  10. Nilai F dan signifikansinya. Nilai F dihitung melalui ANOVA satu arah, di mana variabel-variabel yang dipakai untuk mengelompokkan (grouping variable) berlaku sebagai variabel independen kategoris (categorical independent variable). Sedangkan setiap prediktor, diperlakukan sebagai variabel metrik.
  11. Rata-rata grup dan standar deviasi grup. Rata-rata grup dan standar deviasi grup dihitung untuk setiap grup.
  12. Pooled-with correlation matrix, menyatakan korelasi antar variabel independen, yang dihitung dengan mencari rata-rata matrik covarians tersendiri untuk semua grup.
  13. Koefisien fungsi diskriminan terstandarisasi (standardized discriminant functions coefficient), merupakan koefisien fungsi diskriminan yang dipakai sebagai pengali (multipliers) pada saat variabel telah distandarisasi dengan menjadikan rata-rata 0 dan standar deviasi 1.
  14. Korelasi struktur (structure correlations), yang juga disebut discriminant loadings, merupakan korelasi yang merepresentasikan korelasi sederhana (simple correlation) antara prediktor-prediktor dan fungsi diskriminan.
  15. Matrik korelasi total (total correlation matrix). Diperoleh kalau setiap kasus (objek penelitian) dianggap berasal dari satu sampel (single sampel) dan korelasi dihitung.  Dengan begitu, matrik korelasi total dapat diperoleh.
  16. Wilks’ λ. Kadang-kadang juga disebut statistic U. Untuk setiap prediktor, Wilks’ λ adalah rasio antara antara jumlah kuadrat dalam kelompok (within-group sums of squares) dan jumlah kuadrat total (total sums of squares). Nilainya berkisar antara 0 sampai 1.  Nilai Lambda yang besar (mendekati 1) menunjukkan bahwa rata-rata group cenderung tidak berbeda.  Sebaliknya, nilai Lambda yang kecil (mendekati 0), menunjukkan rata-rata grup berbeda.

Melakukan Analisis Diskriminan

Merujuk pada Malhotra (2006), analisis diskriminan terdiri dari lima tahap, yaitu: (1) merumuskan masalah, (2) mengestimasi koefisien fungsi diskriminan, (3) memastikan signifikansi determinan, (4) menginter-pretasi hasil dan (5) menguji signifikansi analisis diskriminan.[i]

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang DigunakanMengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Merumuskan Masalah

Tahap ini mencakup jawaban atas pertanyaan: “Kenapa analisis diskriminan dilakukan (latarbelakang masalah) dan apa tujuan analisis diskriminan, termasuk variabel-variabel apa yang dilibatkan?  Kalau analisis diskriminan dipakai sebagai alat analisis dalam sebuah penelitian formal (skripsi dan thesis), tahap pertama, kedua dan ketiga dijelaskan pada metodologi penelitian.

Saat ini analisis diskriminan sangat mudah dilakukan karena banyaknya software pendukung. Namun, karena software akan melakukan tugasnya begitu data dimasukkan, perlu dipastikan terlebih dahulu bahwa instrumen yang digunakan akurat (baik secara teori maupun statistik) dan datanya reliabel.  Sebab, pameo “Garbage in garbage out”, belaku juga untuk analisis diskriminan.

Pada tahap ini peneliti juga mengidentifikasi sasaran, variabel dependen (disebut juga criterion variable), serta variabel independen.  Variabel dependen harus berisikan dua atau lebih kategori, di mana antara satu kategori dengan kategori lain bersifat terpisah (mutually exclusive).  Sekiranya variabel dependen memakai skala metrik (interval ataupun rasio), skala variabel dependen tersebut harus dirubah menjadi kategori terlebih dahulu.  Misalnya, sikap yang kita ukur dengan skala numeric berskala 1 sampai tujuh, dapat dirubah menjadi dua kategori (comfortable dan uncomfortable) atau tiga kategori (comfortable, neutral dan uncomfortable) atau lainnya.

Jangan terlalu kaku dalam menetapkan batas antar kategori, sebab kita harus melihat proposi setiap kategori.  Kalau tidak proporsional, misalnya satu kategori berisikan 98% sedangkan kategori lain hanya 2% dari total objek, maka batas kategori (cut-off) dapat digeser, sampai ditemukan jumlah objek yang proporsional pada setiap kategori yang dibentuk. Pemilihan variabel prediktor pun harus didasarkan pada teori ataupun riset sebelumnya.

Tahap selanjutnya adalah membagi sampel ke dalam dua bagian.  Satu bagian berfungsi sebagai sampel estimasi atau sampel analisis.  Sesuai dengan namanya, sampel ini dipakai untuk mengestimasi fungsi diskriminan.

Satu bagian lagi disebut holdout atau sampel validasi (validation sampel), disimpan untuk mem-validasi fungsi diskri-minan. Kalau jumlah sampel besar, maka sampel dapat dibagi dua, setengahnya sebagai sampel analisis, setengahnya lagi  sampel validasi.

Ada baiknya memperhatikan distribusi dalam sampel total. Seandainya sampel total berisikan 30% responden yang loyal dan 70% responden yang tidak loyal, maka setelah pembagian, diharapkan ditemukan pula distribusi yang sama pada sampel analisis (30% responden loyal dan 70% responden tidak loyal) dan sampel validasi (30% responden loyal dan 70% responden tidak loyal.

Validasi fungsi diskriminan perlu dilakukan berulang-ulang.  Setiap kali, sampel perlu di-split ke dalam bagian analisis dan validasi.  Fungsi diskriminan perlu diestimasi, kemudian validasi dilakukan.  Jadi, keakuratan fungsi didasarkan pada sejumlah percobaan.

Contohnya, kita ingin kita ingin mempelajari faktor-faktor apa yang mempengaruhi para dosen dalam memilih jalur penelitian dalam sebuah perguruan tinggi: lewat lembaga Litbang dan penelitian sendiri. Ukuran sampel 50 orang.  Dari jumlah itu, sebanyak 30 dosen dijadikan sampel analisis (Tabel 1).  Sisanya, 20 dosen, dijadikan sebagai sampel validasi. Para dosen yang memakai dana Litbang diberi kode 1 dan yang memakai dana sendiri diberi kode 2.  Distribusi kedua bagian dalam hal penelitian sendiri dan penelitian lewat Litbang, pada kedua sampel dapat dikatakan berimbang.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Mengestimasi Fungsi Diskriminan

Estimasi dapat dilakukan setelah sampel analisis diperoleh.  Ada dua pendekatan umum yang tersedia.  Pertama, metoda langsung (direct method), yaitu suatu cara mengestimasi fungsi diskriminan dengan melibatkan variabel-variabel prediktor sekaligus.  Setiap variabel dimasukkan tanpa memperhatikan kekuatan diskriminan masing-masing variabel. Metoda ini baik kalau variabel-variabel prediktor dapat diterima secara teoritis.

Kedua, stepwise method.  Dalam metoda ini, variabel prediktor dimasukkan secara bertahap, tergantung pada kemampuannya melakukan diskriminasi grup.  Metoda ini cocok kalau peneliti ingin memilih sejumlah variabel prediktor untuk membentuk fungsi diskriminan.

Contoh soalDosen-dosen Universitas Internasional, sebuah perguruan tinggi swasta, diwajibkan untuk melakukan penelitian (riset) ilmiah minimal sekali setahun.  Untuk membantu  dosen-dosen melakukan riset, perguruan tinggi itu menyediakan dana yang dapat diperoleh setelah proposal penelitian para dosen dianggap layak oleh lembaga penelitian dan pengembangan (litbang) perguruan tinggi itu.  Para dosen yang merasa mampu juga dapat melakukan penelitian tanpa harus melalui lembaga litbang.

Ternyata, sekalipun Universitas Internasional menyediakan dana penelitian, lebih banyak dosen yang melakukan penelitian dengan biaya sendiri.

Untuk mengetahui penyebab kenyataan ini, dilakukan penelitian terhadap 50 dosen yang melakukan penelitian, 24 di antaranya lewat litbang, 26 menggunakan biaya sendiri.  Empat variabel yang dijadikan sebagai variabel independen adalah gaji (X1), sikap terhadap litbang (X2), kemampuan melakukan riset (X3), dan daya tarik topik (attractiveness) yang diteliti (X4).

Untuk pembelajaran, kita gunakan angka 1 (satu) mewakili penelitian lewat litbang dan angka 2 (dua) untuk penelitian yang dibiaya sendiri. Apakah harus angka 1 dan 2? Tidak juga. Angka berapa pun boleh, misalnya 1 dan 3 atau 3 dan 6. Angka tersebut dipakai SPSS hanya sebagai perlambang. Namun, ada baiknya di dalam SPSS, kolom value variabel ‘jalur’ dirinci, seperti pada contoh data di bawah ini.

Sampel dibagi dua secara acak. Hasilnya dibandingkan dengan harapan bahwa hasil yang diberikan kedua sampel sama.  Dalam penelitian ini ada 50 responden. Sebanyak 30 responden dipakai sebagai sampel analisis (Tabel 1), yang bisa di-download dari sini. Sisanya, 20 responden, dijadikan sebagai sampel holdout (Tabel 2). Datanya ada di sini.

Tabel 1. Sampel Utama

RepondenJalur Pilihan X1 X2 X3 X4
113.2567
214655
315.2555
414765
512.7656
613.5576
714657
815676
914576
1013.1565
1113.7676
1214.4665
1313.6777
1414667
1525564
1625.2454
1726545
1824554
1924.7545
2024.8444
2126.1335
2223345
2325455
2424445
2526344
2627244
2725.6544
2825.2434
2923.4455
3024.7545

Tabel 2. Sampel Holdout

RespondenJalur PilihanX1X2X3X4
113.1667
214.3665
315.1655
414.5675
513666
614576
714.2757
815.1677
913.6566
1014665
1124.7434
1225.7435
1324445
1425.1555
1524.2545
1624.7444
1726344
1825444
1925434
2024.2555

Langkah-langkah analisis

Langkah 1: Buka file SPSS sampel analisis.

Langkah 2: Prosedur: Analyze>Classify>Discriminant. Pada kotak dialog masukkan variabel ‘d’ sebagai gouping variables.  Kemudian, klik define range.  Lalu, pada kotak dialog kecil yang muncul, masukkan angka 1 pada sel minimum dan angka 2 pada sel maximum. Tampak di layar sebagai berikut:

Langkah 3: Untuk kembali pada kotak dialog disriminant, pada kotak dialog Define range, klik Continue. Pada kotak dialog Discriminant analysis, klik Statistics, kemudian, pada kotak dialog Statistics, tandai sel Means, Univariate ANOVA, Box.s M, Unstandardized dan Within-goups correlations. Lalu, klik Continue.

Langkah 4: Klik Classify, lalu tandai pilihan-pilihan di bawah ini.

Langkah 5.  Dari kotak dialog Discriminant analysis, klik Save, kemudian pada kotak dialog save yang muncul sesudahnya, pilih fasilitas-fasilitas seperti ditandai di bawah ini.  Dengan fasilitas-fasilitas tersebut, SPSS akan memprediksi keanggotaan setiap responden, skor diskriminan responden, serta peluang keanggotaan responden pada grup 1 dan grup 2.

Interpretasi Output

Hasil analisis diskriminan dimulai dengan analisis deskriptif.. Pada Output 1, dari statistik grup (group statistics) secara kualitatif terlihat bahwa beda rata-rata variabel setiap grup dan rata-rata total. Rata-rata  ini, kalau antar grup berbeda, mengindikasikan bahwa variabel-variabel di dalamnya berperan dalam mengelompokkan responden.  Sekiranya rata-rata sebuah variabel sama pada kedua grup, bolehlah kita percaya bahwa variabel tersebut tidak berperan dalam mengelompokkan objek (atau responden).

Group Statistics
Pilihan jalur penelitianMeanStd. DeviationValid N (listwise)
UnweightedWeighted
1.00Gaji3.8857.682591414.000
Kemampuan meneliti5.7857.699291414.000
Sikap penelitian6.0714.828741414.000
Kemenarikan topik5.9286.828741414.000
2.00Gaji4.98131.046401616.000
Kemampuan meneliti4.0625.928711616.000
Sikap penelitian4.2500.774601616.000
Kemenarikan topik4.5000.516401616.000
TotalGaji4.47001.041273030.000
Kemampuan meneliti4.86671.195783030.000
Sikap penelitian5.10001.213433030.000
Kemenarikan topik5.1667.985533030.000

Standar deviasi juga mengindikasikan apakah sebuah variabel berperan baik sebagai diskriminator ataukah tidak.  Peran tersebut baik kalau  standar deviasi dalam grup lebih rendah dari standar deviasi total, sebab dalam grup tentu nilai-nilai variabel lebih homogen.  Pada Output 1, semua variabel memenuhi syarat ini, kecuali variabel gaji, di mana standar deviasi gaji (variabel X1) grup 2 (Sdev=1.04640 ) lebih tinggi dibanding standar deviasi totalnya (Sdev=1.04127).  Memang, seperti dijelaskan nanti, pengaruh  variabel ini pada perbedaan jalur pilihan peneliti adalah paling rendah.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi DiskriminanPooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Tests of Equality of Group Means

Tests of Equality of Group Means memeriksa apakah setiap variabel independen menjalankan fungsi diskriminasi. Pada tabel di bawah ini,  dengan  α=0,05, maka nilai signifikansi nilai F menunjukkan bahwa ketika diperiksa secara sendiri-sendiri, semua  variabel prediktor signifikan (karena nilai signifikansinya di bawah α=0,05).

Tests of Equality of Group Means
Wilks’ LambdaFdf1df2Sig.
Gaji.71511.161128.002
Kemampuan meneliti.46532.176128.000
Sikap penelitian.42038.687128.000
Kemenarikan topik.45933.002128.000

Hipothesis yang diuji adalah:

H0: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah sama.
Ha: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah tidak sama.

Dengan nilai sig. semua variabel di bawah 0.05, punya cukup bukti untuk menolak H0 dan menyatakan bahwa memang rata-rata variabel pada kedua grup diskriminan yang terbentuk adalah berbeda.

Karena hanya dua grup yang dibentuk, maka fungsi diskriminan hanya ada satu, dengan eigenvalue sebesar 2,993, yang sudah mencakup 100 % varians yang dijelaskan (explained variance).

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group MeansBox’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Pooled within-groups correlation matrix

Analisis diskriminan mengharapkan korelasi yang rendah antar prediktor. Kita mengambil kesimpulan secara kualitatif.  Pooled within-groups correlation matrix mengindikasikan korelasi yang rendah antar prediktor, sehingga, multikolinearitas dapat diabaikan.

Pooled Within-Groups Matrices
GajiKemampuan menelitiSikap penelitianKemenarikan topik
CorrelationGaji1.000-.184-.180-.291
Kemampuan meneliti-.1841.000.213.081
Sikap penelitian-.180.2131.000.070
Kemenarikan topik-.291.081.0701.000

Pada tabel di atas terlihat bahwa nilai korelasi tertinggi terjadi antara gaji dan kemenarikan topik dengan nilai absoulut 0.291. Kalau kita tetapkan r>0.70 sebagai batas nilai korelasi tinggi, korelasi antar variabel variabel adalah rendah (r<0.70) dan bisa diabaikan. Jadi, model diskriminan kita bebas dari multikolinearitas.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation MatrixTingkat Kepentingan Prediktor | Cutting Score | Hit Ratio

Box’s M Test of Equality

Apakah kedua grup berasal dari populasi yang sama?  Syaratnya memang demikian. Untuk menjawabnya, perlu dipastikan bahwa matrik covariance kedua grup sama. Untuk membuktikannya, digunakan Statistik Box’s M.  Statistik ini menguji hipothesis:

Ho: Matrik covariance kedua grup sama, artinya kedua grup berasal dari populasi yang sama
Ha: Matrik covariance kedua grup tidak sama, artinya kedua grup tidak berasal dari populasi yang sam

Box’s M Test of Equality of Covariance Matrices

Box’s M10.892
FApprox..918
df110
df23581.580
Sig..515
Tests null hypothesis of equal population covariance matrices.

Untuk contoh ini, nilai Box’s M adalah 10.892 dengan nilai sig.=0.515. Dengan demikian, pada α=0.05, tidak cukup bukti menolak Ho. Jadi, matrik kovarian kedua grup adalah sama. Dengan demikian, berdasarkan Box’s M, analisis diskriminan layak dilakukan.

Korelasi kanonikal adalah 0,866.  Koefisien determinan (r2) diperoleh dengan memangkat-duakan korelasi kanonikal: (0,866)2=0,750.  Angka ini mengindikasikan bahwa 75% varian variabel dependen  dapat dijelaskan oleh variabel-variabel independen.

Eigenvalues
FunctionEigenvalue% of VarianceCumulative %Canonical Correlation
12.993a100.0100.0.866
a. First 1 canonical discriminant functions were used in the analysis.

Eigenvalue yang tinggi (lebih dari 1.00) menyatakan  jumlah kuadrat antar kelompok atau sums of squares between group (SSbetween) lebih tinggi dibanding jumlah kuadrat dalam kelompok atau sums of squares within group (SSwithin). Perlu diketahui, SSwithin  dihitung berdasarkan selisih antara skor setiap unit analisis dengan skor rata-dalam grup.  SSbetween dihitung berdasarkan selisih antara skor setiap unit analisis dalam grup dengan rata-rata skor rata-rata semua unit analisis. Contoh perhitungan  bisa dilihat di sini.

Uji Signifikansi

Tak ada gunanya mengintepretasi hasil analisis diskriminan kalau fungsinya tidak signifikan. Yang dimaksud signifikan adalah mampu melakukan fungsi diskriminasi dengan nyata. Hipothesis yang mau diuji adalah:

H0:   Rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup) adalah sama.
Ha:  Rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup) adalah berbeda.

Dalam SPSS, uji dilakukan dengan menggunakan Wilks’ λ. Kalau beberapa fungsi diuji sekaligus, sebagaimana dilakukan pada analisis diskriminan, statistik Wilks’ λ adalah hasil  λ univariat untuk setiap fungsi.

Wilks’ Lambda
Test of Function(s)Wilks’ LambdaChi-squaredfSig.
1.25036.0014.000

Nilai Wilk’s lambda ditransformasi menjadi nilai chi-square.  Pada hasil Output 4  terlihat bahwa Wilks’ λ berasosiasi sebesar 0,250 dengan fungsi diskriminan. Angka ini kemudian ditransformasi menjadi chi-quare dengan derajat kebebasan (ditulis df, singkatan dari degree of freedom) sebesar 4.  Nilai chi-square adalah dengan nilai 36,001.  Kesimpulannya,  cukup bukti untuk menolak H0 dengan nilai sig.=0,000.  Jadi, setelah analisis diskriminan dilakukan, rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup) adalah berbeda. Dengan demikian kita dapat menyimpulkan bahwa fungsi memiliki kemampuan melakukan diskriminasi.

Sama-sama menggunakan nilai Wilks’ Lambda. Apa beda uji signifikansi dengan Test of Equality of Group Means? Uji signifikasi adalah uji kelayakan model. Test of Equality of Group Means adalah uji kelayakan variabel.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of Equality | Cutting Score | Hit Ratio

Tingkat kepentingan prediktor

Untuk menjawab pertanyaan: “Variabel independen (disebut juga ‘variabel prediktor’ atau ‘prediktor’ saja) mana saja yang paling berperan (berkontribusi) dalam melakukan diskriminasi?”  Pertama lihat “standardized coefficient”. Secara relatif, prediktor yang memiliki ‘standardized coeficient’ yang lebih besar menyumbangkan kekuatan diskriminasi (discriminating power) yang lebih besar terhadap fungsi, dibanding prediktor yang memiliki standardized coefficient lebih kecil.  Jadi, seperti terlihat pada Output 5, dengan skor 0,545, prediktor ‘daya tarik topik’, memiliki tingkat kepentingan paling tinggi.  Dengan skor -0,026 prediktor gaji memiliki peran yang paling kecil.

Standardized Canonical Discriminant Function Coefficients
Function
1
Gaji-.026
Kemampuan meneliti.456
Sikap penelitian.539
Kemenarikan topik.545

Kedua, peneliti juga bisa menggunakan structure matrix, yang juga disebut canonical loadings dan discriminant loadings.   Jangan perhatikan negatif atau positifnya.  Perhatikan nilai mutlaknya. Pada Output 6, dengan structure matrix, kita dapat menyimpulkan bahwa peran diskriminasi dari yang tertinggi sampai terendah adalah kemampuan peneliti, daya tarik topik, sikap terhadap litbang dan gaji dosen.

Structure Matrix
Function
1
Sikap penelitian.679
Kemenarikan topik.627
Kemampuan meneliti.620
Gaji-.365
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions.  Variables ordered by absolute size of correlation within function.

Cara ketiga, kita dapat menggunakan nilai F setiap prediktor, yang disebut univariate F ratio.  Semakin besar nilai  F, kontribusi terhadap diskriminasi semakin tinggi.

Nah, sekarang kita bandingkan tingkat kepentingan prediktor berdasarkan ketiga kriteria di atas, seperti pada tabel di bawah. Kesimpulan kita memang bisa berbeda, tergantung dari mana kita melihatnya. Disarankan, peneliti cukup menggunakan satu kriteria saja agar kesimpulan yang berbeda dapat dihindarkan.

VariabelStandardized CoefficientDiscriminant LoadingsUnivariate F Ratio
NilaiRankingNilaiRankingNilaiRanking
X1-0.025574-0,365411.161234
X20.45556830,620332.17563
X30.53933620,679138.686851
X40.54500310,627233.001842

Dengan menggunakan ‘canonical discriminant function coefficients,  kita dapat membentuk fungsi diskriminan, yaitu:

     D = -10.125 – 0,029X1+ 0,674X2 + 0,549X3+0,802X4

Sebetulnya, koefisien di atas merupakan penyederhanaan dengan memberikan angka tiga desimal di belakang koma, seperti dihasilkan oleh program SPSS. Kalau output SPSS kita impor dengan program Excel, maka angka di belakang koma nilai koefisien lebih banyak, sehingga dengan memakai angka demikian, perhitungan skor diskriminan secara manual lebih presisi. Cara mengimpor adalah dengan mengkopi tabel  output SPSS itu, lalu membuka Excel, terus melakukan Paste pada file yang telah dibuka itu. Hasilnya, seperti pada Output 7.

Dengan program SPSS sebenarnya  kita tidak perlu lagi menghitung skor diskriminan (disebut juga Z scores) karena sudah disediakan oleh SPSS.  Akan tetapi, untuk meningkatkan pemahaman, kita perlu mengetahui dari mana datangnya skor-skor itu. Persamaan di bawah ini, yang menggunakan koefisien dari Output 7, dapat dipakai menghitung skor diskriminan dengan presisi tinggi karena angkanya enam di belakang koma.

D=-10.124622 – 0,028541X1 + 0,674008X +0,5488X3 + 0,802052X4

Sekiranya kita menggunakan skor diskriminan  yang telah diberikan oleh program komputer, maka persamaan pertama tidak bermasalah.  Persamaan ini baru bermasalah kalau kita menghitung skor diskriminan secara manual, sebab angkanya bisa berbeda (walaupun tidak banyak) dengan skor diskriminan yang diberikan komputer. Lihat pengerjaan manual di bawah ini.

Canonical Discriminant Function Coefficient dengan Enam Angka di Belakang Koma.

Canonical Discriminant Function Coefficients
Function
1
Gaji (X1)-0.028541
Kemampuan meneliti (X2)0.548800
Sikap terhadap penelitian (X3)0.674008
Daya tarik topik (X4)0.802052
(Constant)-10.124622
Unstandardized coefficients

Sumber: Output SPSS

Dengan persamaan kedua, untuk responden pertama, skor diskriminan adalah:

D=-10.124622 – 0,028541(3.2) + 0,5488(5) + 0,674008(6)  +0,802052(7) = 2,18646

Sedangkan dengan persamaan pertama, skor diskriminan adalah:

D=-10.126-0,029(3.2)+0,674(5)+0.549(6)+0.802(7)=2.3708

Hasilnya berbeda, bukan?  Memang, dengan persamaan pertamalah diperoleh semua skor pada Tabel 6,1.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan PrediktorHit Ratio

Cutting Score

Sebelum analisis diskriminan dilakukan, kita hanya mempunyai dua skor berdasarkan jalur yang dipilih, yaitu 1 dan 2. Angka 1 menyatakan penelitian yang dibiayai Litbang, angka 2 menyatakan penelitian atas biaya sendiri.  Skor diskriminan yang kita cari dapat dipakai untuk memprediksi jalur setiap responden,  apakah golongan 1 atau 2.  Misalnya, dengan skor diskriminan sebesar 2,18646, dapatkah kita prediksi masuk mana responden 1?  Jawabannya dapat.

Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan optimum cutting score.  Memang dari komputer, informasi ini sudah diperoleh.  Akan tetapi, tak ada salahnya kalau kita mengetahui cara mengerjakannya secara manual.

Rumus yang digunakan berbeda untuk grup yang proporsional (kedua grup mempunyai jumlah anggota yang sama) dan yang tidak proporsional (jumlah anggota kedua grup berbeda).

Untuk dua grup yang mempunyai ukuran yang sama cutting score dinyatakan oleh rumus:

Jadi, pembatasnya adalah 0,000.  Kalau di atas 0,000 masuk grup 1 dan kalau di bawah 0,000 masuk grup 2.  Oleh karena itu, responden 1 pada sampel holdout, dengan skor diskriminan 2,28368. Responden 11, dengan skor diskriminan -3,15108, masuk grup 2.  Dengan skor-skor yang ada, sekarang prediksilah setiap responden.

Apabila dua grup berbeda ukuran, seperti sampel analisis, maka rumus cutting score yang digunakan adalah:

Responden 1 sampel analisis diprediksi ke grup 1 skor diskrimi-nannya 2,18646.  Responden 3 yang aslinya masuk grup 1, diprediksi masuk grup 2 karena skor diskriminannya di bawah cutting score, yaitu -0,14431.  Ini namanya error atau misclassified.

Tanpa cutting score pun, sebenarnya kita dapat langsung memprediksi grup setiap responden, yaitu dengan melihat paling dekat ke centroid mana skor diskriminan masing-masing objek.  Misalnya, skor diskriman responden 1 sampel analisis, yang nilainya 2.18646, tentunya lebih dekat ke 1.787 (centroid grup 1) daripada ke -1,564 (centroid grup 2).  Oleh karena itu diprediksi masuk ke grup 1.  Responden 15 sampel analisis, dengan skor diskriminan -0,27107, tentu lebih dekat ke -1,564 (centroid grup 2) dan masuk grup 2.

Functions at Group Centroids
Pilihan jalur penelitianFunction
1
1.001.787
2.00-1.564

Program SPSS juga memberikan output berupa peluang unit unit analisis masuk grup 1 dan grup 2.  Ke grup mana peluang lebih besar, ke grup itulah unit analisis dimasukkan.  Responden 1 sampel analisis, misalnya, memiliki peluang ke grup 1 sebesar 0,99904 dan ke grup 2 sebesar 0,00096.  Tentunya, peluang ke grup 1 lebih besar, jadi ke grup itulah responden 1 bergabung.

Pendahuluan | Model Analisis Diskriminan | Istilah-istilah yang Digunakan |Merumuskan Masalah | Mengestimasi Fungsi Diskriminan |Test of Equality of Group Means |Pooled Within-Groups Correlation Matrix |Box’M Test of EqualityTingkat Kepentingan Prediktor | Cutting Score

Hit ratio

Hit rasio adalah persentase kasus atau responden yang kelompoknya dapat dipreksi secara tepat. Kalau jumlah seluruh kasus sampel analisis (atau responden) adalah 30 (pada kedua grup), lalu fungsi diskiminan dapat memprediksi 29 kasus secara tepat (hanya responden 3 yang error), maka hit ratio adalah 29/30=96,67%.  Tanpa menggunakan kriteria apa pun, karena mampu memprediksi grup keanggotaan 29 responden dari total 30 responden dan hanya satu yang salah prediksi, kita dapat menilai angka ini sangat bagus.

Classification Resultsa
Pilihan jalur penelitianPredicted Group MembershipTotal
1.002.00
OriginalCount1.0013114
2.0001616
%1.0092.97.1100.0
2.00.0100.0100.0
a. 96.7% of original grouped cases correctly classified.

Working with Holdout Sample

Dalam uraian di atas, persamaan diskriminan yang kita miliki adalah signifikan dan akurat (akurasi 96.7%). Pertanyaannya, apakah persamaan ini berlaku untuk seluruh populasi saat ini maupun yang akan datang? Pertanyaan lain, kalau ada dosen baru yang masuk, dapatkah diprediksi yang bersangkutan akan memilih jalur mana?

Pertanyaan kedua di atas ini sangat penting bagi berbagai pihak. Bagi para praktisi SDM, persamaan diskriminan dapat digunakan untuk memprediksi, apakah seorang calon karyawan akan sukses ataupun gagal. Untuk menjawab pertanyaan ini diperlukan persamaan diskriminan yang akurat.

Kegunaan holdout sample adalah membuktikan akurasi persamaan diskriminan, yang diperoleh melalui sampel analisisApabila persamaan tersebut dapat memprediksi keanggotaan holdout sample dengan hit ratio tinggi, maka persamaan diskriminan dapatlah dianggap akurat.

Ini persamaan diskriminan kita, yang diperoleh dari sample analisis:

D = -10.125 – 0,029X1+ 0,674X2 + 0,549X3+0,802X4

Dengan persamaan tersebut, kita dapat menghitung skor diskriminan setiap responden dengan bantuan fasilitas Transform>Compute Variables pada SPSS. Bagi pembaca yang belum tahu caranya, disediakan video pembelajaran (sabar ya, sedang dibuat). Skor diskriminan hasil prediksi ditampilkan pada gambar tabel SPSS di bawah.

Setelah skor diskriminan diperoleh, dicari jaraknya dengan centroid grup 1 dan grup 2. Keanggotaan responden ditentukan berdasarkan nilai jarak ke centroid yang lebih kecil. Contohnya, respoden 1 diprediksi masuk grup 1 karena jarak grup 1 (1.03) lebih kecil dibanding ke grup 2 (4.38). Oh ya, jarak ditentukan berdasarkan nilai absolut selisih antara skor diskriminan dan centroid (caranya bisa dilihat pada video).

Seperti diperlihatkan pada tabel SPSS di atas,  dengan membandingkan pilihan jalur aktual dan prediksi, fungsi diskriminan mampu memprediksi keanggotaan semua (100%) responden sample holdout. Hasil yang sama juga diperlihatkan pada tabel klasifikasi di bawah. Dengan hasil ini, dapat disimpulkan bahwa fungsi diskriminan memiliki akurasi tinggi.

Tabel Klasifikasi Responden Sample Holdout
Jalur Penelitian AktualPrediksi Jalur PenelitianTotal
1.002.00
OriginalCount1.0010010
2.0001010
%1.00100.0.0100.0
2.00.0100.0100.0
a. 100.0% of original grouped cases correctly classified.

Batas Hit-Ratio yang Layak

Pertanyaannya, bagaimana kalau hit rasio tidak sebaik itu (misalnya 60%), apakah fungsi diskriminan akurat?  Kalau ukuran setiap grup sama, lihat nilai kesempatan klasifikasi. Menurut Maholtra, kesempatan klasifikasi untuk grup berukuran sama adalah 1 dibagi jumlah grup.  Untuk sampel yang terdiri dari  2 grup, maka kesempatan klasifikasi adalah ½ atau 0,50 (Malhotra, 2020).

Hair et al. (2016) menyatakan bahwa kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan klasifikasi ditambah seperempatnya.  Kalau kesempatan klasifikasi adalah 50%, maka batas minimal hit rasio adalah 0,50 + (0,25) (0,50)=0,625 atau 62,5%. Kalau kita memiliki 4 grup, maka kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas minimal hit ratio adalah 31,25%.

Untuk sampel holdout kriteria ini dapat digunakan. Sayangnya, dua grup dalam sampel analisis tidak sama ukurannya. Kriteria kesempatan proporsional (proportional chance ciriterion) dapat dipakai kalau ukuran grup-grup tidak sama dan kalau tujuan peneliti adalah menentukan secara tepat keanggotaan objek pada dua (atau lebih) grup.  Rumusnya adalah:

CPRO=p2+(1-p2)

Di mana, p=proporsi responden pada grup 1 dan 1-p=proporsi responden pada grup 2.  Untuk sampel analisis, proporsi grup 1 adalah 46,67% dan proporsi grup 2 adalah 53,33%.  Dengan kedua proporsi ini, maka kita memperoleh  CPRO=(0, 4667)2+(0,5333)2=0,5022=50,22.

Akurasi Statistik

Kita dapat menguji secara statistik apakah klasifikasi yang kita lakukan (dengan menggunakan fungsi diskriminan) akurat atau tidak.  Uji statistik yang digunakan dinamakan Press’s Q Statistic.  Ukuran sederhana ini membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup.  Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai kritis (critical value) yang diambil dari tabel Chi-Square dengan derajat kebebasan satu (ditulis dk=1 atau df=1 atau v=1) dan tingkat keyakinan sesuai keinginan kita.  Statistik Q ditulis dengan rumus:

Di mana, N= ukuran total sampel, n= jumlah kasus yang diklasifikasi secara tepat dan K = jumlah grup. Untuk sampel analisis, kita dapat menghitung:

Dengan α=0,05 dan df=1, nilai X2 tabel adalah 3,841.  Dengan demikian, dapat kita simpulkan bahwa fungsi diskriminan kita akurat.

Multiple Discriminant Analysis

PADA analisis diskriminan ganda (multiple discriminant analysis), grup yang dimiliki tidak lagi dua, akan tetapi tiga, empat, atau lebih grup.  Kalau diaplikasikan pada dua grup, maka persamaan diskriminan yang dibentuk hanya ada satu.  Sedangkan kalau kita memiliki tiga atau lebih grup, maka persamaan diskriminan yang dibentuk adalah jumlah grup itu dikurang satu.  Jadi, kalau grup ada tiga grup sebagai variabel dependen, maka persamaan diskriminan yang dibentuk adalah dua, kalau grup ada lima, persamaan diskriminan ada empat, demikian seterusnya … read more