Correspondence Analysis

Teknik-teknik membuat perceptual map umumnya membutuhkan data metrik (minimal interval).  Pertanyaan, bagaimana kalau data-data kita kategorikal (nominal ataupun ordinal)?  Perceptual map dapat dibuat dengan analisis korespondensi (correspondence analysis, disingkat CA). Dalam MDS perceptual map dibangun dengan menggunakan kemiripan atau kesamaan (similarity).  Dalam CA, bagaimana perceptual map dibangun?

Ada dua ukuran similarity yang lazim dipakai, yaitu asosiasi (association) dan jarak (distance).  Kita ketahui pula kedua ukuran tersebut memerlukan  data metrik.  Bagaimana memperoleh similarity dalam CA yang notabene datanya non-metrik?

Mengingat asosiasi juga dapat diukur untuk data non-metrik, logikanya, perceptual map juga dapat dibuat untuk data demikian. Sebagaimana diketahui, chi-square merupakan teknik non-parametrik yang powerful dalam menguji independensi sebuah variabel dari variabel lainnya.

Kesamaan dua variabel kategoris (categorical variables) yang dipakai membentuk tabulasi silang,  dapat dicari berdasarkan nilai chi-square.  Untuk lebih jelasnya mari kita lakukan pemabahasan berikut.

Moccus Hian Food, sebuah restoran yang memiliki slogan “All You Can Eat” ingin mengetahui perceptual map para pelanggan dihubungkan dengan lamanya merek dalam restoran. Restoran ini memasang tiket masuk seharga Rp 250.000 untuk setiap pengunjung. Kompensasinya, konsumen dapat memakan apa saja dan duduk berapa lama pun di restoran.

Pihak restoran mengamati bahwa semakin besar jumlah yang datang, semakin lama mereka menghabiskan waktu di restoran.  Untuk membuktikannya, sekaligus memetakan pengunjung, pihak restoran melakukan pengamatan terhadap 150 rombongan (individu) pengunjung. Data SPSS dapat di-download dari sini. Pada Tabel 1 hanya ditampilkan 23 unit data sebagai contoh bentuk tabel data asli.

Langkah-langkah Analisis dengan SPSS

Langkah 1: Buka file Correspondence Analysis.sav.

Langkah 2: Dari menu utama, pilih Analyze, lalu Data Reduction, lalu klik Correspondence Analysis. Pada dialog box yang muncul, masukkan ‘ukuran_rombongan’ (nama variabel jumlah rombongan) pada Rows (baris ) dan ‘lama_berkunjung’ (nama variabel lama di restoran) pada kolom.  Ketentuan ini tidak merubah hasil sebetulnya.  Hanya saja, dalam pembuatan tabulasi silang, variabel independen biasanya diletakkan pada baris dan variabel independen pada kolom.

Langkah 3. Pada saat memasukkan ‘rmbongan’ pada ruang Rows, klik Define Range, lalu ketikkan 1 pada Minimum dan 4 pada Maximum, lalu klik update. Perlakuan yang sama dilakukan saat memasukkan ‘lama’ pada kolom.

Langkah 4. Klik model. Tampak pilihan begini.

Dimension solusion berisikan sel yang secara default berisi angka 2. Jumlah dimensi bisa diisi berapa saja, namun program akan memutuskan berapa jumlah dimensi sesuai berdasarkan hasil analisis data. Perceptual map dua dimensi yang paling mudah dibaca dan diinterpretasi, sehingga menjadi pilihan standar.

Pengukuran jarak antar kategori (distance measure) memberikan dua pilihan, yaitu Chi-square dan Euclidean. Chi-square adalah pilihan standar. Pilihan ini memanfaat nilai sel-sel yang dibentuk oleh tabulasi silang untuk menghasilkan nilai similaritas, berdasarkan mana perceptual map dibentuk.

Standardization method. Analisis korespondensi menggunakan data terstandarisasi (standardized data). Terdapat lima pilihan pendekatan standarisasi pada gambar di atas. Chi-square menggunakan pendekatan Symmetrical sehingga SPSS menetapkannya sebagai pilihan default.

Langkah 5: Untuk menu Statistics, silakan ditandai pilihan-pilihan seperti di bawah ini.

Langkah 5: Untuk menu ‘Plot’, informasi paling lengkap diberikan oleh pilihan ‘Biplot‘.

Interpretasi Output

Correspondence table

Output pertama yang ditampilkan SPSS adalah correspondence table, yang setelah dimodifikasi ditampilkan seperti Tabel 1. Dengan format data seperti ini, kita sudah menghitung nilai Chi-Square secara manual untuk memeriksa apakah ada saling interdependensi atau asosiasi antara jumlah rombongan dan lama berkunjung. Program secara otomatis juga menghitungnya, seperti ditampilkan nanti.

Output penting lainnya adalah Summary, seperti di bawah ini. Pertama-tama, kita melihat tiga jumlah dimensi yang dihasilkan oleh program. Dalam CA terdapat ketentuan bahwa jumlah dimensi adalah jumlah kategori terkecil dikurang satu.  Misalkan kita mengolah tabel 4 X 3, jumlah kategori terkecil adalah 3. Otomatis jumlah dimensi yang ditawarkan adalah 2.  Dalam contoh kita (Table 1), ukuran tabel adalah 4 X 4 dan jumlah kategori terkecil adalah 4. Karena itu, jumlah dimensi yang dihasilkan program adalah 4-1=3. Namun, perceptual map yang dihasilkan adalah dua dimensi. Ikutilah penjelasan berikutnya untuk mengetahui kenapa hanya dua dimensi yang valid.

Row Profiles

Row profiles menggambarkan proporsi setiap sel terhadap total baris. Data yang digunakan adalah dari correspondence analysis. Misalnya, rombongan berukuran 1 sampai 2 orang yang berkunjung 2 jam atau kurang jumlahnya 20 orang, yang mencakup 55.6% dari 36 rombongan. Nilai massa (Mass) pada bagian bawah mengacu pada proporsi kolom dari total ukuran sampel. Misalnya, 38 rombongan yang berkunjung 2 jam atau kurang mewakili 25,3% dari total sampel 150 rombongan.

Column Profiles

Cara menginterpretasi column profiles sama saja dengan row profiles. Silakan dicoba.

Overview Row Points

Luaran (outcome) berupa overview row poins menampilkan nilai massa (Mass) yang diambil dari Column Profiles. Skor dalam dimensi (Score in Dimension) menyatakan posisi setiap kategori dalam diagram kartesius. Kategori ‘1 sampai 2 orang’, misalnya, menempati perpotongan X=-1.059 dan Y=0.373′ atau titik koordinat (-1.059, 0.373). Inertia menyatakan varian data asli yang dijelaskan oleh dimensi. Secara keseluruhan dimensi dapat menjelaskan 25.1% varian data asli ukuran rombongan. Inertia setiap kategori juga ditampilkan. Sebagai contoh, pada kategori ‘1 sampai 2 orang’, varian yang dijelaskan oleh dimensi adalah 12.5%. Kolom Contribution menjelaskan kontribusi poin setiap kategori pada setiap dimensi dan kontribusi dimensi terhadap inertia poin.

Overview Column Points

Cara menerjemakan column profiles sama dengan row profiles. Silakan dibaca sendiri.

Summary

Singular value menyatakan korelasi kanonikal (cannonical correlation) antara kedua variabel pada setiap dimensi. Pada dimensi 1 misalnya, korelasi kanonikal kedua variabel adalah 0.434. Inertia adalah variance data asli (Table 1) yang dijelaskan oleh perceptual map. Terlihat bahwa perceptual map dapat menjelaskan 0.251 atau 25.10% varian data asli. Dimensi 1 dapat menjelaskan 0.188 atau 18.80%, dimensi 2 menjelaskan 0.058 atau 5.80% dan dimensi 2 menjelaskan 0.005 atau 0.50%.

Nilai Chi-square adalah 37.69. Statistik ini menguji Ho: Besarnya rombongan adalah non-interdependen atau tidak terkait dengan lamanya waktu yang dihabiskan rombongan  di dalam restoran. Dengan nilai sig.=0.000, cukup bukti untuk menolak Ho. Jadi, ada interdepensi atau asosiasi antara besarnya rombongan dan lama di restoran.

Proporsi inersia (proportion of inertia) menyatakan proporsi inersia yang dijelaskan oleh sebuah dimensi. Total inertia adalah 0.251 dan kita anggap proporsinya 1.000 atau 100%. Nah, terhadap angka 1.00 atau 100% itu, Dimensi 1 menyumbangkan 0.748 atau 74.80%. Dimensi 2 menyumbang 0.232 atau 23.20% dan Dimensi 3 menyumbang 0.020 atau 2.00%. Hair et al. (2014) menyatakan proporsi minimal sebuah dimensi agar dianggap valid adalah 20%. Karena itu, dimensi yang valid adalah Dimensi 1 dan Dimensi 2. Itulah alasan kenapa perceptual map yang ditampilkan program adalah dua dimensi.

Kedekatan antar kategori dapat diketahui dengan pendekatan-pendekatan visual, jarak Euclidean, dan similarity.

Pendekatan Visual

Pendekatan visual dilakukan dengan mengamati perseptual map. Berikut ini adalah peta persepsi (perceptual map) yang dihasilkan oleh SPSS.

Gambar 1. Perceptual Map

Secara visual terlihat bahwa:

  1. Kategori ‘1 sampai sampai 2 orang’ paling dekat dengan ‘2 jam atau kurang’.
  2. Kategori ‘ 3 sampai sampai 5 orang’ paling dekat dengan ‘lebih dari 2 jam sampai 4 jam’.
  3. Kategori ‘ 6 sampai 10 orang paling dekat dengan ‘lebih dari 4 jam sampai 6 jam’.
  4. Kategori ‘lebih dari 10 orang’ paling dekat dengan ‘lebih dari 6 jam’.

Pendekatan Jarak Euclidean

Selain secara visual kita dapat menghitung jarak Euclidean pun, sehingga kedekatan ukuran rombongan dan lama berkunjung dapat dibuktikan secara kuantitatif. Rumus yang digunakan adalah:

Untuk pasangan kategori ‘1 sampai sampai 2 orang’ berdekatan dengan ‘2 jam atau kurang’, jarak Euclidean adalah:

Hasil perhitungan lengkap disajikan pada tabel berikut.


Angka-angka yang ditebalkan merupakan angka paling kecil pada setiap kategori ukuran rombongan. Semakin angka, semakin dekat jarak dan semakin berasosiasi pasangan kategori yang memilikinya. Dengan demikian, keempat kesimpulan di atas dapat dikonfirmasi secara kuantitatif.

Pendekatan Similarity

Kedekatan satu kategori variabel dengan kategori variabel lainnya dapat juga dideteksi melalui similarity. Untuk tujuan ini, data yang dibutuhkan adalah frekuensi yang diharapkan, frekuensi hasil observasi, dan nilai Chi-square setiap sel.

Frekuensi yang diharapkan (fe) diperoleh dengan rumus:

Untuk pasangan 1 sampai 2 orang (ukuran rombongan) dan 2 jam atau kurang (lama berkunjung), dari tabel correspondence analysis diperoleh bahwa total baris adalah 36 dan total kolom adalah 38 dan total keseluruhan adalah 150. Dengan demikian, frekuensi yang diharapkan adalah fe=36X38)/150=9.12. Dengan cara seperti itulah diperoleh frekuensi yang diharapkan pada tabel berikut.

Selanjutnya, frekuensi yang diharapkan (fe) kurangkan terhadap frekuensi observasi (fo) yang ada pada Correspondence Table.  Sebagai contoh, untuk pasangan kategori ‘1 sampai 2 orang’ (ukuran rombongan) dan ‘2 jam atau kurang’ (lama berkunjung, fo-fe=20-9.12= 10.88.  Contoh kedua, untuk pasangan ‘1 sampai 2 orang’ dan ‘lebih dari dua 2 jam sampai 4 jam’, nilai fo-fe=5-6.24=-1.24.  Buat apa dihitung fo-fe ini?

Tujuan penghitungan fo-fe adalah untuk mengetahuiarah asosiasi pasangan kategori kedua variabel Kalau selisih positif, berarti terdapat asosiasi positif, seperti pada pasangan kategori ‘1 sampai 2 orang’ dan ‘2 jam atau kurang’. Sebaliknya, kalau selisih fo dan fe negatif, berarti asosiasi negatif, seperti pada pasangan ‘1 sampai 2 orang’ dan ‘lebih dari dua 2 jam sampai 4 jam’. Asosiasi positif menyatakan derajat kedekatan. Semakin besar angkanya semakin dekat. Asosiasi negatif menyatakan derajat kejauhan. Semakin kecil angkanya semakin tidak jauh.

Hasil selengkapnya disajikan pada tabel berikut.

Selanjutnya kita kita hitung nilai Chi-Square dengan rumus berikut:

Hasil perhitungan nilai Chi-square disajikan pada tabel berikut.

Nilai chi-square kemudian dikonversi menjadi kesamaan (similarity).  Caranya adalah membuat nilai chi-square setiap sel punya positif ataukah negatif. Arah ini dapat dilihat dari nilai fo-fe.  Contoh pertama, untuk pasangan kategori ‘1 sampai 2 orang’ dan ‘2 jam atau kurang’ nilai fe-fo adalah 10.88 (positif).  Nilai chi-square-nya adalah 12.98.  Jadi, nilai kesamaan (similarity) pada sel satu adalah 12.98. Contoh kedua, untuk pasangan ‘1 sampai 2 orang’ dan ‘lebih dari dua 2 jam sampai 4 jam, nilai fo-fe=-1.24 (negatif). Nilai ‘Chi-square’ sel ini adalah 0.25, maka nilai kesamaannya adalah -0.25.  Begitulah caranya memperoleh similarity pada tabel berikut.

Nilai similarity diinterpretasi dengan ketentuan berikut:

  1. Untuk nilai positif, semakin besar angka similarity, semakin kuat asosiasi, semakin dekat kategori yang dipertautkan.
  2. Untuk nilai positif, semakin besar angka similarity, semakin kuat asosiasi, semakin jauh kategori yang dipertautkan.
  3. Asosiasi similarity positif lebih kuat dibanding similarity negatif.

Berdasarkan ketentuan tersebut, maka hasil yang diperoleh adalah:

  1. Kategori ‘1 sampai sampai 2 orang’ berasoasi paling dekat dengan ‘2 jam atau kurang’.
  2. Kategori ‘3 sampai sampai 5 orang’ berasoasi paling dekat dengan  ‘lebih dari 2 jam sampai 4 jam’.
  3. Kategori ‘6 sampai 10 orang’ berasosiasi paling dekat dengan ‘lebih dari 4 jam sampai 6 jam’.
  4. Kategori ‘lebih dari 10 orang’ paling dekat dengan ‘lebih dari 4 jam sampai 6 jam’.

Dibanding dengan hasil menggunakan jarak Euclidean, hasil nomor 1, 2 dan 3 adalah sama, sedangkan hasil nomor 4 berbeda. Dengan menggunakan jarak Euclidean, kategori ‘lebih dari 10 orang’ paling dekat dengan ‘lebih dari 6 jam’.

Menggunakan Analisis Korespondensi untuk Mengungkap Faktor-faktor yang Mempengaruhi Pilihan Konsumen

Dalam contoh di atas, kita mengasosiasi ukuran rombongan dengan waktu yang mereka yang habiskan di restoran all you can eat. Selain masalah demikian, kita juga mengasosikan alasan konsumen memilih suatu produk. Berikut ini diberikan dua contoh.

Contoh 2: Faktor-faktor yang Mempengaruhi Pilihan Marketplace

Seorang peneliti ingin mengetahui pilihan utama responden dalam berbelanja online dan faktor-faktor yang mempengaruhinya. Ada dua pertanyaan dasar yang digunakan, yaitu pertanyaan tentang marketplace pilihan dan alasan memilihnya. Contoh pertanyaannya dapat dicek pada Google form ini.

Dalam Google form, pertanyaan pertama menggunakan format dropdown karena hanya memilih satu dari alternatif-alternatif yang tersedia. Pertanyaan kedua menggunakan format checkboxes, dengan mana responden dapat mencentrang lebih dari satu pilihan. Perlu diingat bahwa dalam Google Form, pilihan jawaban harus diacak (di-shuffle) untuk meminimalkan bias posisi.

Dalam link ini disajikan data menggunakan kuesioner di atas, silakan di-download untuk latihan. Data ini berasal dari 25 responden dan dipakai hanya untuk latihan dan bukan untuk penelitian sebenarnya. Dalam SPSS, data memiliki lebih dari 25 case atau baris (tepatnya 92) karena satu responden dapat memilih lebih dari satu alasan. Responden 1, misalnya, memilih marketplace Shoope (disimbolkan nomor 1) dan menandai empat alasan, sehingga datanya tersebar ke dalam empat case (baris).

Data asli dari Google form adalah dalam bentuk data Excel. Diperlukan teknik khusus untuk menyusunnya menjadi data SPSS. Silakan dilihat pada video berikut (underconstruction).

Dengan menggunakankan Correspondence Analysis, yang prosedurnya ditunjukkan pada video di atas, diperoleh perceptual map berikut.

Catatan: Perceptual map ini sudah diedit dengan cara yang dijelaskan di video.

Contoh 2: Faktor-faktor yang Mempengaruhi Pilihan Moda Transportasi

Secara visual dapat kita lihat alasan-alasan pemilihan yang lebih dekat dengan setiap marketplace. Tokopedia misalnya, lebih dekat dengan tampilan website menarik dan citra baik. Zalora dengan uang aman. Shoope dengan banyak diskon, website mudah diakses, banyak pilihan produk, ongkos kirim gratis, klaim mudah dilakukan dan seller terpercaya. Untuk lebih mewakinkan, kita perlu menghitung jarak Euclidean dengan rumus:

Dengan cara yang dijelaskan pada video ini, hasil perhitungan jarak Euclidean adalah seperti berikut.

ShoopeTokopediaZalora
Banyak pilihan produk0.421.942.61
Seller terpercaya0.951.911.30
Uang aman1.822.600.44
Klaim mudah0.672.252.69
Banyak diskon0.671.661.60
Ongkir gratis0.391.892.59
Web mudah diakses0.711.032.56
Tampilan web menarik2.010.323.03
Citra baik1.360.352.72

Berdasarkan jarak Euclidean, kesimpulan yang kita peroleh sama dengan hasil interpretasi visual.

Contoh 3: Faktor-faktor yang Mempengaruhi Pilihan Moda Transportasi

Misalnya, kita ingin mengetahui apa alasan konsumen memilih moda transportasi dalam perjalanan Jakarta – Surabaya untuk mudik Lebaran. Moda transportasi adalah (1) bis, (2) kereta api dan (3) pesawat terbang. Responden hanya memilih satu moda.

Faktor-faktor yang dipertimbangkan adalah: (1) biaya murah, (2) kecepatan, (3) kenyamanan, (4) fleksibilitas jadwal keberangkatan, (5) bisa membawa banyak barang, (6) bergengsi, dan (7) bisa berangkat ramai-ramai. Responden boleh memilih satu, beberapa atau semua faktor.

Penampakan sebagian data pada layar computer adalah seperti Tabel 3. Jumlah pasangan data adalah 177, yang berasal dari 60 responden. Sekali lagi, dalam kasus ini, setiap responden dapat memberikan atau ‘mencentrang’ lebih dari satu faktor (alasan). Maaf, belum ada link download-nya karena masih dicari.

Kalau pilihan responden lebih dari satu, maka penulisan data yang bersangkutan dalam adalah berulang. Berikut ini contoh penulisan dalam SPSS dari seorang responden yang memberikan empat alasan.

Ini tampilan data kita

Langkah dengan SPSS sama saja dengan prosedur yang telah kita lakukan sebelumnya. Yang berbeda hanya range data.  Lihat langkah kedua di atas. Kali ini, untuk row, yaitu alasan memilih, range-nya adalah 1 (minimum) dan 7 (maximum).  Untuk kolom, minimum adalah 1 dan maksimum adalah 3. Berikut ini adalah output SPSS.

Secara visual terlihat bahwa bis paling dekat faktor 1 (biaya murah), faktor 4 (fleksibilitas jadwal keberangkatan) dan faktor 5 (bisa membawa banyak barang). Kereta api paling dekat dengan faktor 3 (kenyamanan) dan faktor 7 (bisa berangkat ramai-ramai). Pesawat terbang paling dekat dengan faktor 2 (kecepatan) dan faktor 6 (bergengsi).

Dengan menggunakan data koordinat dari overview row points  dan overview column points (tidak ditampilkan di sini), jarak Euclidean pilihan moda transportasi dan faktor-faktor yang mempengaruhi dapat dihitung. Hasilnya adalah seperti pada tabel berikut.

Dari jarak Euclidean, dalam contoh ini, memang terbukti bahwa pilihan bis dipengaruhi faktor-faktor biaya murah, fleksibilitas jadwal keberangkatan, dan kemungkinan membawa banyak barang. Pilihan kereta api dipengaruhi oleh kenyamanan dan kemungkinan untuk berangkat beramai-ramai, sedangkan pesawat terbang faktor-faktor kecepatan sampai di tujuan dan gengsi.

Sebagai catatan, sebenarnya analisis korespondensi tidak dimaksudkan untuk menemukan koefisien pengaruh, sebagaimana dalam regresi. Apabila pengaruh disimpulkan melalui uji koefisien, maka yang digunakan adalah metoda tidak langsung. Pada contoh ini, pengungkapan ‘pengaruh’ dilakukan secara langsung melalui bentuk pertanyaan langsung: “Faktor-faktor apa yang mempengaruhi pilihan anda tersebut?” Dengan demikian, kesimpulan tentang pengaruh dapat diambil.

 

Referensi

Hair, J.F., Black, W.C., Babin, B.J., & Anderson, R.E. (2014). Multivariate Data Analysis. 7th Edition, Pearson Education, Upper Saddle River