Correspondence Analysis

Teknik-teknik membuat perceptual map, baik yang berbasis atribut, analisis faktor dan analisis diskriminan, semua membutuhkan data metrik (minimal interval).  Pertanyaan, bagaimana kalau data-data kita kategorikal (nominal ataupun ordinal)?  Perceptual map dapat dibuat dengan analisis korespondensi (correspondence analysis, disingkat CA).

Dalam MDS perceptual map dibangun dengan menggunakan kemiripan atau kesamaan (similarity).  Dalam CA, bagaimana perceptual map dibangun?

Kita ketahui ada dua ukuran similarity, yaitu asosiasi (association) dan jarak (distance).  Kita ketahui pula kedua ukuran tersebut memerlukan  data metrik.  Bagaimana memperoleh similarity dalam CA yang datanya non-metrik?

Mengingat asosiasi juga dapat diukur untuk data non-metrik, logikanya, perceptual map juga dapat dibuat untuk data demikian. Sebagaimana diketahui, chi-square merupakan teknik non-parametrik yang powerful dalam menguji independensi sebuah variabel dari variabel lainnya.

Dua variabel kategoris yang dilibatkan dalam tabulasi silang,  memiliki kesamaan yang didekati dari nilai chi-square.  Untuk lebih jelasnya mari kita lakukan pemabahasan berikut.

Eat Fried Chicken, sebuah restoran yang memiliki slogan “All You Can Eat” ingin mengetahui perceptual map para pelanggan dihubungkan dengan lamanya merek dalam restoran. Restoran ini memasang harga  Rp 150.000 dan dengan uang sebesar itu, konsumen dapat memakan apa saja dan duduk di restoran berapa lama saja.

Pihak restoran mengamati bahwa semakin besar jumlah yang datang, semakin lama mereka menghabiskan waktu di restoran.  Untuk membuktikannya, sekaligus membuat peta persepsi, restoran melakukan pengamatan, hasilnya disimpan pada Corresponden Analysis.sav.

Data pada file tersebut sebagian ditampilkan pada Tabel 11.1. Namun, untuk pengolahan, yang dimasukkan dalam program (SPSS) adalah format data seperti Tabel 11.1.

Tabel 11.1.  Ukuran Rombongan dan Lama di Restoran pada Restoran Eat Fired Chicken
NO. UKURAN ROMBONGAN LAMA DI RESTORAN
1 1 1
2 1 1
3 1 1
4 1 1
5 1 1
6 1 2
7 1 2
8 1 2
9 1 2
10 1 2
11 1 3
12 1 3
13 1 3
14 1 3
15 1 3
16 1 4
17 1 4
18 1 4
19 1 4
20 1 4
21 1 1
22 1 1
23 2 2
Keterangan:

Ukuran rombongan:

1: 1 dan 2 orang

2: 3 dan 5 orang

3: 6 sampai 10 orang

4: Di atas 10 orang

 

Lama Berkunjung:

1: 2 jam atau kurang

2: 3-4 jam

3: 5 sampai 6 jam

4: Di atas 6 jam

Langkah-langkah Analisis

  1.  Buka file Correspondence Analysis.sav.  Tampilan di layar sebagai berikut:

          

  1. Dari menu utama, pilih Analyze, lalu Data Reduction, lalu klik Correspondence Analysis. Pada dialog box yang muncul, masukkan ‘rmbongan’ (nama variabel jumlah rombongan) pada Rows (baris ) dan ‘lama’ (nama variabel lama di restoran) pada kolom.  Ketentuan ini tidak merubah hasil sebetulnya.  Hanya saja, dalam pembuatan tabulasi silang, variabel independen biasanya diletakkan pada baris dan variabel independen pada kolom.

        

3. Pada saat memasukkan ‘rmbongan’ pada ruang Rows, klik Define Range, lalu ketikkan 1 pada Minimum dan 4 pada Maximum, lalu klik update. Perlakuan yang sama dilakukan saat memasukkan ‘lama’ pada kolom.

4.  Setelah kembali ke dialog box utama, SPSS memberikan hasil seperti di bawah ini.

Output 1.  Tabel Korespondensi  Antara Ukuran Rombongan dan Lama di Restoran

Rombongan Lama
1 2 3 4 Active Margin
1 20 5 5 6 36
2 6 10 6 6 28
3 5 5 20 6 36
4 7 6 25 12 50
Active Margin 38 26 56 30 150

Sumber:  Hasil olahan SPSS

Output 2.  Summary
Dimension Singular Value Inertia Chi Square Sig. Proportion of Inertia Confidence Singular Value
Accounted for Cumulative Standard Deviation Correlation
2
1 .434 .188 .748 .748 .075 .146
2 .241 .058 .232 .980 .093
3 .070 .005 .020 1.000
Total .251 37.692 .000a 1.000 1.000
a. 9 degrees of freedom

 

Output 3.  Overview Row Pointsa
Rombongan Mass Score in Dimension Inertia Contribution
1 2 Of Point to Inertia of Dimension Of Dimension to Inertia of Point
1 2 1 2 Total
1 .240 -1.059 .373 .125 .621 .138 .935 .065 1.000
2 .187 -.230 -1.011 .050 .023 .790 .085 .915 1.000
3 .240 .555 .180 .037 .171 .032 .874 .051 .925
4 .333 .491 .168 .039 .186 .039 .886 .058 .944
Active Total 1.000 .251 1.000 1.000
a. Symmetrical normalization

 Output 4.  Overview Column Pointsa

Lama Mass Score in Dimension Inertia Contribution
1 2 Of Point to Inertia of Dimension Of Dimension to Inertia of Point
1 2 1 2 Total
1 .253 -.992 .378 .117 .575 .150 .924 .075 .999
2 .173 -.166 -1.010 .045 .011 .732 .046 .945 .991
3 .373 .688 .266 .084 .408 .110 .917 .076 .994
4 .200 .115 -.101 .006 .006 .008 .207 .089 .296
Active Total 1.000 .251 1.000 1.000
a. Symmetrical normalization

 MENGUKUR KESAMAAN DAN ASOSIASI

Perceptual map (Output 5) sebenarnya merupakan hasil akhir dari analisis koreespondensi. Terlihat di situ ‘ukuran rombongan’ dan ‘lama di restoran’ yang berdekatan dan berjauhan.  Misalnya, ukuran rombongan yang dilambangkan dengan angka 1 (1 – 2 orang)  berdekatan dengan lama berkunjung 1 (1 – 2 jam).  Letak masing-masing kategori di dasarkan pada koordinat yang terdapat pada Output 3 (ukuran rombongan) dan Output 4 (lama di restoran).

Kategori yang berdekatan memiliki asosiasi dan similarity yang dekat pula. Pertanyaannya, bagaimana asosiasi dan kesamaan diukur?  Caranya adalah dengan menghitung chi-squre (X2). Dalam tabulasi silang (Output 1), setiap sel merupakan kombinasi baris dan kolom.  Asosiasi maupun kesamaan antara baris dan kolom dhitung berdasarkan nilai observasi, yang dalam chi-square disebut frekuensi observasi (fo). Seluruh angka pada Output 1 merupakan fo.

Perhitungan asosiasi dan kesamaan diawali dengan perhitungan frekuensi yang diharapkan (expexted frequency) dilambangkan dengan fe, dengan rumus 11.1.  Hasilnya pada Tabel 11.2.

Output 5. Perceptual Map

 Sebagai contoh, pada baris 1 dan kolom 1, perhitungannya adalah: X2=(36X38)/150=9.12. Begitulah cara memperoleh frekuensi yang diharapkan pada Tabel 11.2

Frekuensi harapan (fe) pada Tabel 11.2 kita kurangkan terhadap frekuensi observasi (fo) yang ada pada Output 1. Proses pengurangan disajikan pada Tabel 10.3.  Sebagai contoh, pada baris ke-1 kolom ke-1, yaitu pada ukuran rombongan 1 sampai 2 orang (kategori 1) dan lama berkunjung 2 jam atau kurang, fo-fe=20-9.12= 10.88.  Kemudian, pada baris pertama kolom kedua, angka -1.24, diperoleh dari fo-fe=5-6.24=-1.24.  Buat apa dihitung fo-fe ini?

Tujuannya adalah untuk mengetahui asosiasi kedua variabel, yaitu kategori rombongan dan lama di restoran. Kalau selisih positif, berarti terdapat asosiasi positif. Sebaliknya, kalau selisih fo dan fe negatif, berarti asosiasi negatif (Tabel 11.3).

Tabel 11.2.  Frekuensi Yang Diharapkan (fe)

UKURAN ROMBONGAN

 

LAMA DI RESTORAN
1 2 3 4
1 9.12 6.24 13.44 7.20
2 7.09 4.85 10.45 5.60
3 9.12 6.24 13.44 7.20
4 12.67 8.67 18.67 10.00

Tabel 11.3.  Selisih Fo dan Fe

UKURAN ROMBONGAN

 

LAMA DI RESTORAN
1 2 3 4
1 10.88 -1.24 -8.44 -1.20
2 -1.09 5.15 -4.45 0.40
3 -4.12 -1.24 6.56 -1.20
4 -5.67 -2.67 6.33 2.00

Menghitung Nilai Chi-square

Menghitung nilai chi-square sama saja dengan statistik non-parametrik.  Dipakai rumus 11.2 untuk nilai chi-square sel atau biasa disebut chi-aquare baris ke-i dan kolom ke-j. Rumus 10-3 untuk nilai chi-square total.

Tabel 11.4.  Nilai-nilai Chi-square (X2)

UKURAN ROMBONGAN LAMA DI RESTORAN
1 2 3 4 TOTAL
1 12.98 0.25 5.30 0.20 18.73
2 0.17 5.46 1.90 0.03 7.55
3 1.86 0.25 3.20 0.20 5.51
4 2.54 0.82 2.15 0.40 5.90
TOTAL 17.54 6.77 12.55 0.83 37.69

 

Nilai chi-square kemudian dikonversi menjadi kesamaan (similarity).  Caranya, lihat tanda fo-fe yang tersaji pada Tabel 11.3.  Pada baris ke-1 kolom ke-1 Tabel 11.3, nilai fe-fo= 10.88.  Nilai chi-square pada Tabel 11.4 adalah 12.98.  Jadi, nilai kesamaan (similarity) adalah 12.98 (Tabel 11.4). Contoh kedua. Pada baris pertama kolom kedua, selisih fo-fe=-1.24 (Tabel 11.3). Nilai ‘Chi-square’-nya adalah 0.01 (Tabel 11.4). Maka, nilai kesamaannya kita tuliskan -0.01 (Tabel 11.4).  Karena fo-fe untuk sel itu negatif, maka tanda untuk similarity adalah negatif (Tabel 11.5).

Chi-square total adalah 37.69 (Tabel 4), sama dengan hasil SPSS pada Output 2. Statistik ini menguji Ho: Besarnya rombongan adalah non-interdependen atau tidak tidak terkait dengan lamanya rombongan di dalam restoran. Dengan nilai sig.=0.000, cukup bukti untuk menolak Ho. Jadi, besarnya rombongan dan lama di restoran adalah interdependen atau berasosiasi.

Tabel 11.5. Similarity antara Kategori Ukuran Rombongan dan Lama di Restoran

UKURAN ROMBONGAN

 

LAMA DI RESTORAN
1 2 3 4 TOTAL
1 12.98 -0.25 -5.30 -0.20 18.73
2 -0.17 5.46 -1.90 0.03 7.55
3 -1.86 -0.25 3.20 -0.20 5.51
4 -2.54 -0.82 2.15 0.40 5.90
TOTAL 17.54 6.77 12.55 0.83 37.69

Sel yang berisikan similarity positif mengindikasikan asosiasi positif, demikian pula sebaliknya. Apabila similarity relatif besar dan positif, kedua kategori yang membentuk sel itu, akan berdekatan.  Misalnya, sel baris 1 kolom 1, yang memiliki similarity terbesar dan positif (nilai similarity=12.98), tentunya posisinya paling berdekatan. Kalau diterjemahkan lebih jauh, rombongan berukuran 1-2 orang dan berada di restoran antara 1 – 2 jam, adalah dua kategori yang berasosiasi paling dekat. Oh ya, arti angka 1, 2, 3, dan 4 untuk ‘ukuran rombongan’ maupun ‘lama di restoran’ tengok lagilah di Tabel 11.1.

Sebaliknya, sel dengan similarity negatif dengan angka relatif besar, dalam perceptual map, kategori yang membentuknya akan menempati bagian yang jauh.  Misalnya, antara rombongan ‘2’  dengan lama ‘2’, demikian juga antara rombongan ‘1’ seperti terlihat pada perceptual map (Output 5).

Mari kita buktikan dengan jarak Euclidean dengan menggunakan data, yaitu Score in Dimension dari Output 3 dan Output 4.  Untuk tidak merepotkan, kita tampilkan lagi di Tabel 11.6.

Tabel 11.6. Koordinat ‘Ukuran Rombongan’ dan ‘Lama di Restoran’ pada Perceptual Map.

KATEGORI DIMENSI 1 DIMENSI 2
UKURAN ROMBONGAN 1 -1.059 0.373
2 -0.230 -1.011
3 0.555 0.180
4 0.491 0.168
LAMA DI RESTORAN 1 -0.992 0.378
2 -0.166 -1.010
3 0.688 0.266
4 0.115 -0.101

Nah, sekarang mari kita lihat Tabel 11.5.  Nilai-nilai chi-square yang positif atau menunjukkan similarity adalah pasangan 1-1, pasangan 2-2, pasangan 3-3, pasangan 4-4, pasangan 4-3 dan pasangan 2-4.  Pasangan 1-1 maksudnya adalah kategori ‘rombongan’ adalah 1 (koordinat: -1.0.059, 0.373) dan kategori ‘lama’ adalah 1 (koordinat: -0.992, 0.378).  Demikian juga yang lain. Sekarang, mari kita hitung jarak Euclidean masing-masing pasangan.  Hasilnya disajikan pada Tabel 11.7.

Tabel 11.7. Jarak Euclidean Pasangan ‘Rombongan’ dan ‘Lama’
PASANGAN SIMILARITY JARAK EUCLIDEAN
1-1 12.98 0.067
2-2 5.46 0.064
3-3 3.20 0.158
4-3 2.15 0.220
4-4 0.40 0.462
2-4 0.03 0.973

Jarak Euclidean dicari dengan rumus berikut:

Untuk pasangan 1-1, jarak Euclidean adalah:

Untuk pasangan lain jarak Euclidean dicari dengan cara yang sama. Terlihat pada Tabel 11.7 bahwa semakin besar asosiasi semakin dekat pula jarak euciledian.  Kekecualian terjadi pada pasangan 1-1 dan 2-2. Asosiasi 1-1 lebih besar dari pasangan 2-2, tetapi jarak Euclidean pasangan 2-2 lebih dekat dibanding pasangan 1-1.  Hal ini terjadi karena dalam pembuatan perceptual map program SPSS menggunakan ukuran asosiasi terstandarisasi.

Perceptual Map

Kesamaan (similarity) yang nilainya diperoleh dari chi-square dan tandanya dari fo-fe, selanjutnya dipakai untuk menghitung ukuran asosiasi terstandarisasi (standardized measurement of association).  Lalu, dengan asosiasi ini, CA menciptakan ukuran jarak metrik dan dimensi-dimensi ortogonal (yang perpotongannya satu sama lain 900).

Sama metoda MDS, analisis CA juga dapat memberi solusi satu, dua, tiga atau lebih dimensi. Namun, dalam CA ada ketentuan bahwa jumlah dimensi adalah jumlah kategori terkecil dikurang satu.  Dalam tabel 4 X 3, kategori terkecil adalah 3. Oleh karena itu, jumlah dimensi yang ditawarkan adalah 2.  Dalam contoh kita, ukuran tabel adalah 4 X 4.  Jumlah kategori terkecil adalah 4. Karena itu, jumlah dimensi adalah 4-1=3.  Pertanyaan, kenapa perceptual map kita (Output 5) dua dimensi, bukan tiga dimensi?

Masih ingat prinsip eigenvalue untuk memutuskan sebuah faktor dipakai atau tidak dalam analisis faktor?  Di dalam CA juga terdapat koefisien yang sama, namanya inertia (Output 2).  Sama seperti eigenvalue, inertia juga merupakan koefisien yang menyatakan proporsi varian yang dijelaskan oleh dimensi.  Menurut Hair, et. al.,  kalau inertia kurang dari 0.2, maka sebuah dimensi tidak dimasukkan.[i]  Pada Tabel Output 2 terdapat tiga dimensi. Dimensi 1 (nilai inertia=0.748) dan dimensi 2 (nilai inertia=0.232) memenuhi syarat karena nilai inertia melebihi 0.20. Dimensi 3 (inertia=0.020) tidak memenuhi syarat karena nilainya  kurang dari 0.2.

Asosiasi Atribut dengan Pilihan Produk

 Dalam contoh di atas, kita mengasosiasi ukuran rombongan dengan waktu yang mereka yang habiskan di restoran all you can eat. Selain masalah demikian, kita juga mengasosikan alasan konsumen memilih suatu produk. Misalnya, kita ingin mengetahui apa alasan konsumen memilih moda transportasi dalam perjalanan Jakarta – Surabaya. Moda transportasi adalah (1) bis, (2) kereta api dan (3) pesawat terbang. Sedangkan alasan yang disediakan adalah: (1) biaya, (2) kecepatan, (3) kenyamanan, (4) fleksibilitas jadwal keberangkatan, (5) bisa membawa banyak barang, (6) gengsi, dan (7) bisa berangkat ramai-ramai.

Dalam pemilihan ini, moda transportasi cukup dipilih satu. Cara memilih alasan memilih moda transportasi ada dua, yaitu hanya memilih satu saja di antara tujuh atau memilih satu atau lebih alasan yang sesuai. Dengan cara pertama, maka jumlah responden dapat dipastikan. Dengan cara kedua, jumlah alasan lebih lengkap, tetapi jumlah pasangan melebihi jumlah responden. Contoh di bawah ini mengggunakan cara kedua.             Sekarang mari kita kerjakan.

Buka file Correspondence Analysis-2 dengan SPSS. Penampakan sebagian data pada layar computer adalah seperti Output 5. Jumlah pasangan data adalah 177 yang berasal dari 60 responden. Sekali lagi, dalam kasus ini, setiap responden dapat memberikan ‘mencentrang’ lebih dari satu alasan memilih moda transportasi tertentu.

Langkah Analisis dengan SPSS

Langkah dengan SPSS sama saja dengan prosedur yang telah kita lakukan sebelumnya. Yang berbeda hanya range data.  Lihat langkah kedua di atas. Kali ini, untuk row, yaitu alasan memilih, range-nya adalah 1 (minimum) dan 7 (maximum).  Untuk kolom, minimum adalah 1 dan maksimum adalah 3. Berikut ini adalah output SPSS.

Output 1. Correspondence Table
Alasan Pilihan
1 2 3 Active Margin
1 24 11 0 35
2 0 7 24 31
3 0 15 18 33
4 21 0 0 21
5 16 0 0 16
6 3 0 15 18
7 12 11 0 23
Active Margin 76 44 57 177

 

Output 2. Summary
Dimension Singular Value Inertia Chi Square Sig. Proportion of Inertia Confidence Singular Value
Accounted for Cumulative Standard Deviation Correlation
2
1 .848 .720 .800 .800 .025 -.081
2 .423 .179 .200 1.000 .051
Total .899 159.103 .000a 1.000 1.000
a. 12 degrees of freedom

 

Output 3.  Overview Row Pointsa
Alasan Mass Score in Dimension Inertia Contribution
1 2 Of Point to Inertia of Dimension Of Dimension to Inertia of Point
1 2 1 2 Total
1 .198 -.719 .356 .097 .121 .059 .891 .109 1.000
2 .175 1.105 -.268 .187 .252 .030 .972 .028 1.000
3 .186 .845 .595 .141 .157 .156 .801 .199 1.000
4 .119 -1.151 -.696 .158 .185 .136 .846 .154 1.000
5 .090 -1.151 -.696 .120 .141 .103 .846 .154 1.000
6 .102 .944 -1.049 .124 .107 .264 .618 .382 1.000
7 .130 -.494 .906 .072 .037 .252 .373 .627 1.000
Active Total 1.000 .899 1.000 1.000
a. Symmetrical normalization

 

Output 4.  Overview Column Pointsa

 

Pilihan Mass Score in Dimension Inertia Contribution
1 2 Of Point to Inertia of Dimension Of Dimension to Inertia of Point
1 2 1 2 Total
1 .429 -.976 -.295 .363 .482 .088 .956 .044 1.000
2 .249 .189 1.123 .140 .010 .741 .054 .946 1.000
3 .322 1.156 -.474 .395 .507 .171 .922 .078 1.000
Active Total 1.000 .899 1.000 1.000
a. Symmetrical normalization

Output 5. Perceptual Map

Pertanyaan yang mau dijawab adalah: “Atribut-atribut apa yang berasosiasi dengan setiap moda transportasi? Dari perceptual map sebenarnya kita dapat melihat bahwa bis (moda 1) lebih pada atribut-atribut 1 (biaya), 4 (fleksibilitas jadwal keberangkatan, dan (5) bisa membawa banyak barang. Kereta api (moda 2) lebih dekat pada atribut 7 (bisa beramai-ramai) dan atribut 3 (nyaman). Moda pesawat terbang (moda 3) lebih dekat pada atribut 2 (cepat sampai) dan (6) gengsi.  Namun, untuk memastikannya, lebih baik kita mengukur jarak Euclidean setiap atribut dengan masing-masing moda transportasi. Data yang digunakan adalah koordinat atribut (Output 3) dan moda transportasi (Output 4).

Tabel 11.8. Jarak Euclidean Atribut-atribut dengan Moda Transportasi
ATRIBUT KOORDINAT MODA TRANSPORTASIb
Bis Kereta Api Pesawat Terbang
NO. NAMA KOORDINATa Dim. 1 Dim. 2 Dim. 1 Dim. 2 Dim.1 Dim. 2
Dim. 1 Dim. 2 -0.976 -0.295 0.189 1.123 1.156 -0.474
1 Biaya -0.719 0.356 0.700 1.189 2.050
2 Cepat 1.105 -0.268 2.081 1.666 0.212
3 Nyaman 0.845 0.595 2.027 0.842 1.113
4 Fleksibilitas jadwal -1.151 -0.696 0.438 2.259 2.318
5 Bisa bawa banyak barang -1.151 -0.696 0.438 2.259 2.318
6 Gengsi 0.944 -1.049 2.063 2.299 0.613
7 Bisa berangkat ramai-ramai -0.494 0.906 1.294 0.717 2.151

aDiambil dari Output 3

bDiambil dari Output 4

Perhitungan jarak Euclidean sama saja dengan yang sebelumnya. Tetapi, agar lebih memudahkan, kita contohkan satu perhitungan, yaitu jarak Euclidean ‘biaya’ dengan ‘bis’, seperti berikut ini.

Dari jarak Euclidean, dalam contoh ini, memang terbukti bahwa bis berasosiasi dengan biaya, fleksibilitas jadwal keberangkatan, dan kemungkinan membawa banyak barang. Kereta api berasosiasi dengan kenyamanan dan kemungkinan untuk berangkat beramai-ramai, sedangkan pesawat terbang berasosiasi dengan kecepatan sampai di tujuan dan gengsi.

DAFTAR PUSTAKA

Hair, et. al. 1998.  Multivariate Data Analysis.  Fifth Edition. Prentice-Hall, Inc., New Yersey, hal. 553.


Cara mengutip tulisan ini (APA Style):

Simamora, B. (2017). Correspondence analysis. Bilson Simamora Learning Center: Multivariate Analysis. Diakses melalui https://www.bilsonsimamora.com/multivariate/correspondence-analysis/, tanggal …/…/20…. (isikan tanggalnya).