About Multivariate Analysis

Berdasarkan banyaknya variabel yang dilibatkan, analisis dapat dibagi menjadi tiga tingkatan.  Bila hanya ada satu variabel yang dilibatkan, namanya adalah analisis univariate (Zikmund et a.. 2013).  Misalnya, analisis tingkat kepuasan konsumen terhadap Indomie. Kalau ada dua variabel yang dilibatkan, dinamakan analisis itu analisis bivariat.  Misalnya, analisis pengaruh antara jumlah anggota keluarga (variabel 1) dengan tempat berlibur yang dipilih (variabel 2).  Kalau lebih dari dua variabel yang terlibat, maka analisis yang dilakukan, dinamakan analisis multivariat.  Pada analisis di atas, kita tambahkan variabel baru, misalnya pendapatan dan rata-rata usia anak.  Maka, analisis yang kita lakukan menjadi: Analisis pengaruh jumlah anggota keluarga, pendapatan keluarga dan rata-rata usia anak terhadap pilihan tembat berlibur.

Kalau pengertian analisis multivariat sesederhana itu pembahasan kita sudah selesai, tak perlu satu bab khusus untuk menjelaskannya. Ternyata, bagi Hair et al. (2006) pengertian analisis multivariat tidak sesederhana itu.  Bahkan, mereka merasa tidak mudah mengartikannya. “Multivariat analysis is not ease to define”, kata mereka. Untuk memudahkan pemahaman, secara umum mereka mengartikan bahwa analisis multivariat adalah metoda-metoda statistik yang mengolah beberapa pengukuran (measurement) menyangkut individu atau objek sekaligus (simultaneously).  Dengan pengertian ini, maka analisis multivariat merupakan perluasan dari analisis univariat dan bivariate (Hair et al., 2006).  Dalam regresi (yang merupakan contoh analisis bivariat), kalau variabel independen (yaitu X) hanya ada satu, maka analisis yang kita lakukan adalah regresi sederhana (simple regression).  Begitu kita tambahkan satu lagi variabel independen, maka variabel yang dianalisis sekarang menjadi tiga, yaitu satu variabel dependen dan dua variabel independen. Otomatis analisis yang kita lakukan berubah kategori menjadi analisis multivariat.

Dalam regresi memang dapat kita terima bahwa regresi multivariat adalah perluasan regresi bivariat.  Namun, beberapa teknik multivariate (selain regresi), sama sekali bukan perluasan analisis bivariat.  Ambil contoh analisis faktor.  Analisis ini sejatinya adalah teknik multivariat.  Analisis ini tidak dapat dirubah menjadi analisis bivariat, apalagi menjadi analisis univariat, sebagaimana dalam regresi.  Dalam regresi, memang kita dapat mengurangi jumlah variabel dengan tujuan memperoleh persamaan terbaik.  Jadi,  analisis yang awalnya multivariat, bisa saja menjadi bivariat dalam regresi.

Tentang apa itu analisis multivariat, belum ada kesepakatan yang pasti di antara para ahli.  Beberapa ahli menyederhanakan pengertian analisis multivariat sebagai hubungan antara (between) atau di antara (among) lebih dari dua variabel.  Yang lain menggu-nakan istilah itu kalau berbagai variabel (multiple variable) yang digunakan memiliki distribusi multivariat normal.  Sebetulnya, agar benar-benar multivariat, semua variabel harus acak (random), terdapat interrelasi sesamanya, dan efek masing-masing variabel secara sendiri-sendiri sulit diinterpretasi.

Beberapa ahli lain mengatakan bahwa tujuan analisis multivariat adalah mengukur, menerangkan dan memprediksi tingkat relasi (the deggre of relationship) di antara variat-variat (tentang apa itu variat dijelaskan pada bagian berikutnya).  Jadi, karakter multivariat tidak sekedar didasarkan pada jumlah variabel atau observasi yang dilibatkan dalam analisis, akan tetapi juga pada kombinasi berganda (multiple combination) antar variat.  Mengambil ide dari Hair, et. al. (2006), pada buku ini, pengertian multivariat tidak kaku.  Apa saja bentuk-bentuk analisis yang menggunakan banyak variabel dan variat, dalam buku ini, dimasukkan sebagai analisis multivariat.



Variat versus Variabel

Kita tentu  terbiasa dengan istilah variabel (variable), sehingga begitu bertemu istilah multivariate, pertanyaan yang menggelitik adalah: “Apa itu variat?  Apakah variat sama dengan variabel?”  Jawabnya: tidak sama.  Variabel adalah karakteristik, sifat, simbol atau atribut yang diukur, yang kepadanya diberi nilai (Zikmund et al. 2013).  Pada setiap kasus, nilai variabel beragam, sehingga Sekaran (2000) menyederhanakan variabel sebagai aspek yang memiliki beragam nilai. Aspek sendiri adalah bagian dari fenomena yang dapat diamati.

Variat (variate) adalah kombinasi linier variabel-variabel yang penentuannya dilakukan secara empiris.  Pengaruh setiap variabel tidak sama dan ditentukan berdasarkan bobot yang dimiliki. Bobot ini ditentukan oleh teknik multivariat yang dipakai.

Variat dari sejumlah variabel yang telah diberi bobot (weigthed variables) dapat dinyatakan sebagai:

Nilai variat = w1X1+w2X2+w3X3+…+wnXn

di mana Xn adalah variabel yang diobservasi dan wn adalah bobot yang ditentukan melalui teknik multivariat teknik.

Hasilnya adalah sebuah nilai yang paling baik merepresentasikan semua variabel, sesuai dengan tujuan analisis multivariat.  Dalam regresi berganda, nilai variat adalah sebuah nilai yang berkorelasi paling tinggi dengan variabel yang diprediksi.  Misalnya, kita ingin melihat pengaruh usia, tingkat pendidikan dan motivasi terhadap tingkat penjualan seorang wiraniaga (penjualan sebenarnya).   Dengan regresi, kita akan memperoleh penjualan berdasarkan rumus.  Itulah nilai variat.  Teknik regresi akan menghasilkan nilai variat yang berkorelasi paling tinggi dengan penjualan sebenarnya.

Teknik-teknik lain juga menggunakan prinsip yang sama.  Semua teknik mengombinasikan variabel-variabel yang dilibatkan sedemikian agar memperoleh nilai variat yang paling baik menggambarkan keadaan sebenarnya.  Penjelasan tentang bagaimana seluk-beluk teknik-teknik tersebut disajikan pada bab-bab selanjutnya.

Variat Versus Atribut

Dari segi istilah, jelas tidak ada kesamaan bunyi atau arti antara ‘variat’ dan ‘atribut’.  Namun, karena sama-sama menggunakan banyak variabel, perlu diberi penjelasan bahwa keduanya tidak sama.

Dalam pemasaran, memang banyak sifat atau karakteristik yang didekati dengan berbagai atribut, seperti kepuasan, sikap, preferensi, perceived quality, asosiasi merek dan brand image. Namun, perhitungan yang dipakai untuk mencari sebuah angka yang menyatakan sifat-sifat tersebut, sama sekali bukan multivariat, sebab di dalamnya tidak terdapat kombinasi linier variabel-variabel yang diberi bobot.

Memang ada di antara teknik-teknik multiatribut yang memiliki  persamaan, seperti model sikap Fishbein,  model sikap poin ideal dan model preferensi compensatory.  Namun, yang dilakukan dalam persamaan-persamaan itu hanya matematika sederhana berupa penjumlahan dan per kalian.

Dengan penjelasan ini diharapkan agar para peneliti tidak menganggap teknik-teknik multiatribut sebagai teknik-tektik multivariat.

Untuk lebih jelasnya, di bawah ini disajikan sekilas pandang teknik-teknik analisis multivariat yang dibahas dalam buku ini.

Tipe-tipe Analisis Multivariat

Analisis multivariate selalu berkembang.  Berbagai teknik yang telah diterima secara luas adalah: (1) principal components dan common factors analysis, (2) multiple regression dan multiple correlation, (3) multiple discriminant analysis, (4) multivariate analysis of variance dan covariance, (5) conjoint analysis, (6) canonical correlation, (7) cluster analysis, (8) multidimensional scaling, (9) correspondence analysis dan (10) structural equation modeling (SEM).

Analisis Faktor

Analisis faktor, yang meliputi principal component analysis (PCA) dan common factor analysis (CFA) adalah pendekatan statistik yang dapat digunakan untuk menganalisis “interrelationship” sejumlah (besar) variabel dan untuk menjelaskan dimensi-dimensi (disebut faktor) apakah yang melandasi variabel-variabel tersebut.

Tujuan PCA adalah memadatkan sejumlah besar informasi dari sejumlah variabel asli menjadi sejumlah kecil faktor dengan harapan informasi yang hilang dalam proses ini minimal.  Misalnya, cara pembayaran, besarnya diskon, harga akhir, kemudahan mendapatkan produk, mungkin saja dapat disatukan menjadi faktor biaya. Untuk menemukan lima dimensi kualitas layanan, Parasumaraman et al. (1988) melakukan analisis faktor terhadap 100 variabel pengamatan. Mereka memperoleh 22 item valid yang tergabung ke dalam lima dimensi.

Tujuan CFA adalah untuk mengonfirmasi apakah sejumlah variabel yang telah dispesifikasi sebagai satu kelompok benar satu kelompok. Misalnya, dalam  meneliti keterlibatan terhadap toko, …. menggunakan empat variabel, yaitu: (1) tingkat kepentingan produk-produk yang dijual dalam bagi pembeli, (2) relevansi produk-produk dalam toko bagi pembeli dan (3) kepedulian pembeli pada produk-produk yang dijual dalam toko. Katakanlah kita ingin menggunakan variabel yang sama. Setelah penelitian dilakukan kita melakukan CFA untuk mengonfirmasi apakah ketiga variabel tersebut menggambarkan konstruk yang sama, yaitu keterlibatan terhadap toko.  Materi ini selanjutnya dibahas dalam Bab 5.

Regresi Berganda

Regresi berganda merupakan metoda analisis yang tepat manakala masalah riset meliputi sebuah variabel dependen, datanya metrik, diasumsikan berhubungan dengan dua atau lebih variabel independen.  Caranya, dengan memprediksi perubahan variabel dependen melalui perubahan variabel-variabel independen.  Aturan yang dipakai adalah jumlah kuadrat terkecil (least squares).

Dengan metoda ini, kita dapat memprediksi besarnya variabel dependen.  Misalnya, apabila model atau rumusnya sudah ditemukan, penjualan  dapat diprediksi berdasarkan intensitas iklan, reputasi merek, jumlah toko yang memajang produk, dan jumlah wiraniaga.

Analisis Diskriminan

Kalau variabel dependen merupakan variabel nonmetrik, apakah dikotomi (misalnya pria-wanita) atau multikotomi (anak-anak, remaja, dewasa, lanjut usia), maka MDA dapat digunakan.  Variabel independen  bersifat metrik. Dengan alat ini,  sampel  dikelompokkan berdasarkan variabel-variabel dependen non-metrik.  Lalu, setiap entitas (misalnya individu), berdasarkan data-data metrik yang dimiliki, diprediki masuk ke kelompok manakah gerangan.  Berdasarkan data-data demografi dan psikografi, dengan alat ini, kita dapat membedakan, misalnya karakteristik pemegang kartu kredit beresiko tinggi ataukah rendah.

MANOVA dan MANCOVA

Multivariate analysis of variance (MANOVA) adalah teknik statistik yang dapat digunakan untuk mengeksplor hubungan di antara beberapa variabel independen yang bersifat kategorikal (biasanya disebut perlakuan) dan dua atau leih variabel independen metrik. MANOVA merupakan perluasan dari ANOVA (univariate analysis of variance).

MANCOVA (multivariate analysis of covariance) dapat digunakan bersama dengan MANOVA setelah mengeliminasi efek setiap ‘variabel independen metrik tak terkontrol’ (yang dinamakan kovariat) pada variabel-variabel dependen.  Prosedur yang sama dapat ditemukan pada korelasi parsial bivariat (bivariate partial correlation), dimana efek variabel ketiga dihilangkan dari korelasi.  MANOVA bermanfaat dalam eksperimen. Yang jelas, teknik ini bermanfaat kalau objek penelitian mengalami sejumlah perlakuan. Kemudian, peneliti ingin menguji varian respon berdasarkan perlakuan yang dibuat.

Analisis Konjoin

Katakanlah atribut teh adalah rasa, volume dan harga. Analisis konjoin dapat menjawab pertanyaan berikut: “Bagaimana tingkat kepentingan atribut-atribut produk berikut?”  Selain itu, kalau masing-masing atribut memiliki level, melalui analisis ini, kita dapat mengetahui preferensi konsumen terhadap kombinasi-kombinasi  level atribut yang tersedia.  Karena itu, analisis ini sangat bermanfaat dalam pengembangan produk baru.

Canonical Correlation

Analisis ini dapat dianggap sebagai perluasan regresi berganda. Dalam regresi berganda, hanya ada satu variabel dependen metrik.  Dengan korelasi kanonikal, peneliti dapat menghubungkan beberapa variabel dependen metrik dengan beberapa variabel independen metrik sekaligus.  Teknik ini bekerja dengan cara mengembangkan kombinasi linier dari setiap kumpulan variabel (dependen dan independen) untuk memaksimalkan korelasi kedua kumpulan data.

Analisis Klaster

Analisis ini sangat bermanfaat dalam membentuk kelompok-kelompok individu ataupun objek.  Teknik ini dipakai untuk mengelompokkan entitas (individu maupun objek) ke dalam kelompok-kelompok terpisah, berdasarkan kesamaan-kesamaan (similarities) di antara mereka.  Kalau dalam analisis diskriminan,  kelompok-kelompok didefenisikan terlebih dahulu, teknik ini justru mengidentifikasi kelompok-kelompok.

Analisis klaster memerlukan tiga langkah.  Langkah pertama, mengidentifikasi kesamaan atau asosiasi di antara entitas-entitas untuk mengetahui ada berapa grup di dalam sampel.   Langkah kedua merupakan proses kluster sebenarnya.  Setiap entitas dihubungkan dengan kelompok-kelompok atau klaster-klaster yang ada.  Langkah ketiga, membuat profil individu atau objek untuk mengetahui komposisi mereka.  Untuk keperluan ini, seringkali dilakukan analisis diskriminan, mengingat kelompok-kelompok yang ada sudah diindentifikasi pada langkah pertama.

Multidimensional Scaling

Dalam MDS, yang dilakukan adalah men-transformasi penilaian (judgement)  konsumen tentang kesamaan ataupun preferensi ke dalam jarak pada ruang multidimensi.  Kalau A dan B paling mirip dibanding pasangan objek lain yang ada, maka dalam ruang multidimensi, jarak A dan B paling dekat dibanding jarak antar pasangan yang lain.  Posisi setiap objek dapat dilihat dalam peta yang disebut perceptual map.  Dalam analisis ini, perlu diketahui atribut-atribut yang dipakai untuk memprediksi posisi setiap objek.

Analisis Korespondensi

Teknik ini memungkinkan reduksi  dimensional suatu objek (produk, orang) pada sejumlah atribut dan pemetaan persepsi objek-objek tersebut relatif terhadap atribut-atribut tersebut.  Para peneliti selalu dihadapkan pada kebutuhan untuk “mengkuantifikasi data-data kualitatif” yang diperoleh dalam skala nominal.  Analisis korespondensi berbeda dari teknik interdependen lain dalam mengakomodasi data nonmetrik dan hubungan nonlinear.

Dalam bentuk yang paling dasar, analisis korespondensi menggunakan tabel kontingensi, berupa tabulasi silang dengan menggunakan variabel-variabel dua kategori.  Lalu, dengan teknik ini, data nonmentrik ditransformasi menjadi data metrik dan dilakukan reduksi dimensional (sama dengan analisis faktor) dan pemetaan persepsi (sama dengan analisis multidimensi).  Sebagai contoh, preferensi merek responden dapat ‘ditabulasi silangkan’ berdasarkan variabel-variabel demografi (seperti jenis kelamin, pendapatan, pekerjaan) dengan menunjukkan berapa banyak responden yang ‘prefer’ terhadap setiap merek berada pada setiap kategori variabel demografi.  Melalui analisis korespondensi, asosiasi, atau “korespondensi” merek-merek dan karakteristik yang membedakan setiap merek dapat ditunjukkan dalam peta, yang memetakan karakteristik merek dan karakteristik responden, dalam peta dua atau tiga dimensi.  Merek-merek yang dipersepsikan sama berada pada lokasi yang berdekatan satu sama lain.  Demikian pula, karakteristik responden yang paling membedakan dalam membentuk preferensi merek, juga diperlihatkan kedekatan antara kategori variabel demografi dengan posisi merek.  Analisis korespondensi memberi representasi multivariat dari interdependensi data nonmetrik yang tidak mungkin diolah dengan metoda-metoda lain.

Model Probabilitas Linier

Model probabilitas linier, yang disebut juga logit analysis, merupakan kombinasi dari regresi berganda dan analisis diskriminan berganda.  Teknik ini sama dengan analisis regresi berganda dalam memprediksi variabel dependen tunggal melalui sejumlah variabel independen.  Bedanya, dalam teknik ini, variabel dependen bersifat non-metrik, sebagaimana dalam analisis diskriminan.  Memang, skala nonmetrik memerlukan metoda estimasi dan distribusi yang berbeda, namun dalam banyak hal lain, teknik ini sama dengan regresi berganda.  Manakala variabel dependen telah ditemukan dan teknik estimasi yang sesuai diperoleh, faktor-faktor dasar yang dipertimbangkan dalam regresi berganda juga digunakan dalam teknik ini.  Model probabilitas linier ini mengakomodasi jenis data independen, baik metrik maupun nonmetrik, serta tidak memerlukan asumsi normalitas multivariat.  Inilah yang membedakannya dari analisis diskriminan yang memerlukan variabel independen metrik.  Namun, kalau  variabel dependen memiliki lebih dari dua kategori, analisis diskriminan lebih cocok.

Structural Equation Modelling

Strucural equation modelling (SEM) memainkan berbagai peran analisis, yaitu persamaan simultan, analisis kausal linier, analisis lintasan (path analysis) (Wijanto, 2008), analisis mediasi dan moderasi, sekaligus analisis faktor konfirmatori.  Berbeda dari regresi yang menggunakan variabel teramati, SEM menggunakan variabel laten, sehingga sangat bermanfaat untuk memeriksa hubungan antar konstruk (variabel laten).

Manfaat lain SEM adalah kemampuannya untuk memeriksa hubungan kausal berberapa variabel laten sekaligus. Namun, untuk mencapai tujuan itu, diperlukan dasar teori yang kuat serta variabel-variabel pengamatan yang valid. Di sini pula kelebihan SEM. Kalau selama ini analisis validitas cukup menggunakan korelasi Pearson, maka dalam SEM digunakan factor loading, yang merupakan korelasi antara variabel teramati dengan common variance variabel laten.  Error variance juga diperhitungkan agar tidak melebihi varian yang diekstrak (variance extracted).

Dependence Techniques dan Interdependence Techniques

Berdasarkan hubungan antar variabel, analisis multivariat dapat dibedakan menjadi dependence techniques dan interdependence techniques (Hair et al. 2006; Malhotra and Birks, 2006).  Dalam dependence techniques, terdapat dua jenis variabel, yaitu varibel dependen dan variabel independen.  Yang termasuk pada golongan ini adalah analisis berganda, korelasi kanonikal, analisis diskriminan, MANOVA, MANCOVA dan model probabilitas linier. SEM juga termasuk kelompok ini, namun teknik ini tidak mengenal variabel dependen dan independen, akan tetapi variabel eksogen dan variabel endogen.

Analisis klaster, MDS, analisis faktor, dan analisis korespondensi, termasuk interdependen techniques. Dalam teknik ini, kedudukan setiap variabel sama, tidak ada variabel dependen, begitu pula variabel independen.  Yang diperiksa adalah inter-relasi antar variabel.  Dari inter-relasi itulah diambil kesimpulan-kesimpulan sesuai teknik yang dipakai.


Referensi

Hair, Jr., J.F., Black, W.C., Bobin, J.B., Anderson, R.E. & Thatam, R.L. (2006). Analisis Data Multivariate. Uppersaddle River: Pearson Prentice-Hall, Inc.

Malhotra, N.K. & Birks, D.F. (2006). Marketing Research An Applied Approach. Updated Second European Edition. Edinburg Gate: Perarson Education Limited.

Parasuraman, A., Zeithaml, V.A. and Berry, L.L. (1988) SERVQUAL: A Multiple-Item Scale for Measuring Consumer Perceptions of Service Quality. Journal of Retailing, 64, 12-40.

Sekaran, Uma.  2000.  Research Method for Business. New York: John Wiley and Sons.

Wijayanto, S.H. (2008). Structural Equation Modelling dengan Lisrel 8.8. Yogyakarta: Graha Ilmu.

Zikmund, W.G., Babin, B.J., Carr, J.C., &  Griffin, M. (2013). Business Research Method. South-Western: Cengage Learning.