Analisis Validitas dan Reliabilitas

Bilson Simamora, 4 Juli 2018

How to cite (APA 7-th Edition):

Simamora, B. (2018, July 4). Analisis validitas dan reliabilitas. Bilson Simamora Marketing and Research Center [Personal Blog]. https://www.bilsonsimamora.com/analisis-validitas-dan-reliabilitas/.

Apakah pengukuran yang kita lakukan akurat? Ini pertanyaan sederhana tetapi sangat penting di dalam sebuah riset. Seperti dijelaskan di sini, pengukuran adalah penggambaran karakteristik suatu objek yang dijadikan sebagai variabel penelitian ke dalam satuan kuantitatif atau kualitatif yang digunakan dalam penelitian.

Bagaimana mengetahui apakah pengukuran akurat atau tidak? Pertama-tama kita pahami dulu konsep kesalahan atau error dalam pengukuran. Kita mulai dari contoh. Berapa tinggi badan Bilson Simamora? Dengan alat ukur jengkal orang dewasa dihasilkan data: 9 jengkal. Dengan meteran medis yang biasa dipakai di rumah sakit, dihasilkan data: 164.50 cm.  Di antara kedua angka tersebut, mana yang lebih dipercaya? Pertanyaan ini dilanjutkan dengan pertanyaan: mana di antara alat ukur tersebut yang lebih teliti atau lebih kecil tingkat kesalahannya?

Jelas alat ukur jengkal tidak teliti. Ini alasannya.  Jengkal orang dewasa adalah satuan yang menunjukkan jarak terjauh antara ujung jari tengah dan jempol apabila direntangkan. Hasil yang didapatkan dari alat ukur ini berpotensi berbeda-beda apabila dilakukan pengukuran berkali-kali akibat alasan-alasan berikut. Pertama, panjang jari orang dewasa berbeda-beda. Keluwesan jari untuk direntangkan berberda-beda. Oleh karena itu, data yang dihasilkan oleh alat ukur jengkal berbeda-berbeda dari satu pengukuran ke pengukuran lain. Dengan kata lain alat ukur jengkal tidak reliabel. Lain halnya dengan meteran medis. Alat ukur ini mampu mengukur dengan tepat sampai satuan milimeter. Hasilnya akan selalu sama apabila tinggi badan orang yang sama diukur berkali-kali. Dengan kata lain meteran medis adalah alat ukur reliabel.

Alat ukur yang reliabel diharapkan menghasilkan data yang akurat (valid).  Valid-tidaknya suatu pengukuran tergantung pada apakah data menggambarkan karakteristik objek yang ingin diukur dan apakah item-item pengukuran menggambarkan variabel yang ingin diukur? Instrumen penelitian yang reliabel belum tentu menghasilkan data yang valid. Contoh, apabila tinggi badan diukur menggunakan meteran medis, pengukuran tidak akurat kalau pada saat diukur responden menggunakan sepatu atau badan tidak tegak.  Dengan demikian, agar menghasilkan pengukuran yang valid, yaitu pengukuran mengukur apa yang seharusnya diukur (measure what supposed to be measured), variabel penelitian harus didefenisikan terlebih dahulu: “Tinggi badan adalah jarak terjauh antara bagian atas kepala dan telapak kaki dalam keadaan badan tegak”.  Materi tentang mendefenisikan variabel operasional lihat di sini.

Uji Validitas

Uji validitas dimaksudkan untuk mengetahui apakah pengukuran yang kita lakukan mengukur apa yang mau diukur? Seperti dijelaskan di sini, pengukuran adalah proses menggambarkan karakteristik-karakteristik objek penelitian, yang dijadikan sebagai variabel, dengan menggunakan satuan-satuan kualitatif dan kuantitatif yang diakui.  Ada dua kategori validitas, yaitu criterion validity dan construct validity, seperti pada gambar di bawah ini.

Criterion Validity

Validitas ini terdiri dari dua bagian. Pertama adalah concurrent validity, yang mempertanyakan apakah hasil pengukuran menggambarkan keadaan sebenarnya. Dalam contoh yang mengawali artikel ini disebutkan bahwa tinggi badan Bilson Simamora adalah 164.50 cm. Seberapa dekat angka ini dengan tinggi badan sebenarnya? Itu yang disebut concurrent validity. Jadi, apabila seorang peneliti menghasilkan data terkait sejumlah variabel, pertanyaan terkait concurrent validity adalah apakah data itu menggambarkan keadaan sebenarnya variabel? Ataukah responden asal mengisi kuesioner sehingga terjadi bias? Itulah yang menjadi perhatian concurrent validity. Secara konseptual validitas ini dapat dipahami secara statistik tidak tersedia alat uji concurrent validity.  Yang dapat kita lakukan adalah memastikan bahwa operasionalisasi variabel-variabel penelitian dilakukan dengan tepat seperti dijelaskan di sini, instrumen tidak memiliki potensi bias seperti dijelaskan di sini,  metoda penentuan sampel seperti di sini dan data dikumpulkan dengan skala yang tepat seperti dijelaskan di sini. Langkah lainnya adalah mendeteksi dan mengeluarkan outliers.

Bagian kedua, yang disebut predictive validity,  mempertanyakan apakah operasionalisasi suatu konstruk berkorelasi dengan konstruk lain yang secara teoritis terkait? Misalnya, apakah intellectual quotient (IQ) mempengaruhi prestasi belajar? Kalau YA, menurut kriteria ini, konstruk yang diuji valid.

Predictive validity sangat penting diperlukan apabila peneliti menghasilkan suatu konsep dan ingin membuktikan makna konsep itu. Misalnya, Simamora (2021) pada artikel ini menghasilkan konsep anticipated emotions of other people dan membuktikan bahwa konsep tersebut berpengaruh pada achievement motivation. Dengan bukti ini predictive validity konsep baru tersebut terpenuhi.

Construct Validity

Validitas konstruk (construct validity) mempertanyakan apakah apakah variabel-variabel pengukuran mengukur konstruknya.  Validitas ini terdiri dari empat bagian, yaitu face validity, content validity, covergent validity, dan discriminant validity. Face validity berkenaan dengan apakah variabel-variabel operasional secara logika atau teori mengukur konstruk penelitian? Misalkan kita ingin mengetahui maksud pembelian kembali (repurchase intention) seseorang, maka secara teori pertanyaan ini jelas tidak valid: “Apakah anda puas  terhadap sampho X?” Namun, pertanyaan ini valid: “Apakah anda akan membeli kembali sampho X bila memerlukannya lagi?” Untuk memastikan face validity seorang peneliti memerlukan operasionalisasi variabel dengan rinci, seperti dijelaskan di sini.

Content validity membahas apakah variabel-variabel yang digunakan mengambarkan konstruknya dan apakah variabel-variabel dimaksud sudah cukup ataukah masih kurang dalam menggambarkan konstruknya? Validitas konten (content validity) diperiksa dengan pertanyaan variabel-variabel yang mewakili suatu konstruk  berhubungan erat dengan konstruknya secara sendiri-sendiri? Hubungan ini dinyatakan oleh koefisien korelasi ataupun factor loading (FL).

Convergent validity memeriksa lebih lanjut apakah variabel-variabel yang telah memenuhi content validity memiliki keterpaduan, koherensi, atau ke-solid-an (solidity) sebagai sebuah kumpulan variabel yang menggambarkan sebuah konstruk? Validitas ini diperiksa menggunakan nilai average variance extracted (AVE) dan composite atau construct reliability (CR).

Discriminant validity berkaitan dengan apakah variabel-variabel sebuah konstruk hanya berkaitan dengan konstruknya sediri ataukah juga dengan konstruk lain? Apabila hanya sekumpulan variabek hanya berhubungan erat dengan konstruknya, maka validitas diskriminan terpenuhi. Sebaliknya, kalau berhubungan erat juga dengan konstruk lain selain konstruknya, maka sekumpulan variabel tidak memenuhi validitas diskriminan.

Pada penelitian-penelitian kuantitatif tingkat internasional, validitas konten dan validitas konvergen merupakan keharusan. Validitas diskriminan bukan sebuah keharusan. Kriteria ini digunakan apabila konstruk yang digunakan peneliti tidak memiliki keterkaitan secara teoritis. Namun, apabila peneliti menggunakan sub-konstruk, yang tentunya merupakan bagian dari konstruk yang lebih besar, validitas diskriminan boleh tidak digunakan karena hubungan antara sebuah sub-konstruk dengan sub-konstruk lain, merupakan keniscayaan.

Melakukan Validitas Konstruk

Pada contoh di bawah ini, untuk menentukan validitas konten, kita menggunakan korelasi dan factor loading. Sedangkan untuk memastikan convergent validity, kita menggunakan variance extracted dan composite reliability. Topik tentang discriminant validity dibahas pada seksi berikutnyaPertama-tama, kita lihat dulu tabel operasionalisasi variabel penelitian di bawah ini, yang diambil dari disertasi penulis di Universitas Indonesia.

Untuk uji validitas konten, yang mau kita uji adalah:

  1. Apakah INCOM1 s/d INCOM4 merupakan bagian dari konstruk ‘incom’?
  2. Apakah EXFUNC 1 s/d EXFUNC6 merupakan bagian dari konstruk ‘exfunc’?
  3. Apakah EXSYM 1 s/d EXSYM5 bergabung pada konstruk ‘exsym’?
  4. Apakah PAE1 s/d PAE5 bersatu dalam konstruk ‘pae’?

Analisis validitas dan reliabilitas dilakukan per konstruk. Untuk memantapkan pemahaman, mari kita lakukan analisis validitas dan reliabilitas.  Dengan menggunakan kuesioner berdasarkan Tabel 12, kita peroleh data pada link ini. Silakan di-klik.

Setelah di-down-load, periksa ‘measure‘ setiap variabel. Biasanya SPSS memberikan status ‘unknown‘. Ubah menjadi ‘scale‘.  Kadang-kadang proses down-load juga tidak sempurna, sehingga ada unit analisis (case) yang datanya tidak terekam, yang ditandai dengan tanda tanya (?). Kasus demikian hapus saja.

Analisis validitas kita lakukan per konstruk saja sebagai contoh, yaitu intensi partisipasi konsumen (incom). Untuk konstruk lain silakan dikerjakan sendiri untuk latihan.

Melakukan Uji Validitas Konten dengan Korelasi

Untuk menganalisis korelasi, lakukan prosedur berikut ini: Analysis>Correlate>Bivariat. Pada jendela dialog yang terbuka masukkan incom1, incom2, incom3, dan incom4 dan total_incom ke dalam sel Variables. Untuk test of significance tandai one-tailed karena hipothesis yang diuji dalam contoh kali ini adalah Ho: r>0. Artinya, untuk kasus ini, setiap variabel operasional kita duga menggambarkan konstruknya secara positif (atau berkorelasi) positif dengan konstruknya (diwakili ‘total_incom).

Kalau ada variabel yang mengggambarkan secara positif, adakah yang menggambarkan konstruknya secara negatif? Secara konseptual jawabnya ada. Misalnya, apabila kadar polusi dijadikan sebagai salah satu indikator kualitas udara, maka semakin tinggi kadar polusi, semakin rendah kualitas udara. Jadi,  kadar polusi merupakan indikator kualitas udara yang valid walaupun korelasi antar keduanya yang negatif. Bahkan, dalam contoh ini, justru korelasi negatif yang diharapkan.

Data berikut ini adalah hasil down-load  yang anda telah lakukan tadi.  Untuk mencari korelasi variabel dengan konstruknya, lakukan prosedur berikut: Analyze>Correlation>Bivariat. Masukkan semua variabel serta konstruknya ke dalam sel ‘variables’.  Kemudian, karena setiap variabel diasumsikan menggambarkan konstruknya secara positif, pada ‘test of significance‘, tandai ‘one-tailed‘.

Hasil analisis korelasi adalah sebagai berikut:

Perhatikan bagian yang diarsir. Itulah yang menjadi perhatian kita. Keempat variabel memiliki korelasi yang tinggi dengan konstruknya (r>0.7), di mana korelasi ini signifikan pada alpha atau nilai sig.=0.000. Pada batas itu, diharapkan sebuah variabel dapat menjelaskan 0.49 atau 49 persen atau kira-kira setengah dari varian konstruknya (didapat dengan memangkat-duakan koefisien). Batas itu dapat diterima asalkan variabel bersangkutan valid secara koheren bersama variabel-variabel operasional lainnya.

Sebagian peneliti hanya menggunakan tingkat signifikansi koefisien korelasi. Intinya, apabila korelasi sebuah variabel signifikan, maka sebuah variabel dianggap valid. Pertanyaannya, berapa batas ‘r’ yang dianggap valid (alpha=0.05) untuk N=200? Pada link ini (klik) ditunjukkan bahwa nilai kritis pada alpha=0.05 untuk N=150 adalah 0.159 dan pada N=300 adalah 0.113. Berarti, untuk N=200, nilai kritis r pada alpha=0.05 adalah 0.159 – [(200-150)/(300-150)*(0.159-0.113)=0.140. Berarti, dengan kriteria ini, untuk N=200 dan alpha=0.05, setiap variabel yang memiliki nilai korelasi sebesar 0.140 atau lebih dianggap valid

Apabila korelasi sebuah variabel dengan konstruknya=0.140, maka koefisien determinasi atau r kuadrat=0.0196. Artinya, informasi yang dimiliki variabel tentang konstruknya adalah 0.0196 atau 1.96%. Sebanyak 0.9804 atau 98.04% dari informasi yang dimiliki variabel tidak menjelaskan konstruknya.  Jadi, apabila nilai r hanya sebatas nilai kritis agar dianggap valid, informasi yang disumbangkan variabel bagi konstruknya sangat rendah. Oleh karena itu, menjadikan nilai kritis r sebagai batas valid-tidaknya suatu variabel adalah tidak tepat.

Pertanyaannya, apakah korelasi dapat digunakan sebagai kriteria validitas? Jawabnya dapat, tetapi tetapkanlah batas korelasi yang tinggi, misalnya r=0.7, sehingga apabila dikuadratkan, maka variabel operasional yang dinyatakan valid masih menyumbangkan setidaknya separuh (0.49 atau 49%) dari informasi yang dimilikinya bagi konstruk.

Sekalipun menetapkan batas nilai korelasi yang tinggi sebagai kriteria, masih terdapat kelemahan korelasi untuk menguji validitas.  Pertama, dalam korelasi, yang diperhitungkan adalah varian total. Seperti telah dijelaskan, varian total yang dimiliki sebuah variabel terdiri dari common variance, unique variance dan error variance.  Dengan menggunakan korelasi, koefisien determinan diperoleh diperoleh dari varian total, sehingga tidak benar-benar menggambarkan konstruknya. Kelemahan kedua, skor konstruk diperoleh dengan cara menjumlahkan skor semua variabel (summated scale) tanpa memedulikan bobot masing-masing variabel. Padahal, dalam memperoleh nilai variate, seharusnya bobot variabel-variabel anggotanya diperhatikan. Penjelasan lebih lengkap lihat pada halaman ini.  Teknik yang dapat mengatasi kedua kelemahan ini adalah confirmatory factor analysis.

Confirmatory Factor Analysis

Bagaimana variabel atau dimensi mengukur atau memberi informasi tentang konstruknya? Sebelum menjawab pertanyaan ini perlu dipahami bahwa varian total suatu variabel terdiri dari common variance (varian bersama), unique variance (varian yang dimiliki sendiri) dan error variance (varian karena kesalahan pengukuran).  Perumpamaan untuk menjelaskan varian ini adalah DNA (deoxyribonucleic acid), yaitu kode genetika yang menentukan sifat-sifat seseorang. DNA ada tiga jenis, yaitu DNA yang dimiliki bersama, DNA yang unik dan DNA penyimpangan. Orang bersaudara memiliki DNA yang sama daripada yang berbeda dan menyimpang. Varian bersama ini dapat kita bayangkan seperti DNA bersama tersebut.  Jadi, sebuah variabel dikatakan ‘bersaudara’ dengan variabel-variabel lain yang tergabung dalam suatu konstruk apabila memiliki porsi common variance yang besar. Dengan dasar pemikiran ini sampailah kita pada analisis vadilitas konten menggunakan factor loading.

Pada Tabel 12, misalnya, empat variabel, yaitu INCOM1, INCOM2, INCOM3, dan INCOM4, oleh peneliti dispesifikasi tergabung dalam konstruk intensi partisipasi komunitas (incom). Setelah dilakukan pengumpulan data, validitas konten bisa juga dilakukan menggunakan analisis faktor untuk mengonfirmasi betulkah keempatnya tergabung dalam konstruk yang sama? Karena analisis faktor yang digunakan bertujuan mengonfirmasi keanggotaan variabel-variabel pada sebuah konstruk yang telah dispesifikasi secara teoritis, maka metoda ini terkenal dengan sebutan confirmatory factor analysis (CFA).

Biasanya, selain validitas konten, dalam CFA sekaligus diperiksa validitas konvergen karena perhitungan average variance extracted (AVE) dan composite reliability (CR) dilakukan secara manual berdasarkan nilai factor loading (FL) yang dihasilkan oleh program. Singkatnya, CFA mencakup validitas konten dan validitas konvergen. Karena itu, analisis dan pelaporannya dilakukan sekaligus.

Sebagaimana disampaikan, varian yang dipertimbangkan seharusnya adalah varian bersama, yang dimiliki bersama oleh variabel-variabel yang dianalisis. Karena itu, dalam CFA, varian yang digunakan adalah common variance dan analisis faktor yang digunakan adalah common factor analysis.

Struktural equation modeling (SEM) adalah teknik CFA sejati. Oleh karena itu, para pembaca yang telah mahir menggunakan teknik-teknik SEM, seperti Lisrel dan Amos, dipersilakan untuk menggunakannya. Analisis faktor dalam SPSS sejatinya termasuk exploratory facfor analysis (EFA). Namun, walaupun termasuk EFA, penggunaan SPSS untuk CFA dapat ditoleransi asalkan menggunakan teknik ekstraksi yang hanya memperhitungkan common variance, seperti principal axis factoring, maximum likelihood, atau alpha factoring. Cara melakukannya seperti berikut ini.

Pada layar SPSS yang sudah terbuka dan data sudah di-download dari link ini, lakukan prosedur berikut : Analyze>Dimension Reduction>Factor. Lalu masukkan INCOM1 s/d INCOM4 ke dalam space Variables. Klik Extraction, lalu metodanya pilih Principal Axis Factoring.  Kemudian klik OK. Dihasilkan berbagai output, di antaranya yang dibahas berikut ini.

 

 

 

 

 

Output 1 berisikan common variance masing-masing variabel, yang berada pada kolom ‘initial‘.  Kolom extraction pada Output 1 menyatakan persentase common variance yang diekstrak. Output 2 menyatakan bahwa keempat variabel hanya tergabung dalam satu variabel laten, di mana varian keempat variabel yang didapat dijelaskan olehnya adalah 50.334%. Ini merupakan bukti pertama bahwa keempat variabel pengamatan bergabung pada satu konstruk karena program hanya menawarkan satu variabel laten (disebut juga component dalam SPSS) dan variabel laten tersebut dapat menjelaskan lebih dari setengah varian variabel-variabel pengamatan.

Sebagai catatan, konstruk adalah istilah teoritis, sedangkan variabel laten adalah istilah statistik, yang menyatakan sebuah variabel besar yang mendasari sejumlah variabel pengamatan, yang terdeteksi oleh program. Dalam exploratory factor analysis (EFA), kita justru menggali variabel laten ini dan menahbiskannya sebagai konstruk baru apabila belum ada sebelumnya. Namun, kalau berasal dari konstruk yang telah dispesifikasi sebelumnya, variabel latent ini kita pakai untuk mengonfirmasi konstruk yang kita gunakan, seperti lazim dilakukan dalam confirmatory factor analysis.

Output 3 di bawah menyatakan factor loading (FL) antara setiap variabel dengan faktornya. FL ini adalah semacam korelasi, tetapi berbeda dari korelasi product moment atau Spearman.  Pada common factor analysis, FL hanya memperhitungkan common variance, sedangkan pada korelasi product moment yang diperhitungkan adalah total variance. Jadi, dalam CFA (sekali lagi hanya dalam CFA, dalam teknik lain, yaitu PCA lain lagi), FL adalah korelasi berbasis common variance antara variabel dengan faktornya, dan oleh karena itu, dapat digunakan dalam analisis validitas konstruk.

Hair et al. (2016) menyatakan bahwa FL≥0.5 dapat diterima, sedangkan Wijanto (2008) menginginkan FL≥0.7. Kali ini kita menggunakan pendapat Hair et al. (2016). Terlihat bahwa keempat variabel sudah memenuhi syarat FL minimal. Dengan demikian dapat disimpulkan bahwa analisis validitas konten (content validity) sudah terpenuhi.

Pertanyaannya, apakah analisis validitas sudah selesai setelah validitas konten keempat variabel (incom1, incom2, incom3 dan incom 4) valid, dengan dipenuhinya syarat FL minimal? Pada beberapa perguruan tinggi validitas konten sudah cukup untuk penelitian level skripsi. Namun, untuk level tesis dan disertasi, umumnya perguruan tinggi mengharuskan dipenuhinya validitas konvergen. Hair et al. (2006) juga menyatakan bahwa FL tidak cukup untuk memeriksa validitas konstruk, masih dibutuhkan syarat lain, yaitu validitas konvergen dan validitas diskriminan, di mana terakhir ini dipakai dengan catatan, seperti telah dijelaskan di atas.

Validitas konvergen memeriksa apakah variabel-variabel penelitian memiliki kepaduan atau tidak. Ada dua kriteria yang digunakan, yaitu average variance extracted (AVE) dan construct reliability (CR) atau composite reliability (CR). AVE adalah rata-rata variance yang diekstrak oleh program. Datanya ada di Output 1, yaitu kolom extraction. Berdasarkan data tersebut diperoleh rata-rata AVE sebesar 0.503.  Bisa pula kita gunakan data dari Output 3. Caranya, pangkat-duakanlah FL, kemudian cari rata-ratanya, itulah AVE. Perhitungannya seperti di bawah ini.

Nilai AVE minimal yang dapat ditoleransi adalah 0.5 (Hair et al., 2016; Wijanto, 2008). Karena itu, AVE=0.503 sudah memenuhi syarat.

Langkah selanjutnya adalah mememeriksa nilai CR. Walaupun menggunakan kata reliability, CR adalah indikator validitas konstruk, bukan reliabilitas instrumen. Jangan sampai salah paham.

CR dicari dengan rumus berikut:

FL=factor loading, EV=error variance.  Error variance= 1 – Variance Extracted.

Di bawah ini disajikan dua tabel. Tabel pertama dibuat untuk membantu perhitungan AVE dan CR. Tabel kedua dibuat untuk menunjukkan bentuk tabel yang dipakai dalam laporan. Contoh bentuk tabel yang lengkap bisa dilihat pada Tabel 4 dan Tabel 5 pada artikel ini (silakan klik).

VARIABEL FL FL2 atau VE EV CR
INCOM1 0.704 0.496 0.504 0.799
INCOM2 0.673 0.453 0.547
INCOM3 0.809 0.654 0.346
INCOM4 0.641 0.411 0.589
RATA-RATA 0.504
TOTAL 2.827 2.014 1.986

 

Contoh Tabel Validitas Konstruk dalam Laporan
VARIABEL FL VE CR
INCOM1 0.704 0.504 0.801
INCOM2 0.673
INCOM3 0.809
INCOM4 0.641
RATA-RATA

Pada tabel tersebut tampak bahwa AVE=0.504, sigma FL=2.827, dan sigma EV2=0.1986. Dengan demikian, CR=(2.827)2/((2.8272+1.986)=0.801. Dengan nilai 0.801, CR melewati batas ambang minimal (CR=0.6). Karena itu, berdasarkan kriteria ini, kedua variabel yang dianalisis dinyatakan valid. Penampilan lengkap validitas konten dan konvergen pada jurnal internasional dapat dilihat pada Tabel 4 dan Tabel 5 artikel ini.

Validitas Diskriminan

Validitas diskriminan sedang dipersiapkan dan akan dibuat pada halaman terpisah agar blog-nya rame judul (heheheh) dan halaman ini tidak kepanjangan. Penjelasannya ada halaman ini.

Bagaimana Kalau Ditemukan Variabel Pengamatan yang Tidak Valid? Temukan jawabannya di sini (klik).

Validitas External

Satu lagi konsep menggunakan istilah ‘validitas’ adalah validitas eksternal. Konsep ini tidak berkaitan dengan topik yang dibahas, namun perlu disampaikan di sini agar tidak menimbulkan kebingungan. Validitas eksternal (external validity) berkaitan dengan apakah suatu konsep atau model penelitian, kalau diuji pada penelitian yang berbeda, akan menghasilkan hasil yang sama. Misalnya, penelitian Simamora (2021) ini, dilakukan di satu perguruan tinggi di Jakarta. Kalau penelitian yang sama dilakukan di universitas lain, apakah hasilnya sama? Kalau ya, berarti validitas eksternal konsep atau model penelitian terpenuhi. Model yang dinamakan Theory Planned Behavior (TPB), yang bisa dipakai untuk memrediksi perilaku, telah memenuhi validitas eksternal karena telah berhasil di-verifikasi oleh puluhan ribu penelitian.

RELIABILITAS

Konsep ini berkaitan dengan kualitas suatu instrumen, yang dinyatakanoleh akurasi satuan yang dihasilkan.  Bayangkan kita mengukur suhu air hangat. Kita gunakan dua instrumen, yaitu termometer dan jari telunjuk. Pengukuran dilakukan lima kali oleh lima orang berbeda. Hasilnya, dengan termometer, angka yang dihasilkan adalah 37, 36.8, 37.1, 37.2 dan 36.9 derajat celsius. Sedangkan dengan jari telunjuk, angka perkiraan yang dihasilkan lima orang adalah 30, 40, 36, 45 dan 25 derajat celsius. Jelas, dalam contoh ini, termometer lebih reliabel dibanding jari telunjuk karena menghasilkan angka yang lebih konsisten.

Dalam riset pemasaran reliabilitas menyatakan kemampuan instrumen untuk menghasilkan hasil (skor atau satuan) yang konsisten apabila digunakan untuk mengukur variabel berkali-kali.  Kuesioner yang reliabel adalah kuesioner yang apabila dicobakan secara berulang-ulang kepada responden yang sama akan menghasilkan data yang sama.  Asumsinya, tidak terdapat perubahan psikologis pada responden.  Memang, apabila data yang diperoleh sesuai dengan kenyataannya, berapakali pun pengambilan data dilakukan, hasilnya tetap sama.

Pertanyaannya, untuk melakukan uji reliabilitas sebuah instrumen (misalnya kuesioner), apakah kita harus melakukan pengukuran lebih dari satu kali? Ada dua jenis reabilitas, yaitu reliabilitas eksternal dan reliabilitas internal.

Reliabilitas Eksternal

Secara garis besar, reliabilitas eksternal adalah reliabilitas yang diperoleh dengan membandingkan hasil dua kelompok data.  Ada dua jenis cara untuk menguji reliabilitas eksternal, yaitu teknik paralel dan teknik ulang.

Teknik  paralel

Pada teknik paralel, peneliti perlu menyiapkan dua perangkat kuesioner,  kemudian keduanya dicobakan pada sekelompok responden yang sama.  Hasil dari kedua percobaan kemudian dikorelasikan dengan teknik product moment atau korelasi Pearson.  Sekelompok data dijadikan sebagai variabel X, sekelompok lainnya dijadikan sebagai variabel Y.  Tinggi rendahnya koefisien korelasi keduanyalah yang menentukan reliabilitas kuesioner.

Karena menggunakan dua instrumen dan pengisian kuesioner dilakukan dua kali, maka teknik ini disebut teknik double test double trial.

Teknik Berulang  Dalam teknik ini, kuesioner yang dicobakan hanya hanya satu set, namun percobaan dilakukan dua kali.  Dengan kata lain, sekelompok responden diminta untuk mengisi kuesioner dua kali.  Kemudian, kedua kelompok data, yaitu hasil percobaan kuesioner pertama dan kedua, dikorelasikan. Karena dalam teknik ini hanya dibutuhkan satu set kuesioner dengan dua kali uji coba, maka teknik ini dinamakan single test double trial.

Reliabilitas Internal

Kalau reliabilitas eksternal diperoleh dengan menganalisis dua kelompok data, baik dari perangkat kuesioner yang berbeda maupun sama, maka reliabilitas internal diperoleh dengan menganalisis data yang berasal dari satu kali pengujian kuesioner.  Terdapat berbagai rumus (teknik) mencari reliabilitas, yaitu Spearman-Brown, Flanagan, Rulon, K-R. 20, K-R.21,  Hoyt dan Cronbach Alpha.

Dari semua teknik yang dibahas, yang paling paling banyak digunakan dalam Riset Pemasaran adalah reliabilitas internal dengan teknik Cronbach Alpha. Itulah yang kita bahas lebih lanjut.  Lagi pula, semua rumus reliabilitas internal selain Cronbach Alphya  hanya bisa digunakan apabila kategorisasi jawaban hanya menggunakan variabel diskrit yang skor-nya 0 atau 1.  Masalahnya, kebanyakan penelitian tidak lagi menggunakan variabel diskrit, tetapi skala berganda (multiple scale) yang skornya bisa antara 1 sampa1 5, 1 sampai 7, -3 sampai 3, dan seterusnya. Untuk hasil penelitian yang diperoleh melalui skala berganda, maka Cronbach Alpha adalah teknik yang tepat.

Ada juga peneliti yang menyederhanakannya dengan mengelompokkan jawaban skala yang digunakan menjadi dua kategori.  Misalnya, untuk skala 1 sampai 5, maka jawaban 3 ke bawah diberi 0 dan di atas 3 diberi 1.  Daripada repot melakukan hal seperti itu, lebih baik menggunakan Rumus Alpha yang memang digunakan untuk menganalisis reliabilitas kuesioner yang skalanya bukan 0 dan 1.

Cronbach Alpha menggunakan rumus:

Keterangan:

  • r11  atau r-alpha = reliabilitas instrumen
  • k          = banyaknya butir pertanyaan
  •  =jumlah varian butir
  • st2  = varian total

Data di bawah ini diperoleh dari 10 responden. Dengan data seperti itu, bagaimana dengan reliabilitas instrumen yang digunakan? Mari kita cek sama-sama.

Maka dengan menggunakan rumus di atas diperoleh:

Dengan tingkat kepercayaan 99% dan jumlah responden (n)=10, r-alpha tabel adalah 0.765.  Karena r-alpha hitung>r-alpha tabel cukup bukti untuk menyatakan bahwa  instrumen (kuesioner) reliabel pada tingkat kepercayaan 99%.

Berita baiknya, dengan SPSS dengan mudah kita memperoleh nilai Cronbach Alpha, jadi tidak perlu dilakukan perhitungan manual. KIta juga tidak perlu membandingan nilai Cronbach Alpha hitung dan tabel, cukup memenuhi ketentuan saja bahwa apabila nilai Cronbach Alpha lebih besar atau sama dengan 0.7, maka intrumen adalah reliabel. Batas 0.6 masih ditoleransi. Selang selang 0.6 s/d 0.7 masih diterima atau cukup reliabel. Namun, yang diharapkan adalah r-alpha=0.7 atau lebih besar (Hair et al. 2016).

Silakan lakukan analisis validitas dan reliabilitas ketiga konstruk lainnya.

DAFTAR REFERENSI

DeCoster, J. (1998).  Overview of Factor Analysis. Retrieved March 24, 2011, from http://www.stat-help.com/notes.html.

Hair, Jr., J.F., Black, W.C., Bobin, J.B., Anderson, R.E. & Thatam, R.L. (2016). Analisis Data Multivariate. Upper Saddle River: Pearson Prentice-Hall, Inc.

Kotler, P. & Keller, K.L. (2016). Marketing Management. Sixteenth Edition. Upper Saddle River: Pearson Prentice-Hall, Inc.

Wijayanto, S.H. (2008). Strucutral Equation Modelling dengan Lisrel 8.8. Graha Ilmu: Yogyakarta.