Skala Pengukuran

Bilson Simamora, 8 Januari 2018

KALAU ingin mengetahui faktor-faktor apa yang mempengaruhi keberhasilan para salesman, maka salesman kita posisikan sebagai satuan analisis, yang disebut juga subjek penelitian. Dari subjek penelitian tersebut, yang kita mau ukur adalah karakteristik yang relevan dengan keberhasilan menjual, misalnya usia, pengalaman kerja, jumlah menelepon per hari dan lain-lain. Semua itu dapat  diukur langsung.  Karakteristik lain, seperti motivasi, daya tahan menghadapi stres, kemampuan menyelesaikan masalah dan kemampuan membujuk, sulit diukur secara langsung, namun dengan instrumen yang tepat, tetap dapat diukur.

Pengukuran adalah penerapan satuan-satuan kuantitatif maupun kualitatif pada objek (subjek) penelitian, yang mendeskripsikan jumlah atau tingkat properti-properti yang dimiliki objek tersebut. Satuan-satuan yang dipakai adalah yang dapat diterima secara umum dan tidak bertentangan dengan kaidah-kaidah ilmiah. Kalau properti yang diukur adalah berat badan, maka satuan yang dipakai adalah kilogram, bukan gram, walaupun sama-sama menyatakan ‘berat’. Kalau yang diukur adalah kepuasan, salah satu satuannya adalah sangat puas, puas, cukup puas, tidak puas, sangat tidak puas.

Satuan-satuan yang digunakan diperoleh dari skala pengukuran. Satuan ‘cm’, diperoleh dari skala pengukuran yang panjang-pendeknya interval dalam alat ukur dinyatakan dalam cm atau skala lain yang dapat ditransfer ke dalam cm, misalnya dari mm menjadi cm. Timbangan emas dibuat dengan skala miligram, sehingga menghasilkan satuan miligram dan bisa ditransfer menjadi gram.  Oleh karena itu, fokus perhatian penting dalam pengukuran adalah skala pengukuran.

Masukkan termometer ke dalam air, biarkan beberapa saat, ambil kembali, lalu lihat angka yang ditunjukkannya untuk mengetahui berapa derajat panas air itu. Itulah salah satu pengukuran. Dalam pengukuran, kita memiliki skala, lalu kita wakilkanlah indikator properti ke dalam skala itu.

Instrmen pengukuran menentukan satuan analisis yang diperoleh, sekaligus jenis atau tingkatan data, apakah data nominal, data ordinal, data interval ataukah data rasio.  Untuk kasus ini, pemakaian kata ‘data’ sering bergantian kata ‘skala’.  Tidak usah bingung kalau menemukan istilah skala nominal, skala ordinal, skala interval dan skala rasio.  Maksud kedua kata sama- sama menyatakan tingkatan ataupun jenis data.  Hanya saja, untuk menghindari kesimpangsiuran dengan penggunakan kata skala pada instrumen, maka untuk menyatakan jenis, untuk kesempatan ini kita pakai istilah data nominal, data ordinal, data interval dan data rasio.

Data Nominal

Mengukur jenis kelamin menjadi: laki-laki dan perempuan menghasilkan data nominal. Data nominal hanya melakukan kategorisasi variabel yang diukur. Satu kategori dengan kategori lain tidak dapat diurutkan berdasarkan tingkatan. Kita tidak bisa mengatakan bahwa laki-laki lebih tinggi dari perempuan, demikian pula sebaliknya.

Sifat lainnya, data nominal tidak memiliki jarak. Kalau satuan kita cm, misalnya, maka antara 10 cm dan 15 cm, ada jarak, yaitu 5 cm. Kalau data nominal kita adalah suku,  maka data yang  kita miliki tidak memiliki jarak. Kita tidak bisa mencari jarak Suku Batak dan Suku Jawa.

Sekali pun kita menggunakan angka-angka, misalnya perempuan 0 dan laki-laki 1, jangan sekali-sekali memperlakukan angka itu sebagai data kuantitatif yang bisa ditambahkan, dikalikan dan dicari rata-rata. Angka-angka itu hanya label.

Dengan data nominal, alat analisis yang kita miliki memang terbatas. Akan tetapi, data nominal tetap memiliki manfaat dan bisa dianalisis dengan alat yang sesuai. Uji Kai kuadrat (chi-square ) merupakan uji yang sangat kuat (powerfull) untuk data nominal.  Korelasi juga dapat dhitung dengan menggunakan koefisien kontingenci C.

Kategorisasi variabel harus exclusively independent. Artinya, satu objek atau subjek penelitian hanya masuk pada satu kategori.

Data Ordinal

 Apa yang dimiliki data nominal, yaitu kategorisasi variabel, juga dimiliki data ordinal. Bedanya, kategori-kategori dalam data ordinal dapat diurutkan.  Misalnya, dengan data ordinal, tingkat kepuasan kita bagi menjadi lima kategori: sangat puas, puas, cukup puas, tidak puas, sangat puas. Hasilnya adalah data ordinal, sebab kita bisa mengatakan bahwa ‘sangat puas’ lebih tinggi tingkat kepuasannya dibanding ‘puas’, dan seterusnya.

Dalam data ordinal, berlaku postulat: bila a>b, dan b>c, dengan sendirinya a>c.

Dalam data ordinal, hanya ada urutan, tetapi jarak antar kategori tidak ada. Kita tidak bisa mengatakan bahwa jarak antara ‘sangat puas’ dengan ‘puas’, sama dengan jarak antara ‘tidak puas’ dengan ‘sangat tidak puas’.  Oleh karena itu, pemakaian beberapa perhitungan, seperti rata-rata dan standar deviasi, tidak dapat dibenarkan.

Sekali pun kita dapat menggunakan angka-angka, misalnya sangat puas=5, puas=4, cukup puas=3, tidak puas=2, sangat tidak puas=1, maka angka-angka tersebut hanya label, sekaligus urutan untuk menyatakan ‘semakin tinggi angka, semakin tinggi tingkat kepuasannya’.  Kalau kita menemukan data: kepuasan John=5, kepuasan Ragil=4, kita tidak bisa mengatakan bahwa rata-rata kepuasan mereka berdua=4,5. Pemakaian beberapa perhitungan, seperti rata-rata dan standar deviasi, tidak dapat dibenarkan.

Data Interval

Data interval memiliki kekuatan data nominal dan data ordinal, dengan satu tambahan: jarak antara satu kategori dengan kategori lain jelas.  Contohnya adalah nilai pelajaran. Untuk anak TK sampai SMU, berlaku nilai yang berkisar antara 1 sampai 10. Jarak antara nilai 6 dan 5, sama dengan jarak antara 9 dan 8. Jarak antara 3 dan 5, sama dengan jarak antara 7 dan 9. Dan seterusnya.

Yang belum bisa dilakukan dengan data interval adalah perbandingan absolut.  Katakanlah nilai Lili 8 dan nilai Arnold 4. Kita bisa mengatakan bahwa Lili lebih pintar dari Arnold, akan tetapi tidak bisa mengatakan ‘Lili dua kali lebih pintar dari Arnold’.

Data Rasio

Data rasio memiliki kekuatan data nominal, data ordinal dan data interval, plus satu kelebihan: dapat diperbandingkan secara absolut. Misalnya, tinggi badan Arnold adalah 180 cm, tinggi badan Lili 90 cm, kita bisa mengatakan bahwa Arnold dua kali lebih tinggi dari Lili.

Ukuran-ukuran properti, seperti berat badan, jarak antar kota, luas daerah, besarnya pendapatan, usia, frekuensi belanja, banyaknya merek yang dibeli, dan lain-lain, merupakan data rasio.

Pada data rasio, angka-angka pada skala pengukuran menunjukkan besaran sesungguhnya (objektif).  Sementara pada data interval, angka-angka pada skala tidak objektif, akan tetapi subjektif, seperti pada pengukuran skap.

Misalnya, tinggi badan Arnold adalah 180 cm, tinggi badan Lili 90 cm, kita bisa mengatakan bahwa Arnold dua kali lebih tinggi dari Lili.

Dalam riset pemasaran, pertanyaan yang kita ajukan pada kuesioner merupakan instrumen atau alat penelitian.  Instrumen ini sama fungsinya dengan termometer dalam mengukur panas.

Sebagaimana termometer memiliki berbagai model, per-tanyaan-pertanyaan yang diajukan dalam riset pemasaran juga memiliki berbagai model.

SKALA INSTRUMEN

Banyak alat ukur (instrumen) yang  dipakai dalam  riset pemasar-an.  Setiap alat ukur memiliki kelebihan dan kekuatan.  Karena keanekaragamannya, diperlukan suatu sklasifikasi agar penjelasan dapat dilakukan secara sistematis.

Terdapat variasi pendapat para ahli tentang klasifikasi alat ukur.  Maholtra membagi alat ukur menjadi dua bagian besar.  Pertama, alat ukur komparatif, yang terdiri dari (ditulis dalam bahasa aslinya): (1) paired comparison, (2) rank order, (3) constant sum, Q sort dan teknik-teknik lainnya.

Kedua, alat ukur nonkomparatif, yang juga dibagi dua, yaitu continous rating scales dan itemized rating scales.

Selanjutnya, itemized rating scales terdiri dari Likert, semantic differential dan stapel.[i]

Klasifikasi di atas memang mudah dimengerti, akan tetapi belum memberikan informasi lengkap tentang semua alat ukur. Sebagai contoh, di mana letak pilihan berganda?

Aaker, Kumar dan Day memulai klasifikasi berdasarkan jumlah item yang ditanyakan.  Hasilnya, alat ukur dibagi ke dalam tiga bagian besar, yaitu (dalam bahasa aslinya): single-item scales, continous dan multi-item scales.

Selanjutnya, single-item scales terdiri dari (dalam bahasa aslinya): itemized category scales, rank-order scales, comparative scales, constant sum scales, Q-sort scales, pictorial scales dan paired comparison scales.

Multi-item scales terdiri dari (bahasa asli): Likert scales, semantic differential scales, thurstone scales, assosiative scales dan staple scales.[ii]

Variasi klasifikasi ini disebabkan oleh dasar yang dipakai dalam mengelompokkan.  Menurut Emori dan Cooper, ada enam dasar untuk mengelompokkan instrumen, yaitu sasaran studi, skala respon, tingkat preferensi, properti skala, jumlah dimensi dan pembentukan (konstruksi) skala.[iii]

 

Sasaran studi.  Dalam riset pemasaran, suatu skala ditujukan untuk memperoleh dua hal.  Pertama, mengukur karakteristik responden yang mengisinya.  Misalnya, kita ingin mengetahui kepribadian responden.  Kedua, menggunakan responden untuk menilai suatu objek, misalnya menilai kualitas suatu merek.

Untuk sasaran pertama, apabila yang diteliti adalah karakteristik yang abstrak (perilaku, sosial, psikologi dan budaya), peneliti perlu menggunakan mengombinasikan sejumlah variabel untuk membentuk sebuah indikator dalam menilai karakteristik yang diteliti. Biasanya, untuk kasus ini, peneliti tertarik untuk melihat perbedaan-perbedaan di antara para responden.

Untuk sasaran kedua, biasanya peneliti tertarik pada bagaimana responden menilai objek-objek yang berbeda atau responden yang berbeda menilai objek yang sama.

 

Skala Respon (Response Scales).  Dari sisi ini, skala dapat dibedakan menjadi dua, yaitu kategoris (categorical) dan komparatif (comparative).  Ada juga yang menamakannya rating dan ranking. Skala kategoris digunakan apabila menilai suatu objek dalam situasi objek tersebut tidak dibandingkan langsung dengan objek lain.  Sebaliknya, dalam skala komparatif, responden membandingkan suatu objek dengan objek lain.

Tingkat Preferensi.  Apakah suatu pengukuran melibatkan preferensi?  Kalau ya, maka dengan instrumen yang digunakan, responden diarahkan untuk  mengevaluasi suatu objek atau solusi, lalu menyimpulkan yang mana yang lebih disukai.  Kalau tidak, responden diarahkan untuk mengevaluasi objek atau solusi, tanpa melibatkan preferensi mereka terhadap objek atau solusi tersebut.

Properti Skala. Terdapat skala nominal, skala ordinal, skala interval dan skala rasio, berdasarkan jenis data yang dihasilkan.

Jumlah Dimensi.  Seringkali peneliti tertarik untuk mengukur hanya satu atribut.  Misalnya, untuk mengetahui loyalitas, peneliti hanya mengukur merek apa yang dibeli responden dalam lima kali pembelian terakhir.  Skala demikian disebut skala satu dimensi (unidimensional scale).

Suatu atribut bisa pula didekati dari berbagai indikator.  Loyalitas misalnya, dapat diukur dengan menggunakan indikator-indikator kepuasan, sikap, persentase pembelian dan kebanggaan terhadap merek.  Kalau kita menggunakan banyak indikator untuk mengetahui suatu atribut, maka kita menggunakan skala multidimensi (multidimensional scale).

Pembentukan Skala. Skala dapat juga dikelompokkan berdasarkan cara pembuatannya.  Ada skala yang yang disesuaikan dengan  kebutuhan khusus.  Misalkan, Doni telah meriset kepuasan konsumen terhadap Kijang.  Pada saat meneliti kepuasan konsumen terhadap Nokia, Doni mengganti skala yang digunakan.  Logikanya, Doni gunakan saja skala Kijang untuk Nokia, bukankah keduanya sama-sama mengukur konsep yang sama? Betul, tetapi situasinya berbeda, jadi perlu adanya penyesuaian skala.  Skala yang berubah-ubah sesuai situasi ini disebut arbitrary scale.  Pendekatan pertama inilah yang paling banyak dipakai.  Jarang peneliti yang mengambil skala yang pernah ada tanpa melakukan penyesuaian.

Pendekatan kedua adalah konsensus.  Skala dibuat berdasar-kan kesepatakan sejumlah orang terkait.  Tujuannya, pertama, agar skala relevan dengan topik penelitian, dan kedua, agar hasilnya dapat diterapkan bersama.

Pendekatan ketiga adalah analisis item (item analysis).  Sebuah item tunggal (individual item) dibuat dulu, lalu diujikan pada sekumpulan responden.  Tujuannya adalah untuk mengelompokkan responden tersebut berdasarkan skor item tunggal tadi, misalnya ke dalam dua kelompok: skor tinggi dan skor rendah.

Pendekatan keempat adalah skala kumulatif (cumulative scales).  Bayangkan ada beberapa item pertanyaan yang ditujukan untuk membedakan responden.  Skor yang dipakai membedakan responden adalah skor kumulatif dari semua item. Itulah skala kumulatif, di mana sebuah item bergabung dengan item lain.

Item-item tersebut, seyogianya, berada dalam suatu kotinum, mulai dari yang paling rendah (respon sama semua) sampai paling kuat (respon sangat beranekaragam).

Terakhir, skala faktor (factor scales), dibentuk dengan dasar interkorelasi di antara item-item yang dibentuk.  Skala seperti ini dipakai dalam analisis faktor dan analisis klaster.  Skala diferensial sematik dan skala numerik, dianggap masuk pada golongan ini.

Penjelasan berikut ini tidak mencakup semua klasifikasi karena memang hal itu sulit dilakukan.  Pemaparan hanya dilakukan pada skala respon, yaitu kategoris dan kompatarif.

SKALA KATEGORIS

Yang tergolong skala kategoris adalah:  (1) simple category scale, (2) multiple choice single-response scale, (3) multiple choice multiple-response scale, (4) summated rating scale, (5) semantic differential scale, (6) numerical scale, (7) graphic rating scales, (8) staple scale  dan (9) multiple rating list scale.

Skala Dikotomi

Oleh beberapa penulis, skala ini juga disebut skala Gutman.  Skala ini hanya menyediakan dua pilihan, yaitu YA atau TIDAK.  Dengan sendirinya,  data yang dihasilkan adalah data nominal (Tampilan 2-10).

Karena membutuhkan jawaban yang tegas, skala ini tidak menyediakan pilihan ragu-ragu atau netral.  Oleh karena itu, skala ini sebenarnya kurang halus dalam merepresentasikan respon.  Akan tetapi, ada kalanya memang peneliti membutuhkan jawaban tegas.  Pada saat kita menggunakan Cochran Q Test misalnya, skala demikianlah yang dibutuhkan.

Dalam analisis multivariat, skala ini dapat dipakai dalam  analisis korespondensi, analisis diskriminan (khususnya variabel independen), dan analisis klaster (khususnya K-Means Kluster).

Contoh Skala Dikotomi

 Apakah anda mempertimbangkan reputasi bank saat memilih bank tempat menabung?

a. YA    b.  TIDAK

Multiple Choice Single Response Scale

Ketika banyak pilihan dan responden diminta untuk memilih satu saja, skala ini dapat digunakan.  Idealnya seluruh pilihan tersedia.  Kalaupun ada pilihan  terbuka (yaitu lainnya), alternatif-alternatif yang disediakan, menurut Cooper dan Schindler, harus mencakup minimal 90% dari seluruh pilihan yang mungkin dipilih (2003)

Situs jual beli online apa yang paling sering anda gunakan?

a.  Kaskus

b. Tokopedia

c.  Bukalapak

d. Lazada

e. Sophee

f. OLX

Skala Likert disebut juga summated rating scale. Skala ini banyak digunakan.  Skala ini memberi peluang kepada responden untuk mengekspresikan perasaan mereka dalam bentuk PERSETUJUAN atau agreement terhadap suatu pernyataan. Pertanyaan diberikan berjenjang, mulai dari tingkat terendah sampai tertinggi. Pilihan jawaban bisa tiga, lima, tujuh, sembilan, dan harus ganjil.

Semakin banyak pilihan, jawaban responden semakin terwa-kili.  Namun, semakin banyak pilihan jawaban, semakin sulit mencari kata-kata yang dipahami secara umum.  Dalam bahasa Inggris, misalnya, pilihan jawaban berikut lumrah: extremely disagree, strongly disagree, disagree, neither agree nor diagree, agree, strongly agree, extremely agree.  Dalam bahasa Indonesia, sepanjang dapat disepakati, pilihan jawaban berikut ini dapat dipakai: amat sangat tidak setuju, sangat tidak setuju, tidak setuju, netral, setuju, sangat setuju, amat sangat setuju.  Masalahnya, kata ‘amat sangat’ jarang dipakai.

Skala Likert dapat dipakai dengan beberapa variasi bentuk pertanyaan.

Karena pilihan jawaban berjenjang, maka setiap pilihan jawaban bisa diberi skor. Skor 1 bisa diberi pada jenjang jawaban terendah, misalnya ‘sangat tidak setuju’, bisa pula pada jenjang jawaban tertinggi, misalnya ‘sangat setuju’, asal dilakukan secara konsisten.

Ada beberapa hal yang perlu diperhatikan dalam penggunaan skala Likert. Pertama, urutan pertanyaan perlu diacak, agar setiap pertanyaan mendapat peluang yang sama untuk setiap posisi. Hal ini penting untuk menghindari bias posisi.

Kedua, hindari keseragaman pilihan jawaban dengan mengacak titik ekstrim positif dan negatif.  Seperti pada contoh,  letak sangat setuju, sebagian di sebelah kiri, sebagian lagi di sebelah kanan.  Hal ini perlu untuk menghindari pemberian seragam untuk semua jawaban karena kemalasan responden untuk memeriksa pertanyaan satu per satu.

Masih ada perbedaan pendapat tentang jenis data yang diperoleh melalui skala Likert. Namun, bagi Bush, et. al. (2003),  data yang diperoleh dari skala Likert memiliki  skala interval berjenjang (ordinally interval scale).  Bahkan, dengan yakin, Cooper dan Schlindler (2014) mengatakan bahwa skala Likert menghasilkan data interval.  Namun, bagi Zikmund (2000), skala Likert menghasilkan data ordinal.

Bagaimana kita menyikapi perbedaan pendapat ini?  Sepanjang peneliti yakin skala Likert yang digunakan dapat menghasilkan data yang memenuhi syarat-syarat data interval, perlakukan saja data yang dihasilkan sebagai data interval.  Masalahnya, kalau pilihan dalam bahasa aslinya diindonesiakan: strongly disaggre menjadi sangat tidak setuju, disaggre menjadi tidak setuju, neither disaggre nor aggree menjadi antara setuju dan tidak setuju, aggre menjadi setuju dan strongly aggre menjadi sangat setuju, apakah terjemahan Indonesianya itu sama persis dengan aslinya?  Kalau tidak yakin, perlakukan data sebagai data ordinal.  Sebaliknya, kalau yakin, perlakukan data sebagai data interval.  Namun, untuk menyatakan yakin atau tidak, perlu dukungan ahli bahasa.

Skala Semantic Differential

 Salah satu skala  paling populer dalam riset pemasaran adalah skala diferensial semantik. Skala ini dapat digunakan untuk mengukur sikap dan persepsi terhadap korporat, produk, merek dan sebagainya.  Skala ini berisikan sifat-sifat bipolar (dua kutub) yang berlawanan. Pada rentang antara dua kutub, responden dapat memilih poin yang mewakili responnya.

Contoh Semantic Differential

Respon dapat dikategorikan ke dalam tiga dimensi dasar. Pertama, dimensi dasar yang diwakili oleh pasangan-pasangan ajektif (kata sifat), seperti: baik-buruk, manis-pahit, menolong-tidak menolong.  Kedua, dimensi potensi, seperti: kuat-lemah, penuh-kosong, banyak-sedikit, tinggi-rendah.  Ketiga, dimensi aktivitas, seperti: cepat-lambat, tepat-menyimpang, tenang-ribut.

Dalam pemakaian diferensial semantik, ada beberapa ketentuan yang perlu diperhatikan, yaitu:

  • Orientasi kutub kanan dan kutub kiri dibuat beragam.  Artinya, jangan dibuat kutub yang sama pada kutub yang sama, misalnya, kutub kiri melulu negatif, kutub kanan melulu positif. Kalau diselang-seling, seperti pada contoh di atas, maka responden terstimulasi untuk lebih memperhatikan pertanyaan. Kalau kutub diseragamkan, kemungkinan responden memberikan jawaban yang sama lebih besar.
  • Jumlah skala dibuat ganjil, misalnya tiga, lima, tujuh, sembilan dan seterusnya. Tidak ada ketentuan jumlah skala yang paling tepat. Namun, perlu dipertimbangkan bahwa semakin banyak jumlah skala maka respon responden semakin terwakili, namun pada sisi lain, kesulitan responden untuk menentukan skala yang pas meningkat.

Penggunaan Skala Diferensial Semantik

Cara yang lazim dalam menginterpretasi  data yang diperoleh dengan skala ini ada dua.  Pertama, dengan menggunakan profil visual, yaitu diagram ular (snake diagram).  Dengan memberikan skor pada setiap pilihan responden, kemudian mengolahnya dengan teknik analisis yang sesuai.

Contoh Snake Diagram:  ______ Bank A       ………. Bank B

Cooper dan Schindler (2014) mencatat dua keuntungan skala ini. Pertama, menghasilkan data interval, sehingga memenuhi syarat sebagai data metrik.  Kedua, skala ini dapat mengukur sikap sejumlah besar responden karena mudah digunakan, karena cukup menggunakan kata-kata kunci berlawanan pada kedua kutubnya

Skala Numerik (Numeric Scale)

Skala ini merupakan variasi skala diferensial semantik.  Skala ini juga menggunakan dua kutub esktrim, positif dan negatif, hanya pilihan yang tersedia adalah angka. Sama seperti pada diferensial semantik, jumlah angka harus ganjil, umumnya 5, 7 dan 9.

Bagaimana ATM  Bank A menurut pendapat anda?

Sangat sedikit  1  2  3  4  5  6  7  Sangat sedikit

Walaupun Zikmund (2000) belum yakin apakah data dari skala ini ordinal ataukah interval, namun Cooper dan Schlinder (2014) yakin bahwa data yang diperoleh dari skala ini adalah  data interval.  Memang belum ada kesepakatan  para ahli tentang skala numerik (termasuk skala Liker dan skala semantik diferensial), apakah menghasilkan data ordinal ataukah interval.  Namun, menurut Churcil dan Iacobucci, pada umumnya para pemasar  memperlakukan data dari skala numerik sebagai data interval.

Perlakuan ini tidak didasarkan atas keyakinan bahwa skala numerik (termasuk skala Likert dan skala semantik diferensial) benar-benar memiliki sifat-sifat data interval, akan tetapi karena kuatnya (powerfull) alat-alat statistik yang bisa digunakan untuk data interval.

Begitu skor-skor dimasukkan, teknik-teknik statistik yang digunakan tidak dapat membedakan dengan instrumen seperti apa data diperoleh.  Oleh karena itu, kontroversi di atas dapat ditengahi dengan azas manfaat: “Sepanjang menghasilkan informasi yang dibutuhkan, data dari skala Likert, semantik diferensial dan skala numerik dapat diperlakukan sebagai data interval.

Skala Stapel (Staple Scale)

Skala stapel juga merupakan modifikasi skala diferensial semantik.  Yang dibedakan pada skala stapel adalah: (1) ajektif atau kata sifat ditempatkan pada satu kutub, tidak bipolar, (2) poin-poin pada skala adalah berupa angka, yang diberi tanda negatif sampai positif, dan (3) pilihan genap, tidak ganjil dan (4) skala ini tidak memberi jawaban netral (nilai tengah).

Semakin setuju dengan pernyataan yang disediakan, berikan skor ke arah  positif, demikian pula sebaliknya.  Misalkan, responden sangat setuju pada pernyataan “ATM Bank A sangat banyak”, maka responden tersebut dapat memilih skor 5.

 

Skala ini umumnya dipakai mengukur sikap.  Ada dua informasi yang diperoleh berkaitan dengan sikap.  Pertama, arah sikap (positif ataukah negatif).  Kedua, intensitas sikap melalui skor yang diberikan.  Semakin besar skor, semakin besar intensitas.

Bagi Sekaran (2000), data yang dihasilkan dari skala ini termasuk data interval. Karena itu, skala ini tergolong sebagai skala interval.  Pendapat yang sama diberikan oleh Cooper and Schindler (2014). Namun, keduanya masih memberi catatan, sekalipun skala ini termasuk skala interval, namun kalau peneliti tidak yakin apakah jarak antar satuan sama, lebih aman memperlakukan skala ini sebagai skala ordinal.

Churchil dan Iacobucci mencatat adanya kontroversi tentang jenis skala ini, apakah ordinal ataukah internal.  Dia mencatat bahwa kebanyakan pemasar memperlakukannya sebagai skala interval, bukan karena yakin betul data yang dihasilkannya memiliki syarat sebagai data interval, melainkan karena kalau diperlakukan sebagai data interval, terdapat banyak alat statistik yang powerfull.

Graphic Rating Scales

Pada saat menggunakan skala ini, responden mengindikasikan respon mereka dengan menandai poin yang cocok pada garis yang berujungkan dua sifat ekstrim yang berbeda.  Posisi garisnya bisa horizontal, bisa vertikal, bisa ditandai, bisa tidak.  Bisa sedikit skala, bisa banyak, seperti pada termometer.

Dengan skala ini, respon responden dihitung dengan mengukur panjang garis mulai dari ujung kiri sampai bagian yang ditandai.  Lalu, panjang garis tersebut dibandingkan dengan panjang garis keseluruhan.

Selain mudah membuat dan menggunakannya,  data yang diperoleh dengan skala ini, oleh Cooper dan Schindler  (2014) dianggap data interval.  Ujung garis jangan terlalu ekstrim agar responden tidak menandai bagian tengah saja.

Itemized-Rating Scale

Skala ini serupa dengan skala peringkat grafis. Bedanya, untuk itemized rating scale, pilihan yang tersedia lebih sedikit, yaitu berkisar antara lima sampai sembilan kategori.

Skala ini memiliki beberapa variasi.  Dalam beberapa kasus, setiap kategori memiliki penjelasan verbal (dengan kata-kata).  Namun, keberadaan penjelasan ini tidak  mutlak, walaupun keberadaan penjelasan dapat mempengaruhi respon.

Kalau penjelas (deskriptor) digunakan, perlu dipastikan apakah variabel yang ingin diukur peneliti sesuai dengan pemahaman responden. Peneliti dan responden memiliki pemahaman yang sama tentang maksud pertanyaan.

Kalaupun tidak menggunakan penjelas (deskriptor) , skala ini tetap memiliki perbedaan dari skala peringkat grafis mengingat pilihannya yang terbatas.  Sejumlah karakter, misalnya wajah yang dimulai dari menangis sampai tertawa  dapat dikategorikan sebagai itemized-rating scale, walaupun tidak ada deskriptor yang menyertainya.  Bahkan, oleh beberapa penulis, skala Likert juga dikategorikan sebagai itemized-rating scale, demikian pula skala diferensial semantik.

Data apa yang diperoleh dari skala ini? Tergantung dari bentuk pertanyaan dan jawaban yang disediakan.  Namun, apabila pilihan yang diberikan adalah keadaan yang berjenjang, maka data yang diperoleh adalah ordinal.  Pilihan tentang tingkat kepuasan yang berjenjang, mulai dari sangat tidak puas (wajah orang menangis) sampai sangat puas (wajah orang tertawa) juga menghasilkan data ordinal.

 

Multiple Rating List Scale.

Skala ini sebenarnya sama dengan skala numerik.  Hanya, dalam skala ini, terdapat banyak atribut.  Lalu, skala ini memungkinkan visualisasi jawaban, dengan menghubungkan jawaban pada setiap atribut, sehingga memberikan potret  karakteristik responden.

SKALA KOMPARATIF

Dalam skala kategoris, responden diminta untuk memberikan respon pada sebuah atribut tanpa membandingkan atribut tersebut secara relatif dibanding atribut lain.  Dengan  skala tersebut, kita bisa bertanya seberapa penting banyaknya ATM, layanan yang baik, lokasi yang strategis, hadiah yang banyak, dan reputasi bank.  Responden memberikan penilaian atas setiap item tanpa harus membanding satu item dengan item lainnya.

Dalam skala komparatif, responden diminta untuk membandingkan satu atribut atau objek dengan atribut atau objek lain.  Yang termasuk dalam skala ini forced ranking scales,  constant-sum scales dan paired comparison scales.

Forced Rating Scales

Banyak variabel yang bisa diukur dengan instrumen ini, misalnya tingkat kepentingan atribut, preferensi merek dan kesamaan merek. Dalam analisis multivariat, skala ini dapat dipakai untuk:

  1. Mengukur preferensi terhadap kombinasi-kombinasi atribut. Hasilnya, berupa ranking preferensi.   Data berupa ranking ini, dirubah menjadi skor dan skor yang selanjutnya dipakai sebagai variabel dependen dalam analisis konjoin.
  2. Multidimension scaling berdasarkan peringkat kesamaan pasangan-pasangan  merek (ingin tahu lebih jauh klik di sini) serta ranking merek berdasarkan preferensi (ingin tahu lebih jauh klik di sini).

Data yang diperoleh dari skala ini termasuk data ordinal.

Skala ini menjadi sulit dipakai apabila jumlah objek yang diranking banyak.  Kalau dalam analisis konjoin, misalnya, terdapat empat atribut, yang masing-masing  terdiri dari tiga level, akan ada 3X3X3X3=81 kombinasi.  Tentu, memberi ranking pada 81 kombinasi, mulai dari ranking 1 sampai 81, merupakan perkejaan yang sulit.

Skala Jumlah Tetap. Skala jumlah tetap (constant-sum scaling) merupakan contoh skala peringkat komparatif.  Di dalam skala jumlah tetap, responden diinstruksikan untuk membagi suatu jumlah (misalnya 100) ke dalam beberapa atribut yang dibandingkan. Setiap atribut  memperoleh angka sesuai dengan tingkat kepentingan masing-masing.

Dengan skala ini, keuntungannya, para responden tidak terpengaruh efek halo, yaitu efek mendramatisasi atau melebih-lebihkan respon positif atau mengurangi respon negatif karena perasaan sungkan kepada peneliti atau objek yang diteliti.  Kesulitannya adalah adanya pekerjaan tambahan responden untuk menerjemahkan tingkat kepentingan atribut menjadi angka-angka yang bisa diperbandingkan secara relatif. Tugas ini  makin sulit kalau jumlah atribut banyak, misalnya 10.  Kalau atribut sedikit, misalnya dua atau tiga, pengisian relatif mudah dilakukan.

Terdapat perbedaan pendapat di antara para ahli tentang jenis data yang dihasilkan oleh skala ini.  Menurut Maholtra, skala ini, memiliki nilai nol.  Misalkan, responden diminta membagi angka 100 untuk membandingkan kepentingan faktor rasa, isi  dan  harga dalam pembelian minuman ringan.  Lalu, dijawab: rasa=25, harga=75, isi=0.  Artinya, responden  mempertim-bangkan dua faktor:  harga, dan tidak mempertimbangkan faktor produk, (nilai kepentingannya nol).

Pertanyaan selanjutnya yang dapat dieksplor adalah: “Mungkinkah kita dapat menyimpulkan bahwa harga tiga kali lebih penting dari isi?”  Menurut Maholtra, kemungkinan ini dapat terjadi pada konteks tertentu.  Misalnya, kalau kita benar-benar yakin bahwa dalam memberikan jawaban,  responden benar-benar memperhitungkan bobot suatu objek secara relatif dengan objek lain.  Dalam konteks demikian, data dapat dipertimbangkan sebagai data metrik (Malhotra, 2012), yang kalau ditinjau dari sifat-sifat tersebut, merupakan data rasio.

Walaupun tidak  eksplisit, melalui contoh yang diberikan, Churchil dan Iacobucci (2003) menyatakan bahwa skala jumlah tetap menghasilkan data rasio.

Namun, Maholtra (2012) sendiri meragukan  data dari skala ini data rasio karena keterbatasan responden dalam memberikan jawaban.  Bahkan, untuk dipertimbangkan sebagai data interval pun, data hasil skala ini, menurut Aaker, Kumar dan Day (1995), belum bisa ditetapkan secara pasti karena adanya kesulitan responden membagi angka secara pasti untuk aspek-aspek yang dievaluasi.  Oleh karena itu, untuk amannya, data dari skala ini lebih baik diperlakukan sebagai data ordinal saja karena kekurangan-kekurangan tadi (Malhotra, 2012).

Kalau dipertimbangkan sebagai data ordinal, maka pemakaian skala ini dalam analisis multivariat paling dapat diperlakukan sebagai variabel kualitatif pada regresi berganda, variabel dependen pada analisis diskriminan maupun variabel yang digunakan dalam analisis korespondensi.  Pada semua pemakaian tersebut, skor-skor yang diperoleh, harus mengalami penyesuaian.

Paired Comparison

Kalau diterjemahkan secara bebas, artinya adalah perbandingan berpasang-pasangan.  Sesuai dengan namanya, dalam skala ini memang merek-merek dipasang-pasangkan, lalu dibandingkan, mana yang unggul, melebihi atau lebih disukai pada setiap pasangan.

Enam merek city car dibandingkan berikut ini. Kepada seorang responden, diberikan pertanyaan berikut:

Pertanyaan: “Perhatikan merek-merek yang diletakkan pada kolom.  Bandingkan merek-merek tersebut dengan merek-merek yang diletakkan pada baris.  Pada sel di mana merek-merek yang dibandingkan berinteraksi, beri angka 1 kalau merek pada kolom lebih anda sukai dan angka 0 kalau merek pada baris lebih anda sukai.

Skor pada baris ‘menang’ pada tabel preferensi berpasangan adalah jumlah angka 1 pada setiap kolom.  Berdasarkan skor tersebut, kita dapat membuat ranking dengan memberikan ranking 1 (paling tinggi) pada merek yang memperoleh skor paling tinggi.

Dalam analisis multivariat, skala ini dapat dipakai dalam  multidimension scaling (MDS) berbasis preferensi (lihat di sini).

Mana Yang Dipakai?

Banyak pertimbangan yang diperlukan untuk memilih skala pengukuran mana yang mau dipakai.  Setiap peneliti tentu memiliki gambaran saat menyusun rencana penelitian. Namun, sebagai bahan pertimbangan, berikut ini penulis mengajukan beberapa hal yang perlu diperhatikan dalam memilih skala pengukuran.

Pertama, variabel yang diteliti.  Ada variabel yang membutuhkan skala tertentu.  Kalau kita bertanya tentang jenis kelamin, sudah pasti skala nominal yang kita pakai.  Pilihannya hanya dua, yaitu laki-laki dan perempuan.  Kemudian, kalau bertanya sikap, semua skala pengukuran bisa dipakai.

Kedua, metoda analisis yang dipakai.  Setiap metoda analisis membutuhkan persyaratan data tertentu.  Sebagian dari persyaratan tersebut diperoleh dari skala pengukuran.  Variabel dependen pada analisis diskriminan, misalnya, membutuhkan data nominal.  Kalau pengujian dilakukan dengan alat ini, pakailah skala yang menghasilkan data nominal, yaitu skala dikotomi.

Kalau melakukan corresponce analysis, dibutuhkan data kategoris, yaitu data nominal dan data ordinal. Oleh karena itu, skala yang sesuai adalah skala dikotomi dan itemized-rating scale.

Ketiga, kepada siapa pengukuran dilakukan.  Kalau responden mampu menjawab, metoda mana pun dapat digunakan.  Akan tetapi, kalau kurang mampu, jangan berikan pekerjaan tambahan berupa ‘proses mempelajari pertanyaan’ kepada responden. Gunakanlah skala pengukuran yang lebih sederhana.

Keempat, metoda kontak.  Kalau metoda kontak adalah melalui telepon, jangan gunakan graphic rating scales, sebab responden tidak melihat garis yang diajukan.