Melakukan Analisis Diskriminan

Menurut Malhotra (2006), analisis diskriminan terdiri dari lima tahap, yaitu: (1) merumuskan masalah, (2) mengestimasi koefisien fungsi diskriminan, (3) memastikan signifikansi determinan, (4) menginter-pretasi hasil dan (5) menguji signifikansi analisis diskriminan.

Tahap 1:  Merumuskan Masalah.

Tahap ini mencakup jawaban atas pertanyaan: “Kenapa analisis diskriminan dilakukan (latarbelakang masalah) dan apa tujuan analisis diskriminan, termasuk variabel-variabel apa yang dilibatkan?  Kalau analisis diskriminan dipakai sebagai alat analisis dalam sebuah penelitian formal (skripsi dan thesis), tahap pertama, kedua dan ketiga dijelaskan pada metodologi penelitian.

Saat ini analisis diskriminan sangat mudah dilakukan karena banyaknya software pendukung. Namun, karena software akan melakukan tugasnya begitu data dimasukkan, perlu dipastikan terlebih dahulu bahwa instrumen yang digunakan akurat (baik secara teori maupun statistik) dan datanya reliabel.  Sebab, pameo “Garbage in garbage out”, belaku juga untuk analisis diskriminan.

Pada tahap ini peneliti juga mengidentifikasi sasaran, variabel dependen (disebut juga criterion variable), serta variabel independen.  Variabel dependen harus berisikan dua atau lebih kategori, di mana antara satu kategori dengan kategori lain bersifat terpisah (mutually exclusive).  Sekiranya variabel dependen memakai skala metrik (interval ataupun rasio), skala variabel dependen tersebut harus dirubah menjadi kategori terlebih dahulu.  Misalnya, sikap yang kita ukur dengan skala numeric berskala 1 sampai tujuh, dapat dirubah menjadi dua kategori (comfortable dan uncomfortable) atau tiga kategori (comfortable, neutral dan uncomfortable) atau lainnya.

Jangan terlalu kaku dalam menetapkan batas antar kategori, sebab kita harus melihat proposi setiap kategori.  Kalau tidak proporsional, misalnya satu kategori berisikan 98% sedangkan kategori lain hanya 2% dari total objek, maka batas kategori (cut-off) dapat digeser, sampai ditemukan jumlah objek yang proporsional pada setiap kategori yang dibentuk. Pemilihan variabel prediktor pun harus didasarkan pada teori ataupun riset sebelumnya.

Tahap selanjutnya adalah membagi sampel ke dalam dua bagian.  Satu bagian berfungsi sebagai sampel estimasi atau sampel analisis.  Sesuai dengan namanya, sampel ini dipakai untuk mengestimasi fungsi diskriminan.

Satu bagian lagi disebut holdout atau sampel validasi (validation sampel), disimpan untuk mem-validasi fungsi diskri-minan. Kalau jumlah sampel besar, maka sampel dapat dibagi dua, setengahnya sebagai sampel analisis, setengahnya lagi  sampel validasi.

Ada baiknya memperhatikan distribusi dalam sampel total. Seandainya sampel total berisikan 30% responden yang loyal dan 70% responden yang tidak loyal, maka setelah pembagian, diharapkan ditemukan pula distribusi yang sama pada sampel analisis (30% responden loyal dan 70% responden tidak loyal) dan sampel validasi (30% responden loyal dan 70% responden tidak loyal.

Validasi fungsi diskriminan perlu dilakukan berulang-ulang.  Setiap kali, sampel perlu displit ke dalam bagian analisis dan validasi.  Fungsi diskriminan perlu diestimasi, kemudian validasi dilakukan.  Jadi, keakuratan fungsi didasarkan pada sejumlah percobaan.

Contohnya, kita ingin kita ingin mempelajari faktor-faktor apa yang mempengaruhi para dosen dalam memilih jalur penelitian dalam sebuah perguruan tinggi: lewat lembaga Litbang dan penelitian sendiri.   Ukuran sampel 50 orang.  Dari jumlah itu, sebanyak 30 dosen dijadikan sampel analisis (Tabel 6-1).  Sisanya, 20 dosen, dijadikan sebagai sampel validasi.

Para dosen yang memakai dana Litbang diberi kode 1 dan yang memakai dana sendiri diberi kode 2.  Distribusi kedua bagian dalam hal penelitian sendiri dan penelitian lewat Litbang, pada kedua sampel dapat dikatakan berimbang.

 Tahap 2:  Mengestimasi Fungsi Diskriminan

Estimasi dapat dilakukan setelah sampel analisis diperoleh.  Ada dua pendekatan umum yang tersedia.  Pertama, metoda langsung (direct method), yaitu suatu cara mengestimasi fungsi diskriminan dengan melibatkan variabel-variabel prediktor sekaligus.  Setiap variabel dimasukkan tanpa memperhatikan kekuatan diskriminan masing-masing variabel. Metoda ini baik kalau variabel-variabel prediktor dapat diterima secara teoritis.

Kedua, stepwise method.  Dalam metoda ini, variabel prediktor dimasukkan secara bertahap, tergantung pada kemampuannya melakukan diskriminasi grup.  Metoda ini cocok kalau peneliti ingin memilih sejumlah variabel prediktor untuk membentuk fungsi diskriminan.

Kasus 5Dosen-dosen Universitas Internasional, sebuah perguruan tinggi swasta, diwajibkan untuk melakukan penelitian (riset) ilmiah minimal sekali setahun.  Untuk membantu  dosen-dosen melakukan riset, perguruan tinggi itu menyediakan dana yang dapat diperoleh setelah proposal penelitian para dosen dianggap layak oleh lembaga penelitian dan pengembangan (litbang) perguruan tinggi itu.  Para dosen yang merasa mampu juga dapat melakukan penelitian tanpa harus melalui lembaga litbang.

Ternyata, sekalipun Universitas Internasional menyediakan dana penelitian, lebih banyak dosen yang melakukan penelitian dengan biaya sendiri.

Untuk mengetahui penyebab kenyataan ini, dilakukan penelitian terhadap 50 dosen yang melakukan penelitian, 24 di antaranya lewat litbang, 26 menggunakan biaya sendiri.  Empat variabel yang dijadikan sebagai variabel independen adalah gaji (X1), sikap terhadap litbang (X2), kemampuan melakukan riset (X3), dan daya tarik topik (attractiveness) yang diteliti (X4).

Sampel dibagi dua.  Sebanyak 30 responden dipakai sebagai sampel analisis (Tabel 6-1), datanya dapat diambil dari link ini. Sisanya, 20 responden, dijadikan sebagai sampel holdout (Tabel 6-2).

Tabel 6-1.  Sampel Analisis

Resp. Jalur X1 X2 X3 X4 Z Scores Peluang ke Grup 1 Peluang ke Grup 2 Pre-dicted Group
1 1 3.2 5 6 7 2.18646 0.99904 0.00096 1
2 1 4 6 5 5 0.43431 0.74667 0.25333 1
3 1 5.2 5 5 5 -0.14874 0.29473 0.70527 2
4 1 4 7 6 5 1.65712 0.99439 0.00561 1
5 1 2.7 6 5 6 1.27347 0.98001 0.01999 1
6 1 3.5 5 7 6 2.04985 0.99849 0.00151 1
7 1 4 6 5 7 2.03841 0.99843 0.00157 1
8 1 5 6 7 6 2.55584 0.99972 0.00028 1
9 1 4 5 7 6 2.03558 0.99842 0.00158 1
10 1 3.1 5 6 5 0.58521 0.83012 0.16988 1
11 1 3.7 6 7 6 2.59294 0.99975 0.00025 1
12 1 4.4 6 6 5 1.09690 0.96446 0.03554 1
13 1 3.6 7 7 7 3.94665 1.00000 0.00000 1
14 1 4 6 6 7 2.71242 0.99984 0.00016 1
15 2 5 5 6 4 -0.27107 0.21714 0.78286 2
16 2 5.2 4 5 4 -1.49959 0.00450 0.99550 2
17 2 6 5 4 5 -0.84558 0.03890 0.96110 2
18 2 4 5 5 4 -0.91654 0.03092 0.96908 2
19 2 4.7 5 4 5 -0.80848 0.04382 0.95618 2
20 2 4.8 4 4 4 -2.16218 0.00049 0.99951 2
21 2 6.1 3 3 5 -2.62004 0.00011 0.99989 2
22 2 3 3 4 5 -1.85755 0.00136 0.99864 2
23 2 5 4 5 5 -0.69183 0.06344 0.93656 2
24 2 4 4 4 5 -1.33730 0.00773 0.99227 2
25 2 6 3 4 4 -2.74523 0.00007 0.99993 2
26 2 7 2 4 4 -3.32257 0.00001 0.99999 2
27 2 5.6 5 4 4 -1.63621 0.00285 0.99715 2
28 2 5.2 4 3 4 -2.84761 0.00005 0.99995 2
29 2 3.4 4 5 5 -0.64616 0.07316 0.92684 2
30 2 4.7 5 4 5 -0.80848 0.04382 0.95618 2

Keterangan: Z Scores, peluang ke grup 1, peluang ke grup 2 dan predicted group merupakan hasil analisis yang diberikan oleh SPSS.

Tabel 6-2. Sampel Holdout

Resp. Jalur X1 X2 X3 X4 Pre-dicted Group Z Scores Peluang ke Grup 1 Peluang ke Grup 2
1 1 3.1 6 6 7 1 2.28368 0.99991 0.00009
2 1 4.3 6 6 5 1 1.87884 0.99952 0.00048
3 1 5.1 6 5 5 1 0.90715 0.97562 0.02438
4 1 4.5 6 7 5 1 2.79679 0.99999 0.00001
5 1 3 6 6 6 1 2.11887 0.99982 0.00018
6 1 4 5 7 6 1 1.96776 0.99967 0.00033
7 1 4.2 7 5 7 1 2.32194 0.99992 0.00008
8 1 5.1 6 7 7 1 3.1049 1.00000 0.00000
9 1 3.6 5 6 6 1 1.06056 0.98679 0.01321
10 1 4 6 6 5 1 1.89496 0.99955 0.00045
11 2 4.7 4 3 4 2 -3.15108 0.00000 1.00000
12 2 5.7 4 3 5 2 -3.03464 0.00000 1.00000
13 2 4 4 4 5 2 -2.01458 0.00028 0.99972
14 2 5.1 5 5 5 2 -0.11893 0.38138 0.61862
15 2 4.2 5 4 5 2 -0.99926 0.01689 0.98311
16 2 4.7 4 4 4 2 -2.22238 0.00012 0.99988
17 2 6 3 4 4 2 -3.31831 0.00000 1.00000
18 2 5 4 4 4 2 -2.2385 0.00011 0.99989
19 2 5 4 3 4 2 -3.1672 0.00000 1.00000
20 2 4.2 5 5 5 2 -0.07056 0.42874 0.57126

Keterangan: Z Scores, peluang ke grup 1, peluang ke grup 2 dan predicted group merupakan hasil analisis yang diberikan oleh SPSS.

Langkah-langkah Analisis Diskriminan

1.  Buka program SPSS. Lalu, pada layar, isikan data Tabel 6-1. Lakukan penyesuaian nama variabel dan angka desimal melalui menu View, seperti tampak di layar (hanya sebagian layar ditampilkan di sini).

2. Dari menu utama, pilih analyze>classify>discriminant. Kemudian, dari kotak dialog yang muncul, masukkan variabel ‘d’ sebagai gouping variables.  Kemudian, klik define range.  Lalu, pada kotak dialog kecil yang muncul, masukkan angka 1 pada sel minimum dan angka 2 pada sel maximum. Tampak di layar sebagai berikut:

3. Untuk kembali pada kotak dialog disriminant, pada kotak dialog Define range, klik Continue. Pada kotak dialog Discriminant analysis, klik Statistics, kemudian, pada kotak dialog Statistics, tandai sel Means, Unstandardized dan Within-goups correlations. Lalu, klik Continue.

4. Dari kotak dialog Discriminant analysis, klik Save, kemudian pada kotak dialog save yang muncul sesudahnya, pilih fasilitas-fasilitas seperti ditandai di bawah ini. Dengan fasilitas-fasilitas tersebut, SPSS akan memprediksi keanggotaan setiap responden, skor diskriminan responden, serta peluang keanggotaan responden pada grup 1 dan grup 2 (Hasilnya pada Tabel 6-1 di atas).

5. Terakhir, pada kotak dialog discriminant analysis, klik OK, kemudian didapatlah hasil seperti pada Tabel 6-3.

INTERPRETASI OUTPUT

Hasil analisis diskriminan dimulai dengan analisis deskriptif.  Pada Output 1, dari statistik grup (group statistics)  terlihat bahwa beda rata-rata variabel setiap grup dan rata-rata total. Rata-rata  ini, kalau antar grup berbeda, mengindikasikan bahwa variabel-variabel di dalamnya berperan dalam mengelompokkan responden.  Sekiranya rata-rata sebuah variabel sama pada kedua grup, bolehlah kita percaya bahwa variabel tersebut tidak berperan dalam mengelompokkan objek (atau responden).

Standar deviasi juga merupakan indikator apakah variabel berperan baik sebagai diskriminator ataukah tidak.  Sangat baik kalau  standar deviasi dalam grup lebih rendah dari standar deviasi total, sebab dalam grup tentu nilai variabel lebih homogen.  Pada Output 1, semua variabel memenuhi syarat ini, kecuali variabel gaji, di mana standar deviasi gaji (variabel X1) grup 2 lebih tinggi dibanding standar deviasi total.  Memang, terbukti kemudian dari standardized coefficient dan structure matrix,  peran variabel ini dalam mendiskriminasi objek paling rendah.

Pooled within-groups correlation matrix mengindikasikan korelasi yang rendah antar variabel-variabel prediktor.  Sehingga, multikolinearitas dapat diabaikan.

Apakah kedua grup berasal dari populasi yang sama?  Syaratnya memang demikian. Untuk menjawabnya, perlu dipastikan bahwa matrik covariance kedua grup sama. Untuk membuktikannya, digunakan Statistik Box’s M.  Statistik ini menguji hipothesis:

Ho: Matrik cocariance kedua grup sama

Ha: Matrik covariance kedua grup tidak sama

Box’s M Test of Equality of Covariance Matrices

Untuk contoh ini, nilai Box’s M adalah 10.892 dengan nilai sig.=0.515. Dengan demikian tidak cukup bukti untuk menolak Ho. Jadi, matrik kovarian kedua grup adalah sama. Dengan demikian, dari kriteria ini, analisis diskriminan dapat dilakukan.

Pada Output 2,  dengan  µ=0,05, maka nilai signifikansi nilai F menunjukkan bahwa ketika diperiksa secara sendiri-sendiri, semua  variabel prediktor signifikan (karena nilai signifikansinya di bawah 0,05). Hipothesis yang diuji adalah:

H0: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah sama.

Ha: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah tidak sama.

Dengan nilai sig. semua variabel di bawah 0.05, punya cukup bukti untuk menolak H0 dan menyatakan bahwa memang rata-rata variabel pada kedua grup diskriminan yang terbentuk adalah berbeda.

Karena hanya dua grup yang dibentuk, maka fungsi diskriminan hanya ada satu, dengan eigenvalue sebesar 2,993 yang sudah mencakup 100 % varians yang dijelaskan (explained variance).

Korelasi kanonikal adalah 0,866.  Koefisien determinasi (r2) diperoleh dengan memangkatduakan korelasi kanonikal: (0,866)2=0,750.  Angka ini mengindikasikan bahwa 75% varian dalam dependen variabel dapat dijelaskan oleh model.

 Uji Signifikansi

Tak ada gunanya mengintepretasi hasil analisis diskriminan kalau fungsinya tidak signifikan.  Hipothesis yang mau diuji adalah:

H0:   Rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup) adalah sama.

Sedangkan hipothesis alternatifnya (Ha) adalah paling rata-rata variabel satu variabel pada kedua grup adalah berbeda. Dalam SPSS, uji dilakukan dengan menggunakan Wilks’ λ. Kalau beberapa fungsi diuji sekaligus, sebagaimana dilakukan pada analisis diskriminan, statistik Wilks’ λ adalah hasil  λ univariat untuk setiap fungsi.

Nilai Wilk’s lambda ditransformasi menjadi nilai chi-square.  Pada hasil Output 4  terlihat bahwa Wilks’ λ berasosiasi sebesar 0,250 dengan fungsi diskriminan. Angka ini kemudian ditransformasi menjadi chi-quare dengan derajat kebebasan (ditulis df, singkatan dari degree of freedom) sebesar 4.  Nilai chi-square adalah dengan nilai 36,001. Kesimpulannya,  cukup bukti untuk menolak H0 dengan tingkat kesalahan (atau µ)=0,000.  Dengan demikian kita dapat menyimpulkan bahwa fungsi memiliki kemampuan melakukan diskriminasi.

Tingkat kepentingan prediktor

Untuk menjawab pertanyaan: “Variabel independen (disebut juga ‘variabel prediktor’ atau ‘prediktor’ saja) mana saja yang paling berperan (berkontribusi) dalam melakukan diskriminasi?”  Pertama lihat “standardized coefficient”. Secara relatif, prediktor yang memiliki ‘standardized coeficient’ yang lebih besar menyumbangkan kekuatan diskriminasi (discriminating power) yang lebih besar terhadap fungsi, dibanding prediktor yang memiliki standardized coefficient lebih kecil.  Jadi, seperti terlihat pada Output 5, dengan skor 0,545, prediktor ‘daya tarik topik’, memiliki tingkat kepentingan paling tinggi.  Dengan skor -0,026 prediktor gaji memiliki peran yang paling kecil.

Kedua, peneliti juga bisa menggunakan structure matrix, yang juga disebut canonical loadings dan discriminant loadings.   Jangan perhatikan negatif atau positifnya.  Perhatikan nilai mutlaknya. Pada Output 6, dengan structure matrix, kita dapat menyimpulkan bahwa peran diskriminasi dari yang tertinggi sampai terendah adalah kemampuan peneliti, daya tarik topik, sikap terhadap litbang dan gaji dosen.

Ketiga, kita dapat menggunakan nilai F per prediktor (Output 2), yang disebut univariate F ratio.  Semakin besar nilai  F, kontribusi terhadap diskriminasi semakin tinggi.

Nah, sekarang kita bandingkan tingkat kepentingan prediktor berdasarkan ketiga kriteria di atas (Tabel 6-3). Kesimpulan kita memang bisa berbeda, tergantung dari mana kita melihatnya. Disarankan, peneliti cukup menggunakan satu kriteria saja agar kesimpulan yang berbeda dapat dihindarkan.

Tabel 6-3.  Ringkasan Interpretasi Tingkat Kepentingan Variabel

Variabel Standardized Coefficient Discriminant Loadings Univariate F Ratio
Nilai Ranking Nilai Ranking Nilai Ranking
X1 -0.02557 4 -0,365 4 11.16123 4
X2 0.455568 3 0,620 3 32.1756 3
X3 0.539336 2 0,679 1 38.68685 1
X4 0.545003 1 0,627 2 33.00184 2

 

Fungsi Diskriminan

Dengan menggunakan ‘canonical discriminant function coefficients,  kita dapat membentuk fungsi diskriminan, yaitu:

D = -10.125 – 0,029X1+ 0,674X2 + 0,549X3+0,802X4

Sebetulnya, koefisien di atas merupakan penyederhanaan dengan memberikan angka tiga desimal di belakang koma, seperti dihasilkan oleh program SPSS. Kalau output SPSS kita impor dengan program Excel, maka angka di belakang koma nilai koefisien lebih banyak, sehingga dengan memakai angka demikian, perhitungan skor diskriminan secara manual lebih presisi. Cara mengimpor adalah dengan mengkopi tabel  output SPSS itu, lalu membuka Excel, terus melakukan Paste pada file yang telah dibuka itu. Hasilnya, seperti pada Output 7.

Dengan program SPSS sebenarnya  kita tidak perlu lagi menghitung skor diskriminan (disebut juga Z scores) karena sudah disediakan oleh SPSS.  Akan tetapi, untuk meningkatkan pemahaman, kita perlu mengetahui dari mana datangnya skor-skor itu. Persamaan di bawah ini, yang menggunakan koefisien dari Output 7, dapat dipakai menghitung skor diskriminan dengan presisi tinggi.

D=-10.124622 – 0,028541X1 + 0,5488X2 + 0,674008X3 + 0,802052X4

Sekiranya kita menggunakan skor diskriminan  yang telah diberikan oleh program komputer, maka persamaan pertama tidak bermasalah.  Persamaan ini baru bermasalah kalau kita menghitung skor diskriminan secara manual, sebab angkanya bisa berbeda (walaupun tidak banyak) dengan skor diskriminan yang diberikan komputer. Lihat pengerjaan manual di bawah ini.

Output 7.  Canonical Discriminant Function Coefficient dengan Enam Angka di Belakang Koma.

Canonical Discriminant Function Coefficients
Function
1
GAJI -0.028541
KMAMPUAN 0.548800
SIKAP 0.674008
DAYATAR 0.802052
(Constant) -10.124622
Unstandardized coefficients

Sumber: Output SPSS

Dengan persamaan kedua, untuk responden pertama, skor diskriminan adalah:

D=-10.124622 – 0,028541(3.2) + 0,5488(5) + 0,674008(6)  +0,802052(7) = 2,18646

Sedangkan dengan persamaan pertama, skor diskriminan adalah:

D=-10.126-0,029(3.2)+0,674(5)+0.549(6)+0.802(7)=2.3708

Hasilnya berbeda, bukan?  Memang, dengan persamaan pertamalah diperoleh semua skor pada Tabel 6,1.

Validasi

Cutting score determination

Sebelum analisis diskriminan dilakukan, kita hanya mempunyai dua skor berdasarkan jalur yang dipilih, yaitu 1 dan 2. Angka 1 menyatakan penelitian yang dibiayai Litbang, angka 2 menyatakan penelitian atas biaya sendiri.  Skor diskriminan yang kita cari dapat dipakai untuk memprediksi jalur setiap responden,  apakah golongan 1 atau 2.  Misalnya, dengan skor diskriminan sebesar 2,18646, dapatkah kita prediksi masuk mana responden 1?  Jawabannya dapat.

Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan optimum cutting score.  Memang dari komputer, informasi ini sudah diperoleh.  Akan tetapi, tak ada salahnya kalau kita mengetahui cara mengerjakannya secara manual.

Rumus yang digunakan berbeda untuk grup yang proporsional (kedua grup mempunyai jumlah anggota yang sama) dan yang tidak proporsional (jumlah anggota kedua grup berbeda).

Untuk dua grup yang mempunyai ukuran yang sama (seperti sampel holdout Tabel 6-2), cutting score dinyatakan oleh rumus:

di mana

Zce      = Cutting score untuk grup yang sama ukuran

ZA      = Centroid grup A

ZB      = Centroid grup B

Untuk sampel holdout, maka cutting score adalah:

Jadi, pembatasnya adalah 0,000.  Kalau di atas 0,000 masuk grup 1 dan kalau di bawah 0,000 masuk grup 2.  Oleh karena itu, responden 1 pada sampel holdout, dengan skor diskriminan 2,28368. Responden 11, dengan skor diskriminan -3,15108, masuk grup 2.  Dengan skor-skor yang ada, sekarang prediksilah setiap responden.

Apabila dua grup berbeda ukuran, seperti sampel analisis, maka rumus cutting score yang digunakan adalah:

Di mana,

ZCU   = Cutting score untuk gurp tak sama ukuran

NA   = Jumlah anggota grup A

NB   = Jumlah anggota grup B

ZA    = Centroid grup A

ZB    = Centroid grup B

Untuk sampel analisis, maka cutting score adalah:

Responden 1 sampel analisis diprediksi ke grup 1 skor diskrimi-nannya 2,18646.  Responden 3 yang aslinya masuk grup 1, diprediksi masuk grup 2 karena skor diskriminannya di bawah cutting score, yaitu -0,14431.  Ini namanya error atau misclassified.

Tanpa cutting score pun, sebenarnya kita dapat langsung memprediksi grup setiap responden, yaitu dengan melihat paling dekat ke centroid mana skor diskriminan masing-masing objek.  Misalnya, skor diskriman responden 1 sampel analisis, yang sebesar 2.18646, tentunya lebih dekat ke 1.787 (centroid grup 1) daripada ke -1,564 (centroid grup 2).  Oleh karena itu diprediksi masuk ke grup 1.  Responden 15 sampel analisis, dengan skor diskriminan -0,27107, tentunya masuk grup 2.

Program SPSS juga memberikan peluang masuk grup 1 dan grup 2.  Peluang ke grup mana paling besar dimiliki suatu objek, ke grup itulah objek tersebut kita prediksi.  Responden 1 sampel analisis, misalnya, memiliki peluang ke grup 1 sebesar 0,99904 dan ke grup 2 sebesar 0,00096.  Tentunya, peluang ke grup 1 lebih besar, jadi ke grup itulah responden 1 diprediksi.

Hit ratio

Hit rasio adalah persentase kasus atau responden yang kelompoknya dapat dipreksi secara tepat. Kalau jumlah seluruh kasus sampel analisis (atau responden) adalah 30 (pada kedua grup), lalu fungsi diskiminan dapat memprediksi 29 kasus secara tepat (hanya responden 3 yang error), maka hit ratio adalah 29/30=96,67%.  Tanpa menggunakan kriteria apa pun, karena mampu memprediksi grup keanggotaan 29 responden dari total 30 responden dan hanya satu yang salah prediksi, kita dapat menilai angka ini sangat bagus.

Untuk sampel holdout, fungsi diskriminan mampu memprediksi keanggotaan semua (100%) objek.  Karena itu, tanpa kriteria statistik apa pun, dapatlah kita yakin bahwa fungsi diskriminan, baik sampel analisis maupun holdout,  memiliki keakuran yang tinggi.

Pertanyaannya, bagaimana kalau hit rasio tidak sebaik itu?  Misalnya 60%, apakah dapat diterima?

Kalau ukuran setiap grup sama, lihat nilai kesempatan klasifikasi. Menurut Maholtra (2006), kesempatan klasifikasi untuk grup berukuran sama adalah 1 dibagi jumlah grup.  Untuk sampel yang terdiri dari  2 grup, maka kesempatan klasifikasi adalah ½ atau 0,50.

Hair et. al. (2006) menyatakan bahwa kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan klasifikasi ditambah seperempatnya.  Kalau kesempatan klasifikasi adalah 50%, maka batas minimal hit rasio adalah 0,50 + (0,25) (0,50)=0,625 atau 62,5%.

Kalau kita memiliki 4 grup, maka kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas minimal hit ratio adalah 31,25%.

Untuk sampel holdout kriteria ini dapat digunakan. Sayangnya, dua grup dalam sampel analisis tidak sama ukurannya. Kriteria kesempatan proporsional (proportional chance ciriterion) dapat dipakai kalau ukuran grup-grup tidak sama dan kalau tujuan peneliti adalah menentukan secara tepat keanggotaan objek pada dua (atau lebih) grup.  Rumusnya adalah

CPRO=p2+(1-p2)

Di mana:

p       = proporsi responden pada grup 1

1-p    = proporsi responden pada grup 2

Untuk sampel analisis, proporsi grup 1 adalah 46,67% dan proporsi grup 2 adalah 53,33%.  Dengan kedua proporsi ini, maka kita dapat menghitung

CPRO=(0, 4667)2+(0,5333)2=0,5022=50,22%

Akurasi statistik.

Kita dapat menguji secara statistik apakah klasifikasi yang kita lakukan (dengan menggunakan fungsi diskriminan) akurat atau tidak.  Uji statistik yang digunakan dinamakan Press’s Q Statistic.  Ukuran sederhana ini membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup.  Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai kritis (critical value) yang diambil dari table Chi-Square dengan derajat kebebasan satu (ditulis dk=1 atau df=1 atau v=1) dan tingkat keyakinan sesuai keinginan kita.  Statistik Q ditulis dengan rumus:

di mana

N   = ukuran total sampel

n   = jumlah kasus yang diklasifikasi secara tepat

K   = jumlah grup

Untuk sampel analisis, kita dapat menghitung:

Dengan µ=0,05 dan df=1, nilai X2 tabel adalah 3,841.  Dengan demikian, dapat kita simpulkan bahwa fungsi diskriminan kita akurat.