Analysis of Covariance

Bilson Simamora

First published: September 19, 2017, last updated: September 21, 2017

Dalam ANCOVA terdapat satu variabel dependen dengan satu atau beberapa variabel kategorikal dan satu atau beberapa variabel numerik.  Setiap pengamatan harus independen, artinya setiap partisipan hanya bisa masuk ke dalam satu grup. Syarat ini berkaitan dengan desain penelitian.

ANCOVA juga mengharapkan eror residual (residuals error) yang berdistribusi normal.  Syarat lain yang harus dipenuhi adalah homogenitas varian/varian eror, homoskedastisitas, dan linieritas hubungan kovariat dengan variabel dependen.

Homoskedastisitas berbicara tentang persebaran residual, apakah tersebar merata (homoskedastis) atau tidak merata (heteroskedastis) pada setiap tingkat variabel dependen. Pada sisi lain, prinsip linearitas adalah untuk memastikan apakah hubungan antara variabel independen metrik (dalam hal ini kovariat) dengan variabel dependen memiliki hubungan linier ataukah non-linier.

Sebagai bentuk pembelajaran, buka file Ancova.sav.  Kita ingin memeriksa apakah indeks prestasi kumulatif (IPK) dipengaruhi oleh minat terhadap jurusan  dan kecerdesan intelektual (intellectual question atau IQ). IPK adalah variabel dependen, minat yang berifat kategorikal (tidak berminat, berminat, sangat berminat) disebut faktor, sedangkan IQ yang bersifat metrik merupakan kovariat.

Analisis dalam SPSS mengikuti prosedur: Analysis>General Linear Modelling>Univariat.  Lalu, pada kotak dialog yang muncul, masukkan IPK pada sel ‘Dependent Variables’, minat pada sel ‘Fixed Factor(s)’, dan IQ pada sel Covariate(s).  Selanjutnya, klik Save. Pada kotak dialog, tandai Unstandardized di bawah Predicted Values dan Unstandardized di bawah Residuals.  Kemudian, pada menu Options, tandai Descriptive, Parameter Estimates, Homogeneity Test dan Residual PlotOutput-nya disimpan dulu di ‘Output-Ancova.spv’.

Setelah analisis dilakukan, kita kembali data.  Di sana kita temukan variabel baru, yaitu residual, yang oleh program diberi nama RES_1.  Variabel ini merupakan selisih antara nilai IPK prediksi (PRE_1) dengan IPK hasil observasi (ipk).  Untuk mengetahui apakah variabel ini berdistribusi normal, lakukan prosedur: Analysis>DescriptivesExplore.  Masukkan Residual for ipk ke sel Dependent List, klik menu Options dan tandai Normality plots with test.

Hasil uji normalitas disajikan pada Output 1.  Berdasarkan dua uji yang dilakukan, yaitu Kolmogorov-Smirnov (nilai=0.131, sig.=0.200) dan Shapiro-Wilk (nilai=0.982, sig.=0.879) tidak terdapat cukup bukti untuk menolak Ho bahwa residual dependen variabel berdistribusi normal.

Kembali ke file Output_Ancova.spv. Homogenitas varian/varian eror diperiksa melalui uji Lavene.  Berdasarkan Output 2 terlihat bahwa uji Lavene tidak dapat menolak Ho bahwa error variances pada ketiga group adalah sama.

Homoskedastisitas dapat kita secara visual dengan membuat grafik scatter-plot antara predicted value dan residual. Kali ini homoskedastisitas tidak terdapat pada file Output_Ancova.spv.  Oleh karena itu, kita harus buat lagi. Untuk itu lakukan prosedur berikut pada SPSS: Graph>Chart Builder>OK.

Dari Gallery pilih Scatter/Dot. Kemudian, drag Predicted Value for ipk ke Sumbu X, lalu drag Residul for ipk ke sumbu Y.  Hasilnya kita peroleh seperti grafik di bawah ini.

Secara visual ada indikasi bahwa prinsip homoskedastisitas terpenuhi, karena persebaran nilai residual pada level predicted value for ipk merata pada setiap level “predicted value for ipk”. Untuk membuktikan secara statistik, kita dapat menggunakan uji Glejer. Caranya adalah dengan menjadikan residual value sebagai dependent variabel dan ‘minat’ serta ‘iq’ sebagai variabel independen.  Prosedurnya: AnalysisàGeneral Linear ModellingàUnivariate.  Masukkan ‘Residual value for ipk’ sebagai variabel dependen, ‘minat’ pada sel Fixed factor(s) serta ‘iq’ pada sel Covariate(s).

Hasilnya, ‘minat’ dan ‘iq’ tidak dapat dipakai sebagai variabel independen bagi nilai residual (Residual for ipk) karena nilai sig. keduanya adalah 1.000 (lihat Output 2). Dengan demikian dapat dikatakan bahwa data memenuhi prinsip homoskedastisitas.

Liniearitas juga tidak terdapat pada Output_Ancova.spv. Untuk memeriksanya, bila hanya ada satu kovariat, pertama-tama, kita dapat membuat grafik yang menghubungkan variabel dependen dan kovariat. Dengan prosedur pembuatan grafik pada SPSS, yang sudah dijelaskan di atas, kita dapat memperoleh grafik seperti di bawah ini.

Pada grafik tersebut terlihat bahwa titik-titik yang menandai koordinat (X,Y) setiap observasi, yang didasarkan pada iq (absis atau X) dan ipk (ordinat atau Y), mengumpulkan di sekitar sebuah garis lurus.  Hal ini mengindikasikan adanya hubungan linier antara kedua variabel.

Mari kita buktikan. Prosedur: Analysis>General Linear Modelling>Univariat. Masukkan ‘ipk’ sebagai variabel independen dan ‘iq’ sebagai kovariat. Pada menu Options tandai parameter estimates.  Hasil pada Output 3 menunjukkan bahwa ‘iq’ berpengaruh signifikan (t=11.381, sig.=0.000) terhadap ‘ipk’.

Kita perlu juga menguji hubungan non-linier. Untuk hubungan non-linier kita coba menggunakan hubungan kwadratik. Untuk tujuan ini kita tambahkan variabel baru terlebih dahulu, yaitu kwadrat dari iq. Caranya: Transform>Compute variables. Lalu, muncul kotak dialog seperti di bawah. Tuliskan Square_iq sebagai Target Variable. Kemudian, pada sel Numeric Expression tuliskan iq*iq.  Setelah meng-klik OK, program akan menambahkan variabel baru dimaksud.

Untuk membentuk persamaan non-linier, yang diwakili oleh persamaan kwadratik, lakukan prosedur:  Analysis>General Linear Modelling>Univariat. Masukkan ‘ipk’ sebagai variabel independen dan ‘iq’ sebagai kovariat. Pada menu Options tandai parameter estimates.

Hasil pada Output 4 menunjukkan bahwa ‘iq’ (t=-1.018, sig.=0.318)  dan ‘square_iq’ (t=1.473, sig.=0.152) tidak terbukti berpengaruh terhadap ‘ipk’.  Dengan demikian dapat dinyatakan bahwa hubungan ‘ipk’ dan ‘iq’ lebih baik digambarkan sebagai hubungan linier.

Setelah syarat-syarat normalitas, homogenitas, homoskedastisitas, dan linieritas terpenuhi, kita dapat melakukan ANCOVA. Mari kembali ke file Output_Ancova.spv.   Kita ambil hasil berupa Test of Between-Subject Effects.  Kita fokuskan perhatian pada nilai F pada Output 5.

Pada Output 5 yang perlu diperhatikan adalah nilai F variabel independen atau interaksinya (kalau ada).  Pertama-tama, kita perhatikan variabel ’minat’. Hasil ini menunjukkan bahwa perbedaan rata-rata ’ipk’ antar subjek, yang di-adjusting berdasarkan variabel ’minat’ adalah signifikan [(2,26)=5.389,  sig.=0.011].

Kenapa di-adjusting?  Karena ada faktor lain yang berkaitan dengan perbedaan ’ipk’ antar subjek, yaitu ’iq’. Variabel ini mampu membedakan ’ipk’ antar subjek secara signifikan [F(1,26)= 170.138, sig.=0.000].

Untuk lebih memahami ’adjusting’ dimaksud, mari kita lihat pengaruh ’minat’ dengan cara mengeluarkan ’iq’.  Kita akan me-run ulang program SPSS. Ulangi prosedur analisis yang dijelaskan di awal seksi ini. Dengan mengeluarkan ’iq’ dari sel Covariates, maka diseroleh hasil di bawah ini (Output 6).

Pada Output 6 terlihat bahwa ‘ipk’ berbeda berdasarkan ‘minat’ dengan nilai F (2,27)=8.825 dan sig.=0.001.  Namun, model ini hanya dapat menjelaskan 39.5% varian ‘ipk’ (adjusted 35.1%). Dengan memasukkan ‘iq’ sebagai kovariat, model ANCOVA dapat menjelaskan 87.4% varian ipk (adjusted 86%). Jadi, secara statistic, ‘iq’ mengurangi pengaruh ‘minat’. Karena itu, perbedaan berpengaruh terhadap perbedaan indeks prestasi kumulatif antar grup perlu disesuaikan (di-adjusting).

Output 7.  Parameter Estimates
Dependent Variable: ipk
Parameter B Std. Error t Sig. 95% Confidence Interval Partial Eta Squared
Lower Bound Upper Bound
Intercept -1.973 .520 -3.791 .001 -3.042 -.903 .356
iq .039 .004 9.956 .000 .031 .048 .792
[minat=1.00] -.006 .069 -.093 .927 -.148 .135 .000
[minat=2.00] -.196 .069 -2.831 .009 -.338 -.054 .236
[minat=3.00] 0a . . . . . .
a. This parameter is set to zero because it is redundant.

 

Untuk membentuk persamaan linier ANCOVA, kita menggunakan hasil pada Output 7.  Berdasarkan hasil ini, kita bisa membentuk tiga persamaan linier, di mana setiap grup memiliki persamaan sendiri.

Untuk grup minat=3 (sangat berminat) > ipk= -1.973 + 0.039

Untuk grup minat=2 (berminat) > ipk = – 1.973 + 0.039 – 0.006 minat

Untuk grup minat=1 (tidak berminat) > ipk = – 1.973 + 0.039 – 0.196 minat

Pada ketiga persamaan terlihat bahwa iq berpengaruh signifikan (t=9.956, sig.=0.000).  Partial squared eta = 0.792 menunjukkan bahwa variabel ini dapat menjelaskan 79.2% varian ‘ipk’.  Program menjadikan grup 3 (sangat berminat) sebagai ‘titik berangkat’ atau keadaan normal. Grup 2 (tidak berminat) dianggap sebagai gangguan atau penyimpangan terhadap ‘titik berangkat’ yang menurunkan ‘ipk’ sebesar – 0.196 atau sebesar koefisiennya. Penurunan ini dianggap signifikan (t= -2.831, sig.=009).  Penurunan minat dari ‘sangat berminat’ menjadi ‘berminat’ menurunkan ‘ipk’ sebesar koefisiennya, yaitu -0.006 dan penurunan ini dianggap tidak signifikan (t=-0.093, sig.=0.927).

Apa yang dimaksud titik berangkat atau keadaan normal itu? Dalam regresi yang melibatkan variabel kualitatif kita bisa menentukannya sendiri. Tetapi, dalam ANCOVA ini, model menentukannya.  Ilustrasi berikut diharapkan menjelaskannya. Penjualan es krim di sebuah toko rata-rata 600 buah per hari.  Namun, pada keadaan hari hujan, penjualan turun menjadi 200 buah per hari. Dalam ilustrasi ini, hari hujan adalah keadaan khusus, bukan keadaan normal. Jadi, kita tidak menyatakan begini: Penjualan es krim adalah 200 buah per hari, tetapi kalau tidak hujan adalah 600 buah per hari

DAFTAR REFERENSI