Repeated Measures ANOVA

Mari kita kembali pada konsep whitin-sucject dan between-subject yang sempat dijelaskan pada awal bab ini. Dalam whitin-subject, sampelnya sama, tetapi datanya banyak. Pada setiap individu dilakukan pengukuran beberapa kali dalam waktu yang berbeda. Itulah yang disebut repeated measeure.

Terjadinya beberapa kali pengukuran ini terkait dengan dua kemungkinan. Pertama, individu memperoleh perlakuan beberapa kali (seperti dalam eksperimen). Kedua, untuk perlakuan yang diberikan sama, tetapi data diambil beberapa kali untuk melihat perkembangan suatu variabel. Sehubungan dengan alasan kedua, terdapat berbagai teknik yang tersedia, yaitu repeated measures ANOVA,  repeated measures ANCOVA, repeated measures MANOVA dan repeated measures MANCOVA. Perbedaan repeated measures ANOVA dan repeated measures MANOVA terletak pada variabel dependen.

Untuk lebih jelasnya simak pertanyaan berikut: Sistem penggajian mana yang paling efektif menaikkan penjualan?  Pertanyaan tersebut diajukan oleh perusahaan berbasis personal selling. Ada tiga pilihan sistem penggajian, yaitu: sistem gaji tetap, sistem gaji variabel dan sistem kombinasi (gaji tetap plus gaji variabel).  Sekedar mengingatkan, sistem gaji tetap berarti gaji tetap tanpa memperhitungkan hasil penjualan sales representatif. Gaji variabel berarti besarnya gaji didasarkan pada penjualan sales representatif. Untuk menjawab pertanyaan tersebut, selama satu tahun, perusahaan menerapkan masing-masing sistem penggajian pada tiga kelompok sales representatif. Lalu, dari setiap kelompok dicatat volume penjualan setiap empat bulan, sehingga dalam satu tahun, dilakukan tiga kali pencatatan. Nah, teknik analisis yang digunakan untuk masalah ini adalah repeated measures ANOVA.

Prosedur:

1. Buka file

2. Klik: Analyze > General Linear Modelling > Repeated Measures.

3. Selanjutnya ikuti prosedur pada gambar di bawah ini.

4. Klik ‘Plot’, pada kotak dialog yang muncul, masukkan ‘time’ ke sumbu X (Horizontal Axis) dan Sistem ke sumbu Y (Separate Lines). Kemudian, klik ‘Add’, lalu Continue.

5. Klik ‘Options’. Kemudian masukkan ‘Sistem, Time dan Sistem*Time’ ke sel Display Means for. Selanjutnya, pada menu pilihan Display, tandai Descriptive statistics, Estimates of effect size dan Homogeneity tests. Klik ‘Compare Main Effect’ dan pilih Banferoni. Kemudian, klik Continue.

6. Setelah kembali ke menu awal, klik Post Hoc. Masukkan ‘Sistem’ ke ruang ‘Post Hoc Test for’. Untuk metodanya, pilih Banferroni. Kemudian klik Continue. Pada kotak dialog awal klik OK untuk memerintahkan SPSS melakukan analisis.

Interpretasi Output

Statistik deskriptif menginformasikan rata-rata, standar deviasi dan jumlah peserta (N).  Data ini memberi gambaran bahwa pada ketiga trimester, rata-rata penjualan full variable salary paling tinggi, diikuti oleh combination dan terakhir full fixed salary. Kalangan manajemen sudah dapat mengambil keputusan tentang sistem penggajian mana yang diambil berdasarkan data ini. Namun, kalangan peneliti memerlukan ulasan-ulasan berbasis statistik, seperti di bawah ini.

Apakah Data Cukup?

Pertanyaan ini dijawab menggunakan uji Box’s M. Yang diperiksa statistik Box’s M adalah Ho: matrik kovarian variabel-variabel dependen adalah sama antar grup. Grup mana? Ketiga grup sistem penggajian (full fixed salary, combination dan full variable salary). Variabel dependen mana? Oh ya, repeated measures ANOVA memperlakukan pengukuran berulang, yaitu sales dalam kasus ini, sebagai variabel-variabel dependen.

Pada Output 2, nilai Box’s M adalah 26.654 dan dirubah menjadi nilai F=1.857, dengan nilai sig.=0.035. Karena itu, pada batas α=0.05, tidak cukup bukti untuk menerima Ho Dengan demikian, dapat dinyatakan bahwa matrik kovarian variabel-variabel dependen adalah sama antar grup.

Bagaimana kalau Ho ditolak? Tidak masalah apabila jumlah sampel besar. Bah, bukankah jumlah peserta kita sedikit (N=30)? Tidak masalah juga karena peserta yang kita gunakan bukan sampel, melainkan populasi, yaitu semua sales representative yang dimiliki perusahaan.  Penolakan Ho menjadi masalah apabila kita menggunakan sampel kecil dan berarti ukuran sampel tidak cukup.

Multivariate Test

Walaupun tidak ada variabel multivariat, repeated measures ANOVA memperlakukan variabel dependen, dalam hal ini penjualan dari empat kwartal berbeda, sebagai variabel multivariat. Nilai variat diekstrak secara linier dari ke tiga kelompok penjualan. Dari Output 3 terlihat bahwa keempat kriteria pengaruh multivariat (Pillai’s Trace, Wilks’ Lambda, Hotelling Trace, Roy’s Largest Root), memiliki nilai F yang sama, yang signifikan pada α=0,000. Kekuatan pengaruh ini dinyatakan oleh partial eta squared=0.934. Artinya, ‘time’ dapat menjelaskan 93,4% varian nilai multivariat.

Interaksi antara ‘time’ dan ‘sistem’ juga berpengaruh pada nilai multivariat. Keempat kriteria memberikan nilai yang berbeda-beda. Kalau berdeda, kita ambil satu kriteria: Wilks’ Lambda (Field, 2012). Nilainya adalah 0.629, yang ditransfer ke dalam nilai F=3.390, dengan nilai sig.=0.015. Artinya, interaksi antara ‘time’ dan ‘sistem’ berpengaruh pada nilai multivariat. Besarnya pengaruh dinyatakan oleh partial square eta sebesar 0.207. Artinya, interaksi antara ‘time’ dan ‘sistem’ dapat menjelaskan 20.7% varian nilai multivariat.

Sphericity Test

Salah satu prinsip yang mendasari RMA adalah bahwa data tidak independen, melainkan inter-dependen karena diambil dari sumber yang sama pada waktu yang berbeda. Dalam contoh kita ini, maka penjualan sales representative selama satu tahun, dihitung setiap kwartal. Oleh karena itu, penjualan kwartal pertama dan kedua, kedua dan ketiga, serta pertama dan ketiga,  mestinya berkorelasi. Untuk membuktikan asumsi itu digunakanlah Mauchly’s Test of Sphericity.

Uji ini hanya berlaku apabila kelompok data adalah tiga atau lebih. Untuk memahaminya, mari kita buat ilustrasi sederhana. Kita ingin meneliti apakah program pendampingan anak-anak terkena bencana dapat mengurangi trauma. Pengukuran trauma dilakukan tiga kali, yaitu sebelum pendampingan, selama pendampingan dan setelah pendampingan selesai. Hasilnya adalah seperti pada tabel berikut. Yang diperiksa dalam sphericity test adalah apakah varian selisih antara kelompok data sama (Field, 2012).  Pada tabel ilustrasi disajikan varian dimaksud. Pertanyaannya, apakah 0.7, 0.2 dan 0.5 dianggap sama? Mauchly’s Test of Sphericity menjawab pertanyaan ini.

Untuk data kita, nilai Mauchly’s W atau ε=0.813, yang dirubah menjadi nilai Chi-square sebesar 5.373, dengan nilai sig.=0.068.  Jadi, tidak cukup bukti menolak Ho bahwa varian selisih antar antar grup tidak berbeda. Artinya, prasyarat sphericity terpenuhi.

Bagaimana kalau prasyarat sphericity tidak terpenuhi? Menurut Field (2012), kita tidak dapat memercayai hasil uji-F. Namun, menurutnya, masih ada faktor pertimbangan dan faktor koreksi. Pertimbangannya, nilai Mauchly’s W dipengaruhi oleh ukuran sampel. Apabila sampel kecil, keadaan  tidak dipenuhinya prasyarat sphericity masih dapat ditoleransi. Tetapi, untuk sampel besar tidak dapat ditoleransi.

Dengan terpenuhinya syarat sphericity, maka koreksi tidak perlu dilakukan. Konsekuensinya, nilai-F kondisi sphericity assumed tabel berikut dapat dipakai. Statistik F dipakai untuk menguji Ho: µ123. Dengan kata lain, rata-rata penjualan pada trimester satu = trimester dua = trimester tiga. Hipothesis alternatifnya atau Ha adalah paling tidak rata-rata antar dua trimester berbeda.

Untuk ‘Time’, nilai F=268.620 dan nilai sig.=0.000, cukup bukti untuk menolak Ho. Kesimpulan: Paling tidak rata-rata penjualan antar dua trimester berbeda.

Interaksi antara ‘Time’ dan ‘Sistem’ menghasilkan sembilan kategori. Lihat tabel berikut. Simbol µij menyatakan rata-rata penjualan pada setiap kategori.

Hipothesis yang diuji adalah Ho: µ11= µ12= … = µ33. Nilai F=4.049 yang signifikan pada α=0.006. Dengan demikian, paling tidak rata-rata penjualan antar dua kategori adalah berbeda.

Apabila syarat sphericity tidak dipenuhi, maka koreksi dilakukan menggunakan pendekatan Greenhouse-Geisser, Huynh-Feldt dan Lower-bound. Bagaimana koreksi dilakukan dapat kita peragakan secara manual. Namun, secara singkat dapat dinyatakan bahwa koreksi dilakukan dengan mengubah derajat kebebasan (degree of freedom) tanpa mengubah nilai F. Program SPSS sendiri sudah melakukannya bagi kita. Kita hanya perlu menentukan nilai mana yang digunakan dari ketiganya.  Apabila keduanya memiliki nilai ε di bawah 0.75, pakailah nilai Greenhouse-Geisser. Sebaliknya, apabila nilai ε di atas 0.75 pakailah Huynh-Feldt. Bagaimana kalau kedua kondisi ditemukan? Misalnya, Greenhouse-Geisser < 0.75 dan Huynh-Feldt  > 0.75, gunakan yang mana saja dari keduanya (Field, 2012).

Kembali pada uji F di atas. Kita memiliki dua kesimpulan: paling tidak rata-rata antar dua trimester berbeda dan paling tidak rata-rata penjualan antar dua kategori adalah berbeda. Pertanyaannya, rata-rata penjualan mana yang berbeda itu? Pertanyaan ini relevan kita ajukan pada kesimpulan pertama. Hasil di bawah ini (Output 6). Perhatikan bagian yang diarsir. Terlihat bahwa antara Trimester I ke Trimester II serta Trimester 2 ke Trimester 3 terjadi peningkatan dan menurut uji Bonferroni peningkatan tersebut signifikan pada α=0.000. Secara grafis, peningkatan rata-rata penjualan setiap trimester diperlihatkan pada Output 8.

Bagaimana dengan pengasuh sistem penggajian terhadap penjualan? Pertama-tama kita perhatikan Output 7. Uji F tentang Tests of Between-Subjects Effects adalah untuk menguji Ho: Rata-rata penjualan ketiga sistem penggajian adalah sama. Dengan nilai F=193.385 dan nilai sig.=0.000 cukup bukti untuk menolak Ho. Dengan demikian, ketiga sistem penggajian menghasilkan rata-rata penjualan yang berbeda.

Pertanyaannya, bagaimana perbandingan rata-rata penjualan antar sistem penggajian? Output 8 menunjukkan penjualan rata-rata sistem kombinasi lebih tinggi 10.69 dibanding sistem penggajian tetap. Rata-rata penjualan sistem penggajian variabel penuh lebih tinggi 43.17 dibanding sistem penggajian kombinasi. Berdasarkan Uji Tukey dan Bonferroni kita dapat disimpulkan bahwa perbedaan rata-rata sistem penggajian tersebut adalah signifikan.


Referensi

Field, A. (2012).  Repeated measures ANOVA. Discovering Statistics. Retrieved from www. discoveringstatistic.com, January 16, 2016.