Repeated Measures ANOVA

Repeated Measures ANOVA

Mari kita kembali pada konsep whitin-sucject dan between-subject yang sempat dijelaskan pada awal bab ini. Dalam whitin-subject, sampelnya sama, tetapi datanya banyak. Pada setiap individu dilakukan pengukuran beberapa kali. Itulah yang disebut repeated measeure.

Terjadinya beberapa kali pengukuran ini terkait dengan dua kemungkinan. Pertama, individu memperoleh perlakuan beberapa kali (seperti dalam eksperimen). Kedua, untuk perlakuan yang diberikan sama, tetapi data diambil beberapa kali untuk melihat perkembangan suatu variabel. Sehubungan dengan alasan kedua, terdapat berbagai teknik yang tersedia, yaitu repeated measures ANOVA,  repeated measures ANCOVA, repeated measures MANOVA dan repeated measures MANCOVA. Perbedaan repeated measures ANOVA dan repeated measures MANOVA terletak pada variabel dependen.

Untuk lebih jelasnya simak pertanyaan berikut: Sistem penggajian mana yang paling efektif menaikkan penjualan?  Pertanyaan tersebut diajukan oleh perusahaan berbasis personal selling. Ada tiga pilihan sistem penggajian, yaitu: sistem gaji tetap, sistem gaji variabel dan sistem kombinasi (gaji tetap plus gaji variabel).  Sekedar mengingatkan, sistem gaji tetap berarti gaji tetap tanpa memperhitungkan hasil penjualan sales representatif. Gaji variabel berarti besarnya gaji didasarkan pada penjualan sales representatif. Untuk menjawab pertanyaan tersebut, selama satu tahun, perusahaan menerapkan masing-masing sistem penggajian pada tiga kelompok sales representatif. Lalu, dari setiap kelompok dicatat volume penjualan setiap empat bulan, sehingga dalam satu tahun, dilakukan tiga kali pencatatan. Nah, teknik analisis yang digunakan untuk masalah ini adalah repeated measures ANOVA.

Prosedur:

  1. Buka file repeated measures ANOVA
  2. Klik: Analyze > General Linear Modelling > Repeated Measures. Selanjutnya ikuti prosedur seperti di bawah ini.

Klik ‘Plot’, pada kotak dialog yang muncul, masukkan ‘time’ ke sumbu X (Horizontal Axis) dan Sistem ke sumbu Y (Separate Lines). Kemudian, klik ‘Add’, lalu Continue.

Klik ‘Options’. Kemudian masukkan ‘Sistem, Time dan Sistem*Time’ ke sel Display Means for. Selanjutnya, pada menu pilihan Display, tandai Descriptive statistics, Estimates of effect size dan Homogeneity tests. Klik ‘Compare Main Effect’ dan pilih Banferoni. Kemudian, klik Continue.

Setelah kembali ke menu awal, klik Post Hoc. Masukkan ‘Sistem’ ke ruang ‘Post Hoc Test for’. Untuk metodanya, pilih Banferroni. Kemudian klik Continue. Pada kotak dialog awal klik OK untuk memerintahkan SPSS melakukan analisis.

Interpretasi Output

Statistik deskriptif menginformasikan rata-rata, standar deviasi dan jumlah peserta (N).  Data ini memberi gambaran bahwa pada ketiga trimester, rata-rata penjualan full variable salary paling tinggi, diikuti oleh combination dan terakhir full fixed salary. Kalangan manajemen sudah dapat mengambil keputusan tentang sistem penggajian mana yang diambil berdasarkan data ini. Namun, kalangan peneliti memerlukan ulasan-ulasan berbasis statistik, seperti di bawah ini.

 

Output 1: Descriptive Statistics
Sistem penggajian Mean Std. Deviation N
Sales_1 Full fixed salary 63.42 6.179 10
Combination 71.50 6.433 10
Full variable salary 109.60 12.295 10
Total 81.51 22.160 30
Sales_2 Full fixed salary 84.30 8.015 10
Combination 90.50 5.681 10
Full variable salary 135.60 5.641 10
Total 103.47 24.094 30
Sales_3 Full fixed salary 100.20 12.891 10
Combination 118.00 4.522 10
Full variable salary 164.30 13.687 10
Total 127.50 29.515 30

 

Apakah Data Cukup?

Pertanyaan ini dijawab menggunakan uji Box’s M. Yang diperiksa statistik Box’s M adalah Ho: matrik kovarian variabel-variabel dependen adalah sama antar grup. Grup mana? Ketiga grup sistem penggajian (full fixed salary, combination dan full variable salary). Variabel dependen mana? Oh ya, repeated measures ANOVA memperlakukan pengukuran berulang, yaitu sales dalam kasus ini, sebagai variabel-variabel dependen.

Output 2: Box’s Test of Equality of Covariance Matricesa
Box’s M 26.654
F 1.857
df1 12
df2 3532.846
Sig. .035
Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups.
a. Design: Intercept + Sistem

Within Subjects Design: Time

Pada Output 2, nilai Box’s M adalah 26.654 dan dirubah menjadi nilai F=1.857, dengan nilai sig.=0.035. Karena itu, pada batas α=0.05, tidak cukup bukti untuk menerima Ho Dengan demikian, dapat dinyatakan bahwa matrik kovarian variabel-variabel dependen adalah sama antar grup.

Bagaimana kalau Ho ditolak? Tidak masalah apabila jumlah sampel besar. Bah, bukankah jumlah peserta kita sedikit (N=30)? Tidak masalah juga karena peserta yang kita gunakan bukan sampel, melainkan populasi, yaitu semua sales representative yang dimiliki perusahaan.  Penolakan Ho menjadi masalah apabila kita menggunakan sampel kecil dan berarti ukuran sampel tidak cukup.

Multivariate Test

Walaupun tidak ada embel-embel multivariat, repeated measures ANOVA memperlakukan variabel dependen, dalam hal ini penjualan dari empat kwartal berbeda, sebagai variabel multivariat. Nilai variat diekstrak secara linier dari ke tiga kelompok penjualan. Dari Output 3 terlihat bahwa keempat kriteria pengaruh multivariat (Pillai’s Trace, Wilks’ Lambda, Hotelling Trace, Roy’s Largest Root), memiliki nilai F yang sama, yang signifikan pada α=0,000. Kekuatan pengaruh ini dinyatakan oleh partial eta squared=0.934. Artinya, ‘time’ dapat menjelaskan 93,4% varian nilai multivariat.

 

Output 3: Multivariate Testsa
Effect Value F Hypothesis df Error df Sig. Partial Eta Squared
Time Pillai’s Trace .934 184.872b 2.000 26.000 .000 .934
Wilks’ Lambda .066 184.872b 2.000 26.000 .000 .934
Hotelling’s Trace 14.221 184.872b 2.000 26.000 .000 .934
Roy’s Largest Root 14.221 184.872b 2.000 26.000 .000 .934
Time * Sistem Pillai’s Trace .394 3.316 4.000 54.000 .017 .197
Wilks’ Lambda .629 3.390b 4.000 52.000 .015 .207
Hotelling’s Trace .552 3.452 4.000 50.000 .014 .216
Roy’s Largest Root .473 6.390c 2.000 27.000 .005 .321
a. Design: Intercept + Sistem

Within Subjects Design: Time

b. Exact statistic
c. The statistic is an upper bound on F that yields a lower bound on the significance level.

Interaksi antara ‘time’ dan ‘sistem’ juga berpengaruh pada nilai multivariat. Keempat kriteria memberikan nilai yang berbeda-beda. Kalau berdeda, kita ambil satu kriteria: Wilks’ Lambda (Field, 2012). Nilainya adalah 0.629, yang ditransfer ke dalam nilai F=3.390, dengan nilai sig.=0.015. Artinya, interaksi antara ‘time’ dan ‘sistem’ berpengaruh pada nilai multivariat. Besarnya pengaruh dinyatakan oleh partial square eta sebesar 0.207. Artinya, interaksi antara ‘time’ dan ‘sistem’ dapat menjelaskan 20.7% varian nilai multivariat.

Sphericity Test

Salah satu prinsip yang mendasari RMA adalah bahwa data tidak independen, melainkan inter-dependen karena diambil dari sumber yang sama pada waktu yang berbeda. Dalam contoh kita ini, maka penjualan sales representative selama satu tahun, dihitung setiap kwartal. Oleh karena itu, penjualan kwartal pertama dan kedua, kedua dan ketiga, serta pertama dan ketiga,  mestinya berkorelasi. Untuk membuktikan asumsi itu digunakanlah Mauchly’s Test of Sphericity.

Uji ini hanya berlaku apabila kelompok data adalah tiga atau lebih. Untuk memahaminya, mari kita buat ilustrasi sederhana. Kita ingin meneliti apakah program pendampingan anak-anak terkena bencana dapat mengurangi trauma. Pengukuran trauma dilakukan tiga kali, yaitu sebelum pendampingan, selama pendampingan dan setelah pendampingan selesai. Hasilnya adalah seperti pada tabel berikut.        Yang diperiksa dalam sphericity test adalah apakah varian selisih antara kelompok data sama (Field, 2012).  Pada tabel ilustrasi disajikan varian dimaksud. Pertanyaannya, apakah 0.7, 0.2 dan 0.5 dianggap sama? Mauchly’s Test of Sphericity menjawab pertanyaan ini.

 

NAMA ANAK TRAUMA A-B C-B C-A
Sebelum Pendampingan

(A)

Selama Pendampinga

(B)

Setelah Pendampingan (C)
Ricky 10 8 6 2 -2 -4
Alisa 12 9 8 3 -1 -4
Maria 11 10 8 1 -2 -3
Rama 15 12 10 3 -2 -5
Armada 11 9 7 2 -2 -4
VARIAN 0.7 0.2 0.5

Untuk data kita, nilai Mauchly’s W atau ε=0.813, yang dirubah menjadi nilai Chi-square sebesar 5.373, dengan nilai sig.=0.068.  Jadi, tidak cukup bukti menolak Ho bahwa varian selisih antar antar grup tidak berbeda. Artinya, prasyarat sphericity terpenuhi.

Output 4: Mauchly’s Test of Sphericitya
Measure: Sales
Within Subjects Effect Mauchly’s W Approx. Chi-Square df Sig. Epsilonb
Greenhouse-Geisser Huynh-Feldt Lower-bound
Time .813 5.373 2 .068 .843 .959 .500

 

Bagaimana kalau prasyarat sphericity tidak terpenuhi? Menurut Field (2012), kita tidak dapat memercayai hasil uji-F. Namun, menurutnya, masih ada faktor pertimbangan dan faktor koreksi. Pertimbangannya, nilai Mauchly’s W dipengaruhi oleh ukuran sampel. Apabila sampel kecil, keadaan  tidak dipenuhinya prasyarat sphericity masih dapat ditoleransi. Tetapi, untuk sampel besar tidak dapat ditoleransi.

 

Output 5: Tests of Within-Subjects Effects
Measure: Sales
Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared
Time Sphericity Assumed 31752.294 2 15876.147 268.620 .000 .909
Greenhouse-Geisser 31752.294 1.685 18839.984 268.620 .000 .909
Huynh-Feldt 31752.294 1.918 16552.322 268.620 .000 .909
Lower-bound 31752.294 1.000 31752.294 268.620 .000 .909
Time * Sistem Sphericity Assumed 957.148 4 239.287 4.049 .006 .231
Greenhouse-Geisser 957.148 3.371 283.958 4.049 .010 .231
Huynh-Feldt 957.148 3.837 249.478 4.049 .007 .231
Lower-bound 957.148 2.000 478.574 4.049 .029 .231
Error(Time) Sphericity Assumed 3191.540 54 59.103
Greenhouse-Geisser 3191.540 45.505 70.136
Huynh-Feldt 3191.540 51.794 61.620
Lower-bound 3191.540 27.000 118.205

Dengan terpenuhinya syarat sphericity, maka koreksi tidak perlu dilakukan. Konsekuensinya, nilai-F kondisi sphericity assumed tabel berikut dapat dipakai. Statistik F dipakai untuk menguji Ho: µ123. Dengan kata lain, rata-rata penjualan pada trimester satu = trimester dua = trimester tiga. Hipothesis alternatifnya atau Ha adalah paling tidak rata-rata antar dua trimester berbeda.

Untuk ‘Time’, nilai F=268.620 dan nilai sig.=0.000, cukup bukti untuk menolak Ho. Kesimpulan: Paling tidak rata-rata penjualan antar dua trimester berbeda.

Interaksi antara ‘Time’ dan ‘Sistem’ menghasilkan sembilan kategori. Lihat tabel berikut. Simbol µij menyatakan rata-rata penjualan pada setiap kategori.

 

                    TIME

SISTEM

Trimester 1 Trimester 2 Trimester 3
Full-fixed Salary µ11 µ12 µ13
Combination µ21 µ22 µ23
Full-variable Salary µ31 µ32 µ33

Hipothesis yang diuji adalah Ho: µ11= µ12= … = µ33. Nilai F=4.049 yang signifikan pada α=0.006. Dengan demikian, paling tidak rata-rata penjualan antar dua kategori adalah berbeda.

Apabila syarat sphericity tidak dipenuhi, maka koreksi dilakukan menggunakan pendekatan Greenhouse-Geisser, Huynh-Feldt dan Lower-bound. Bagaimana koreksi dilakukan dapat kita peragakan secara manual. Namun, secara singkat dapat dinyatakan bahwa koreksi dilakukan dengan mengubah derajat kebebasan (degree of freedom) tanpa mengubah nilai F. Program SPSS sendiri sudah melakukannya bagi kita. Kita hanya perlu menentukan nilai mana yang digunakan dari ketiganya.  Apabila keduanya memiliki nilai ε di bawah 0.75, pakailah nilai Greenhouse-Geisser. Sebaliknya, apabila nilai ε di atas 0.75 pakailah Huynh-Feldt. Bagaimana kalau kedua kondisi ditemukan? Misalnya, Greenhouse-Geisser < 0.75 dan Huynh-Feldt  > 0.75, gunakan yang mana saja dari keduanya (Field, 2012).

Kembali pada uji F di atas. Kita memiliki dua kesimpulan: paling tidak rata-rata antar dua trimester berbeda dan paling tidak rata-rata penjualan antar dua kategori adalah berbeda. Pertanyaannya, rata-rata penjualan mana yang berbeda itu? Pertanyaan ini relevan kita ajukan pada kesimpulan pertama. Hasil di bawah ini (Output 6). Perhatikan bagian yang diarsir. Terlihat bahwa antara Trimester I ke Trimester II serta Trimester 2 ke Trimester 3 terjadi peningkatan dan menurut uji Bonferroni peningkatan tersebut signifikan pada α=0.000. Secara grafis, peningkatan rata-rata penjualan setiap trimester diperlihatkan pada Output 8.

 

Output 6: Pairwise Comparisons

Measure: Sales
(I) Time (J) Time Mean Difference (I-J) Std. Error Sig.b 95% Confidence Interval for Differenceb
Lower Bound Upper Bound
1 2 -21.960* 1.842 .000 -26.663 -17.257
3 -45.993* 2.368 .000 -52.039 -39.948
2 1 21.960* 1.842 .000 17.257 26.663
3 -24.033* 1.678 .000 -28.317 -19.750
3 1 45.993* 2.368 .000 39.948 52.039
2 24.033* 1.678 .000 19.750 28.317
Based on estimated marginal means
*. The mean difference is significant at the .05 level.
b. Adjustment for multiple comparisons: Bonferroni.

 

Output 7:  Tests of Between-Subjects Effects

Measure: Sales

Transformed Variable: Average

Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared
Intercept 976395.840 1 976395.840 7740.755 .000 .997
Sistem 48786.081 2 24393.040 193.385 .000 .935
Error 3405.700 27 126.137

 

Output 8:  Multiple Comparisons
Measure: Sales
(I) Sistem penggajian (J) Sistem penggajian Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval
Lower Bound Upper Bound
Tukey HSD Full fixed salary Combination -10.69* 2.900 .003 -17.88 -3.50
Full variable salary -53.86* 2.900 .000 -61.05 -46.67
Combination Full fixed salary 10.69* 2.900 .003 3.50 17.88
Full variable salary -43.17* 2.900 .000 -50.36 -35.98
Full variable salary Full fixed salary 53.86* 2.900 .000 46.67 61.05
Combination 43.17* 2.900 .000 35.98 50.36
Bonferroni Full fixed salary Combination -10.69* 2.900 .003 -18.10 -3.29
Full variable salary -53.86* 2.900 .000 -61.26 -46.46
Combination Full fixed salary 10.69* 2.900 .003 3.29 18.10
Full variable salary -43.17* 2.900 .000 -50.57 -35.76
Full variable salary Full fixed salary 53.86* 2.900 .000 46.46 61.26
Combination 43.17* 2.900 .000 35.76 50.57
Based on observed means.

The error term is Mean Square(Error) = 42.046.

*. The mean difference is significant at the .05 level.

Bagaimana dengan pengasuh sistem penggajian terhadap penjualan? Pertama-tama kita perhatikan Output 7. Uji F tentang Tests of Between-Subjects Effects adalah untuk menguji Ho: Rata-rata penjualan ketiga sistem penggajian adalah sama. Dengan nilai F=193.385 dan nilai sig.=0.000 cukup bukti untuk menolak Ho. Dengan demikian, ketiga sistem penggajian menghasilkan rata-rata penjualan yang berbeda.

Pertanyaannya, bagaimana perbandingan rata-rata penjualan antar sistem penggajian? Output 8 menunjukkan penjualan rata-rata sistem kombinasi lebih tinggi 10.69 dibanding sistem penggajian tetap. Rata-rata penjualan sistem penggajian variabel penuh lebih tinggi 43.17 dibanding sistem penggajian kombinasi. Berdasarkan Uji Tukey dan Bonferroni kita dapat disimpulkan bahwa perbedaan rata-rata sistem penggajian tersebut adalah signifikan.