Anova

Analysis of Variance (ANOVA)

Bilson Simamora

First Published: December 19, 2017, Last Updated: May 14, 2018

Dalam bentuk yang paling sederhana, ANOVA memiliki satu variabel dependen dan satu variabel independen. Apabila keadaannya begitu, maka kita melakukan one-way Anova. Ada pula kemungkinan dua atau lebih variabel independen. Untuk keadaan demikian kita menggunakan multi-way ANOVA.

Variabel independen kita bagi ke dalam tiga atau kategori, yang disebut juga level. Untuk dua kategori lebih baik menggunakan uji-t.

Kelas atau kategori ini dapat terjadi karena kita memanipulasi variabel independen. Misalnya, kita menyetel tiga jenis musik di toko modern, yaitu dangdut, rock, dan pop. Lalu kita melihat apakah rata-rata waktu yang dihabiskan pengunjung di dalam toko berbeda ataukah sama.

ANOVA dimaksudkan untuk menguji perbedaan rata-rata (mean) antar kelas atau kategori.  Namun, kita juga bisa menggunakan uji ini untuk melihat ‘pengaruh’ sebuah variabel independen terhadap variabel dependen. Pada cerita di atas, masalah penelitian kita dapat dinyatakan sebagai: “Pengaruh jenis musik terhadap waktu kunjungan di toko modern”.

Apabila variabel independen dimanipulasi, maka pengaruhnya terhadap variabel dependen adalah pengaruh kausal.  Desain eksperimen terkait dapat berupa between-subject dan whithin subject.  Dalam desain between subject, setiap level variabel independen dikenai pada subjek yang berbeda. Misalnya, ketiga jenis musik tadi diperdengarkan kepada tiga kelompok pengunjung yang berbeda, di mana masing-masing kelompok pengunjung diperdengarkan jenis musik yang berbeda. Dalam desain ini, respon subjek ke-n (yn) dinyatakan dalam rumus linier:

yn = τk + µ + en

di mana τk adalah efek perlakuan ke-k, µ adalah rata-rata semua subjek (grand mean), sering juga disebut intercept atau konstanta, en adalah residual error.

Dalam desain whithin subject, setiap subjek dikenai semua perlakuan. Dalam cerita tadi, sekumpulan pengunjung toko modern, pertama-tama dikenai dulu lagu dangdut, lalu diukur lama berkunjung. Kemudian diputar lagu rock, lama berkunjung diukur lagi. Hal yang sama dilakukan pada lagu pop.  Respon subjek dapat dimodelkan dengan persamaan linier berikut:

ynk = τk + πn + enk

di mana τk adalah efek perlakuan (disebut juga efek whithin subject), πn adalah efek subjek dan enk adalah eror residual.

Apakah ANOVA hanya dapat menguji efek perlakuan saja? Sebenarnya tidak. Walaupun merupakan teknik analisis yang banyak digunakan dalam pada eksperimen, ANOVA juga dapat digunakan untuk menguji perbedaan rata sebuah variabel dependen pada tiga atau lebih kategori variabel independen. Misalnya, adakah perbedaan penjualan es krim pada hari berawan, terik dan hujan? Tentu keadaan cuaca bukanlah sebuah perlakuan, tetapi keadaan yang mengintervensi suatu kejadian. Dalam kasus ini cuaca bukanlah ‘perlakuan’, akan tetapi variabel yang mengintervensi keadaan suatu variabel. Oleh karena itu, pengaruhnya dapat dinamakan pengaruh intervensi dan variabelnya kita namakan intervening variable.

Sebelum melakukan ANOVA, pastikan bahwa variabel dependen berdistribusi normal. Selain itu, varian (variance)/varian eror (error variance) sama dalam semua grup.

ANOVA Satu Arah

Dalam ANOVA satu arah terdapat satu variabel dependen metric dengan satu atau variabel independen kategorikal yang memiliki tiga atau lebih kategori. Adakah perbedaan perceived quality (PQ) terhadap Mitsubishi Pajero oleh pembeli Pajero, Fortuner dan bukan pembeli kedua merek itu? Menurut Hawkins, Best dan Coney (2012), salah cara konsumen untuk meyakinkan diri bahwa pilihannya tepat adalah meningkatkan rasa suka pada merek yang dibelinya dan menurunkan rasa suka pada merek saingan.  Sebuah penelitian meneliti perception of quality (PQ) Mitsubishi Pajero. Adapun respondennya ada tiga kelompok, yaitu pembeli Pajero (Grup 3), pembeli Suzuki Estillo (Grup 2) dan pemilik Toyota Fortuner, mobil saingan Pajero (Grup 1).

 

Hasil penelitian adalah seperti pada tabel berikut.  Bila ingin memperoleh datanya untuk kebutuhan latihan anda dapat memperolehnya di sini. File-nya dalam format word.

 

 

File SPSS-nya anda bisa buka link ini. Bagaimana memasukkan data Tabel 1 ke SPSS anda bisa ikuti video tutorialnya di sini (lagi dibuat).  Ini Tampilan data pada layar SPSS:

Pertama-tama buka file tersebut. Untuk menguji apakah data PQ berdistribusi normal, lakukan prosedur berikut: Analyze -> descriptive analysis -> explore. Lalu, pada kotak dialog yang muncul masukkan PQ pada dependent list dan Buyer_Group ke Factor List. Kemudian klik plot, lalu tandai  ‘normality plots with test’.

Uji uji normalitas, hipothesis nol adalah data setiap grup berdistribusi normal.  Berdasarkan uji Kolmogorov-Smirnov  dan Shapiro-Wilk  kita bisa menyatakan bahwa pada ketiga grup tidak cukup bukti menolak Ho karena nilai sig. >0.05. Dengan demikian dapat disimpulkan bahwa data berdistribusi normal.  Ini syarakat pertama yang harus dipenuhi.

Pada Output 2 terlihat bahwa rata-rata ketiga grup berbeda (30.90 vs 35.39 vs 39.65).  Namun, apakah perbedaan tersebut signifikan?

Sebelum menjawab pertanyaan ini kita lihat dulu hasil tes homogeneity. Prosedur ANOVA adalah: Analyze>Compare means>One-Way ANOVA’. Pada kotak dialog yang muncul, masukkan Quality ke ruang Dependent List dan Buyer_Group ke ruang Factor. Kemudian, dari menu Options, pilih ‘descriptive’ dan ‘Homogeneity of variance test’.

Untuk mengetahui perbedaan antar grup, pada menu Post Hoc klik Tukey, lalu klik Continue. Catatan: Uji Tukey merupakan uji post-hock paling banyak dipakai dalam ANOVA.

Untuk uji homogenitas varian kita menggunakan uji Lavene. Hipothesis nol yang diuji adalah varian ketiga grup sama.  Ini merupakan syarat kedua ANOVA bahwa variance semua grup sama.

Pada Output 3 terlihat bahwa nilai Lavene 2.348 dengan nilai sig.=0.101.  Artinya pada α=0.05 tidak terdapat cukup bukti untuk menolak Ho. Dengan demikian dapat disimpulkan bahwa varian eror ketiga grup sama.

Setelah memperoleh hasil tersebut kita dapat melakukan uji ANOVA.

Hipothesis yang diuji adalah:

H0:  µ1=µ2=µ3

Ha: Tidak semua rata-rata  Perception of Quality paling tidak pada dua populasi tidak sama.

Hasilnya adalah sebagai berikut. Pada Output 3, kita bisa melihat nilai F=92.958 dengan nilai Sig.=0.000.  Artinya, cukup bukti untuk menolak Ho dengan tingkat kesalahan atau α=0.000.  Jadi, terdapat perbedaan PQ paling tidak di antara dua grup.

Pertanyaannya, PQ antar grup mana saja yang berbeda? Uji Tukey menjawab pertanyaan ini. Hasilnya disajikan pada Output 5.  Pada hasil tersebut terlihat bahwa perbedaan rata-rata antara grup 1 vs grup 2, grup 1 versus grup 3 serta grup 2 versus grup 3 adalah signifikan pada α=0.000.

 

Multiple ANOVA

Dalam ANOVA terdapat satu variabel dependen numerik dengan beberapa variabel independen kategorikal. Misalnya: Apakah penjualan dipengaruhi oleh variabel-variabel motivasi, gender dan status berkeluarga? Untuk menjawab pertanyaan ini, kita pakai data pada file Multiple_ANOVA.sav.

Pertama-tama kita periksa dulu apakah variabel dependen berdistribusi normal. Dengan prosedur yang sama dengan sebelumnya, kita peroleh hasil seperti pada Output 1.  Kesimpulannya, dengan Kolmogorov-Smirnov (nilai sig.=0.200) dan Shapiro-Wilk (nilai sig.=0.623), tidak cukup bukti menolak Ho, dengan demikian kita dapat menyatakan bahwa data penjualan berdistribusi normal.

Output 1. Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Penjualan .115 25 .200* .969 25 .623
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Untuk mengolahnya, pada SPSS, kita mengikuti prosedur:  Analyze > General Linear Modelling > Univariate.  Kemudian, pada kotak dialog yang muncul, masukkan ‘penjualan’ ke sel Dependen Variable. Ketiga variabel independen dimasukkan pada sel Fixed Factor(s).

Nilai Levene Test dikonversi menjadi nilai-F=1.945 dengan nilai Sig.=0.122. Dengan demikian, pada α=0.05 kita dapat menerima Ho yang menyatakan bahwa error variance variabel dependen pada semua grup adalah sama. Artinya, data berasal dari populasi yang sama, sehingga dari sisi ukuran, data memenuhi syarat ANOVA.

 

Output 2. Levene’s Test of Equality of Error Variancesa
Dependent Variable: Penjualan
F df1 df2 Sig.
1.945 9 15 .122
Tests the null hypothesis that the error variance of the dependent variable is equal across groups.
a. Design: Intercept + Motivasi + Status + Gender + Motivasi * Status + Motivasi * Gender + Status * Gender + Motivasi * Status * Gender

Perbedaan rata-rata penjualan yang di-adjust berdasarkan ketiga variabel independen beserta interaksi di antara ketiganya disajikan pada Output 1.  Pada tabel tersebut terlihat bahwa hanya berdasarkan variabel motivasi terdapat perbedaan penjualan (F=7.615, sig.=0.005). Kedua variabel independen lain serta interaksi di antara ketiga variabel independen tidak menyebabkan perbedaan penjualan signifikan.

 

 Output 2. Tests of Between-Subjects Effects
Dependent Variable: Penjualan
Source Type III Sum of Squares df Mean Square F Sig.
Corrected Model 5698038.010a 9 633115.334 3.726 .012
Intercept 122673605.025 1 122673605.025 722.041 .000
Motivasi 2587602.394 2 1293801.197 7.615 .005
Status 284572.819 1 284572.819 1.675 .215
Gender 174912.731 1 174912.731 1.030 .326
Motivasi * Status 253483.457 1 253483.457 1.492 .241
Motivasi * Gender 27473.065 2 13736.533 .081 .923
Status * Gender 409017.500 1 409017.500 2.407 .142
Motivasi * Status * Gender 128949.415 1 128949.415 .759 .397
Error 2548475.750 15 169898.383
Total 246695701.000 25
Corrected Total 8246513.760 24
a. R Squared = .691 (Adjusted R Squared = .506)