Regresi Linier Berganda

Regresi berganda merupakan alat statistik yang dapat digunakan untuk membangun model untuk memrediksi suatu keluaran (outcome) (Higgins, 2005). Menurut Simon (2003), regresi untuk tujuan prediksi adalah yang paling bermanfaat, namun regresi untuk tujuan ini sedikit.  Kebanyakan regresi digunakan untuk memeriksa apakah terdapat hubungan signifikan antara Y dengan satu atau lebih prediktor.

REGRESI linier berganda digunakan apabila variabel independen terdiri dari dua atau lebih.  Menurut Simon (2003), persamaan regresi linier untuk k variabel adalah:

                       Yi = β0 + β1 (X1)i + β2 (X2)i + β3 (X3)i + … + βK (XK)i + ε  … (3.1)

Label ‘i’ menyatakan tentang apa regresi dimaksud, βK=koefisien ke-k, ε adalah gangguan atau error yang bersifat acak dan tidak teramati atau bukan hasil pengamatan. Umumnya label ‘i’ tidak disertakan, sehingga model umum regresi linier berganda paling sering ditemukan adalah:

            Y = β0 + β1 (X1) + β2 (X2) + β3 (X3)i + … + βK (XK) + ε   …  (3.2)

XK adalah variabel independen ke-k, βK=koefisien ke-k, ε adalah gangguan atau error yang bersifat acak dan tidak teramati atau bukan hasil pengamatan. Dalam pelaksanaannya, komponen ‘ε’ tidak disertakan pada persamaan. Persamaan demikian disebut fitted model, yaitu:

 Ŷ= β0 + β1 (X1) + β2 (X2) + β3 (X3)i + … + βK (XK) ... (3.3)

Apabila fitted model dipakai untuk memrediksi nilai Y pada kasus ke-i, maka penulisan modelnya adalah:

            Ŷi = β0 + β1 (X1)i + β2 (X2)i + β3 (X3)i + … + βK (XK)i  … (3.4)

Penulisan persamaan regresi di atas sebenarnya tidak baku. Ada cara  lain penulisan notasi persamaan selain notasi yang kita gunakan, seperti ditampilkan pada Tabel 3.1.

Kesuksesan regresi dinilai berdasarkan tujuan regresi dilakukan. Apabila dimaksudkan untuk memprediksi Ŷi, maka keberhasilan regresi tergantung pada seberapa seberapa dekat nilai prediksi Y (yaitu Ŷ1, Ŷ2, Ŷ3 … Ŷn) dengan nilai observasi Y (Y1, Y2, Y3 … Yn) atau seberapa kecil error kuadrat.  Namun, menurut Simon (2003),  prediksi bukan satu-satunya tujuan regresi linier berganda. Menurutnya, pertanyaan lain adalah apakah persamaan regresi dapat dipercaya? Untuk itu, regresi linier berganda perlu memenuhi berbagai asumsi atau persyaratan.