Regresi linier sederhana adalah sebuah model statistik yang digunakan untuk menjelaskan hubungan dua variabel dalam bentuk fungsional. Dua variabel tersebut adalah variabel dependen (\(y\)) atau disebut juga dengan variabel respon dan variabel independen (\(x\)) atau disebut juga dengan variabel prediktor atau variabel penjelas. Skala data yang digunakan dalam regresi linier sederhana adalah interval atau rasio.
Model Regresi Linier Sederhana
Jika terdapat pasangan data \((x_1,y_1),\) \((x_2,y_2),\) \(...,\) \((x_n,y_n),\) maka hubungan fungsional pasangan data tersebut dijelaskan dalam model regresi linier sederhana sebagai berikut. \[y = \beta_0 + \beta_1x + \varepsilon\] dimana parameter \(\beta_0\) (intercept) dan \(\beta_1\) (slope) adalah parameter-parameter yang tidak diketahui, sedangkan \(\varepsilon\) adalah error random yang mengikuti distribusi normal dengan \(\text{E}(\varepsilon)=0\) dan \(\text{Var}(\varepsilon)=\sigma^2.\)
Parameter \(\beta_0\) dan \(\beta_1\) dapat diestimasi dengan \(b_0\) dan \(b_1,\) sehingga estimasi garis regresi menjadi \[\hat{y}_i=b_0+b_1x_i\] dimana \(b_0\) dan \(b_1,\) dapat dihitung dari data sampel dengan rumus berikut: \[\begin{aligned} b_1 &= \frac {\displaystyle n\sum_{i=1}^n x_iy_i - \left(\sum_{i=1}^n x_i\right)\left(\sum_{i=1}^n y_i\right)} {\displaystyle n\sum_{i=1}^n x_i^2 - \left(\sum_{i=1}^n x_i\right)^2}\\ b_0 &= \bar{y} - b_1\bar{x} \end{aligned}\] |
Koefisien Determinasi
Koefisien determinasi adalah nilai yang menunjukkan seberapa besar variabel independen \((x)\) mampu menjelaskan variabel dependen \((y)\) dalam model regresi yang terbentuk. Koefisien determinasi \((R^2)\) dirumuskan oleh \[R^2=\frac{SSR}{SST},\] dimana
Nilai koefisien determinan selalu bernilai positif dan berkisar antara 0 sampai dengan 1. Semakin besar nilai koefisien determinasi maka semakin besar kemampuan variabel independen \((x)\) dalam menjelaskan variabel dependen \((y)\) pada model regresi yang terbentuk.
Contoh Soal Regresi Linier Sederhana
Seorang manager ingin mengetahui hubungan antara lamanya tenaga penjualan melakukan penjualan dalam satuan jam \((x)\) dengan banyaknya produk yang berhasil terjual \((y)\). Dari sampel sebanyak 5 orang tenaga penjualan, diperoleh data lamanya dan banyaknya penjualan sebagai berikut.
\(x\) |
\(y\) |
---|---|
1 |
2 |
5 |
4 |
4 |
6 |
2 |
4 |
3 |
2 |
Buatlah model regresi hubungan lamanya melakukan penjualan dan banyaknya penjualan produk tersebut dan hitung koefisien determinasinya!
Jawab:
Untuk menyelesaikan soal tersebut buatlah tabel yang kolomnya adalah \(x_i,\) \(y_i,\) \(x_i^2\) dan \(x_iy_i\) terlebih dahulu.
\(x_i\) | \(y_i\) | \(x_i^2\) | \(x_iy_i\) |
---|---|---|---|
1 |
2 |
1 |
2 |
5 |
4 |
25 |
20 |
4 |
6 |
16 |
24 |
2 |
4 |
4 |
8 |
3 |
2 |
9 |
6 |
15 |
18 |
55 |
60 |
Dari tabel tersebut dapat diperoleh
Selanjutnya dari nilai-nilai di atas, hitunglah \(b_0.\)
Dengan demikian model yang terbentuk adalah
Untuk menghitung koefisien determinasi \((R^2),\) buatlah tabel yang kolom adalah \(y_i,\) \(\hat{y}_i,\) \(\hat{y}_i - \bar{y}\) dan \(y_i - \bar{y}.\)
\(y_i\) |
\(\hat{y}_i\) |
\((\hat{y_i}-\bar{y})^2\) |
\((y_i-\bar{y})^2\) |
---|---|---|---|
2 |
3 |
1,44 |
2,56 |
4 |
4,2 |
1,44 |
0,16 |
6 |
5,4 |
0,36 |
5,76 |
4 |
3 |
0,36 |
0,16 |
2 |
4,2 |
0,00 |
2,56 |
18 |
18 |
3,6 |
11,2 |
Regresi Linier Sederhana dengan R
Langkah pertama, input data \(x\) dan \(y\) terlebih dahulu.
x <- c(1, 5, 4, 2, 3)
y <- c(2, 4, 6, 4, 2)
Hitung regresi linier sederhana menggunakan lm.
rls <- lm(y ~ x)
Tampilkan hasil regresi dengan perintah summary.
summary(rls)