Metode Penghitungan Indeks Komposit IPM

Metode penghitungan Indeks Pembangunan Manusia (IPM) mengalami perubahan mulai tahun 2010, baik perubahan dari dimensi/indikator yang digunakan, maupun perubahan pada metode penghitungan agregasi indeks komposit. Khusus pada artikel ini, akan dibahas mengenai metode agregasi indeks komposit IPM.

Sebelum tahun 2010, metode agregasi indeks komposit IPM menggunakan rata-rata hitung (aritmatik), sedangkan setelah itu metode agregasi yang digunakan adalah rata-rata ukur (geometrik). Rumus agregasi indeks menggunakan rata-rata ukur adalah \[ \text{IPM}=\sqrt[3]{I_{kesehatan}\times I_{pendidikan}\times I_{pengeluaran}}\times100 \] Perubahan metode penghitungan dari rata-rata hitung menjadi rata-rata ukur adalah karena rata-rata hitung tidak respon terhadap adanya ketimpangan capaian pembangunan. Jika terdapat satu indikator yang rendah, maka indikator tersebut tertutupi oleh indikator yang lain yang memiliki nilai yang tinggi.

Sebaliknya rata-rata ukur lebih responsif dengan adanya ketimpangan capaian pembangunan, dimana jika terdapat satu indikator yang rendah, maka indikator tersebut tidak akan tertutupi oleh indikator yang lain yang memiliki nilai yang tinggi. Adanya ketimpangan akan menyebabkan nilai IPM-nya menjadi lebih rendah.

Coba perhatikan penghitungan rata-rata hitung dan rata-rata ukur melalui simulasi berikut ini.

Tabel Simulasi Penghitungan Rata-rata Hitung dan Rata-rata Ukur
Pendidikan Kesehatan Pengeluaran Rata-rata Aritmatik Rata-rata Geometrik
3 3 3 3,00 3,00
2 3 4 3,00 2,88
1 3 5 3,00 2,47

Dari hasil penghitungan tersebut terlihat kelemahan dari rata-rata aritmatik, dimana rata-rata aritmatik tidak mampu melihat adanya ketimpangan capain dimensi pembangunan manusia. Ada atau tidak adanya ketimpangan, nilai IPM tetap sama. Sebaliknya rata-rata geometrik lebih peka terhadap adanya ketimpangan capaian dimensi pembangunan manusia. Semakin timpang capaian pembangunan maka semakin rendah rata-rata IPM-nya.

Referensi: Indeks Pembangunan Manusia 2014 Metode Baru, Badan Pusat Statistik, 2015

Regresi Nonparametrik Kernel

Estimator kernel adalah pengembangan dari estimator histogram. Estimator ini merupakan estimator linier yang mirip dengan estimator regresi nonparametrik yang lain, perbedaannya hanya karena estimator kernel lebih khusus dalam penggunaan metode bandwidth (Eubank, 1999).

Apa itu Regresi Nonparametrik dan apa Regresi Nonparametrik lain selain Regresi Nonparametrik Kernel? Simak ulasannya di artikel:
1. Analisis Regresi: Parametrik, Nonparametrik dan Semiparametrik
2. Regresi Nonparametrik Spline Truncated

Kelebihan dari estimator kernel adalah memiliki kemampuan yang baik dalam memodelkan data yang tidak mempunyai pola tertentu (Hardle, 1994). Selain itu, estimator kernel lebih fleksibel, bentuk matematisnya mudah, dan dapat mencapai tingkat kekonvergenan yang relatif cepat (Budiantara & Mulianah, 2007). Dari segi komputasinya, metode kernel lebih mudah dilakukan dan mudah diimplementasikan (Klemela, 2014).

Diberikan pasangan pengamatan independen \(\left(x_i,y_i\right),\) \(i=1,2,\ldots,n,\) dimana \(y_i\) adalah variabel respon, sedangkan \(x_i\) adalah variabel prediktor. Hubungan \(y_i\) dan \(x_i\) dapat dimodelkan secara fungsional dalam bentuk \[ y_i=f\left(x_i\right)+\varepsilon_i\ , \] dimana kurva regresi \(f\left(x_i\right)\) merupakan kurva yang tidak diketahui bentuknya. Menurut Hardle (1994), kurva \(f\left(x_i\right)\) pada model nonparametrik tersebut dapat diestimasi dengan pendekatan kernel yang didasarkan pada fungsi densitas kernel.

Kurva \(f\left(x_i\right)\) dapat diestimasi menggunakan estimator kernel Nadaraya-Watson. Estimator kernel Nadaraya-Watson merupakan kasus khusus dari kurva regresi polinomial lokal yaitu kurva regresi polinomial lokal yang memiliki orde sama dengan 0 atau disebut juga dengan kurva regresi konstan lokal. Ketika kurva regresi polinomial lokal memiliki orde sama dengan 1, maka kurva regresi polinomial lokal disebut dengan kurva regresi linier lokal.

Kurva regresi polinomial lokal mengadopsi dari perluasan deret Taylor di sekitar \(x\). Kurva \(f\left(x_i\right)\) dapat dihampiri dengan kurva regresi polinomial lokal \[ \begin{align*} f\left(x_i\right)&=\beta_0+\beta_1\left(x_i-x\right)+\beta_2\left(x_i-x\right)^2+\ldots+\beta_p\left(x_i-x\right)^p\\ &=\sum_{k=0}^{p}{\beta_k\left(x_i-x\right)^k}, \end{align*} \] dimana \[ \beta_k=\frac{f^k\left(x\right)}{k!}\ ,\ \ k=0,\ 1,\ 2,\ldots,p. \] Dalam bentuk matriks dapat ditulis \[ \vec{y}=\mathbf{X}\vec{\beta}+\vec{\varepsilon}, \] dimana \[ \mathbf{X}=\left[\begin{matrix}1&\left(x_1-x\right)&\left(x_1-x\right)^2&\cdots&\left(x_1-x\right)^p\\1&\left(x_2-x\right)&\left(x_2-x\right)^2&\ldots&\left(x_2-x\right)^p\\\vdots&\vdots&\vdots&\ddots&\vdots\\1&\left(x_n-x\right)&\left(x_n-x\right)^2&\ldots&\left(x_n-x\right)^p\\\end{matrix}\right], \] \[ \vec{\beta}=\left[\begin{matrix}\beta_0\\\beta_1\\\beta_2\\\vdots\\\beta_p\\\end{matrix}\right]. \] Parameter \(\vec{\beta}\) bergantung pada titik \(x\) yang disebut sebagai titik lokal. Parameter \(\vec{\beta}\) dapat diestimasi menggunakan weighted least square (WLS) dengan meminimumkan fungsi \[ L=\sum_{i=1}^{n}{\left(y_i-\sum_{k=0}^{p}{\beta_k\left(x_i-x\right)^k}\right)^2K\left(\frac{x_i-x}{h}\right)}\, \] dimana \(h\) merupakan bandwidth yang mengontrol ukuran persekitaran titik lokal \(x_0.\) Permasalahan weighted least square dalam bentuk matriks dapat ditulis menjadi \[ L=\left(\vec{y}-\mathbf{X}\vec{\beta}\right)^\text{T}\mathbf{W}\left(\vec{y}-\mathbf{X}\vec{\beta}\right), \] dimana \(\mathbf{W}\) merupakan matriks diagonal yang berukuran \(n\times n,\) \[ \mathbf{W}=\text{diag}\left\{K\left(\frac{x_i-x}{h}\right)\right\}. \] Hasil estimasi dari parameter \(\vec{\beta}\) adalah \[ \widehat{\vec{\beta}}=\left(\mathbf{X}^\text{T}\mathbf{WX}\right)^{-1}\mathbf{X}^\text{T}\mathbf{W}\vec{y}, \] sehingga estimasi model regresi polinomial lokal adalah \[ \begin{align*} \widehat{\vec{y}}&={\mathbf{X}\left(\mathbf{X}^T\mathbf{WX}\right)}^{-1}\mathbf{X}^T\mathbf{W}\vec{y}\\ &=\mathbf{H}\vec{y}, \end{align*} \] dimana \[ \mathbf{H}={\mathbf{X}\left(\mathbf{X}^T\mathbf{WX}\right)}^{-1}\mathbf{X}^T\mathbf{W}. \] Terkait dengan model regresi polinomial lokal, model regresi kernel Nadaraya-Watson merupakan model regresi polinomial lokal yang hanya memuat konstan lokal. Jadi jika \(f\left(x_i\right)\) hanya memuat konstan lokal, maka dengan meminimumkan fungsi \[ L=\sum_{i=1}^{n}{\left(y_i-\beta_0\right)^2K\left(\frac{x_i-x}{h}\right)}, \] akan dihasilkan \[ \beta_0=\sum_{i=1}^{n}{\frac{K\left(\frac{x_i-x}{h}\right)}{\sum_{i=1}^{n}K\left(\frac{x_i-x}{h}\right)}y_i}, \] sehingga \[ \begin{align*} {\hat{f}}_h\left(x_i\right)&=n^{-1}\sum_{i=1}^{n}{\frac{K_h\left(x_i-x\right)}{n^{-1}\sum_{i=1}^{n}{K_h\left(x_i-x\right)}}y_i}\\ &=n^{-1}\sum_{i=1}^{n}{W_{hi}\left(x\right)y_i} \end{align*} \] Fungsi \(W_{h_ji}\left(x_j\right)\) merupakan fungsi pembobot \[ W_{h i}\left(x\right)=\frac{K_h\left(x_i-x\right)}{n^{-1}\sum_{i=1}^{n}{K_h\left(x_i-x\right)}} \] dimana \(K_{h_j}\left(x_j-x_{ji}\right)\) adalah fungsi kernel \[ K_h\left(x_i-x\right)=\frac{1}{h}K\left(\frac{x_i-x}{h}\right). \] Fungsi kernel \(K\) adalah fungsi yang bernilai riil, kontinu, terbatas dan simetris dengan integralnya sama dengan satu atau \(\int K\left(z\right)dz=1.\) Fungsi kernel \(K\) dapat berupa kernel uniform, kernel segitiga, kernel epanechnikov, kernel kuadrat, kernel triweight, kernel kosinus atau kernel Gaussian (Hardle, Muller, Sperlich, & Werwatz, 2004). Kernel Gaussian cukup sering digunakan dalam banyak penelitian. Fungsi kernel Gaussian lebih smooth dibandingkan dengan fungsi kernel yang lain. Bentuk fungsi kernel Gaussian adalah \[ K\left(z\right)=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{1}{2}z^2\right), \] dimana \(-\infty<z<\infty.\)

Jika bentuk penjumlahan pada persamaan regresi kernel dijabarkan dengan lebih lengkap, maka \[ {\hat{f}}_h\left(x_i\right)=n^{-1}W_{h1}\left(x\right)y_1+n^{-1}W_{h2}\left(x\right)y_2+\ldots+n^{-1}W_{h n}\left(x\right)y_n \] Karena berlaku untuk setiap \(x=x_1\) sampai dengan \(x=x_n,\) maka jika persamaan untuk \(x_1\) sampai \(x_n\) digabungkan ke dalam bentuk matriks akan menjadi \[ \left[\begin{matrix}{\hat{f}}_h\left(x_1\right)\\{\hat{f}}_h\left(x_2\right)\\\vdots\\{\hat{f}}_h\left(x_n\right)\\\end{matrix}\right]=\left[\begin{matrix}n^{-1}W_{h1}\left(x_1\right)&n^{-1}W_{h2}\left(x_1\right)&\cdots&n^{-1}W_{h n}\left(x_1\right)\\n^{-1}W_{h1}\left(x_2\right)&n^{-1}W_{h2}\left(x_2\right)&\ldots&n^{-1}W_{h n}\left(x_2\right)\\\vdots&\vdots&\ddots&\vdots\\n^{-1}W_{h1}\left(x_n\right)&n^{-1}W_{h2}\left(x_n\right)&\ldots&n^{-1}W_{h n}\left(x_n\right)\\\end{matrix}\right]\left[\begin{matrix}y_1\\y_2\\\vdots\\y_n\\\end{matrix}\right]. \] Jika dinotasikan ke dalam bentuk matriks akan menjadi \[ {\widehat{\vec{f}}}_h\left(x\right)=\mathbf{X}\left(h\right)\vec{y}, \] dimana \[ {\widehat{\vec{f}}}_h\left(x\right)=\left[\begin{matrix}{\hat{f}}_h\left(x_1\right)\\{\hat{f}}_h\left(x_2\right)\\\vdots\\{\hat{f}}_h\left(x_n\right)\\\end{matrix}\right]\ , \mathbf{X}\left(h\right)=\left[\begin{matrix}n^{-1}W_{h1}\left(x_1\right)&n^{-1}W_{h2}\left(x_1\right)&\cdots&n^{-1}W_{h n}\left(x_1\right)\\n^{-1}W_{h1}\left(x_2\right)&n^{-1}W_{h2}\left(x_2\right)&\ldots&n^{-1}W_{h n}\left(x_2\right)\\\vdots&\vdots&\ddots&\vdots\\n^{-1}W_{h1}\left(x_n\right)&n^{-1}W_{h2}\left(x_n\right)&\ldots&n^{-1}W_{h n}\left(x_n\right)\\\end{matrix}\right]. \] Vektor \({\widehat{\vec{f}}}_h\left(x\right)\) berukuran \(n\times1,\) sedangkan matriks \(\mathbf{X}\left(h\right)\) berukuran \(n\times n.\) Estimator kernel sangat sensitif pada pemilihan bandwidth \(h\) yang fungsinya mengontrol kemulusan kurva estimasi. Jika bandwidth \(h\) diperkecil maka bias akan turun, namun varian akan membesar, sebaliknya jika bandwidth \(h\) diperbesar maka varian yang akan turun, namun bias akan membesar. Oleh karena itu, perlu adanya keseimbangan antara bias dan varian melalui pemilihan bandwidth \(h\) yang optimum (tidak terlalu kecil dan tidak terlalu besar). Penggunaan bandwidth \(h\) yang optimum akan menghasilkan mean squared error (MSE) terkecil. Hubungan MSE, bias dan varian adalah \[ \begin{align*} \text{MSE}\left[{\hat{f}}_h\left(x_i\right)\right]&=E\left[{\hat{f}}_h\left(x_i\right)-f_h\left(x_i\right)\right]^2\\ &=E\left[{\hat{f}}_h\left(x_i\right)-E\left[{\hat{f}}_h\left(x_i\right)\right]\right]^2+\left(E\left[{\hat{f}}_h\left(x_i\right)\right]-h_h\left(x_i\right)\right)^2\\ &=\text{Var}\left[{\hat{f}}_h\left(x_i\right)\right]+\left(\text{Bias}\left[{\hat{f}}_h\left(x_i\right)\right]\right)^2. \end{align*} \] Salah satu metode yang digunakan untuk mendapatkan bandwidth optimum adalah metode GCV. \[ \text{GCV}\left(h\right)=\frac{\text{MSE}\left(h\right)}{\left(n^{-1}tr\left(\mathbf{I}-\mathbf{X}\left(h\right)\right)\right)^2}, \] dimana \[ \text{MSE}\left(h\right)=n^{-1}\sum_{i=1}^{n}\left(y_i-{\hat{f}}_h\left(x_i\right)\right)^2\ . \] Nilai bandwidth yang optimum berkaitan dengan nilai GCV yang minimum (Eubank, 1999).

Referensi:

Regresi Nonparametrik Spline Truncated

Regresi spline merupakan suatu regresi polinomial dimana segmen-segmen polinomial yang berbeda digabungkan bersama pada titik-titik knot \(\lambda_1,\lambda_2,\ldots,\lambda_q\) dan kontinu sehingga bersifat fleksibel dibandingkan polinomial biasa. Kurva regresi spline mempunyai titik knot yang maksudnya adalah titik perpaduan bersama dimana terjadi perubahan perilaku kurva.

Apa itu Regresi Nonparametrik?
Simak ulasannya di artikel: Analisis Regresi: Parametrik, Nonparametrik dan Semiparametrik

Kurva regresi spline dapat menyesuaikan diri secara efektif terhadap perubahan perilaku data, sehingga didapatkan hasil yang mendekati kebenaran (Eubank, 1999). Menurut Cox & O'Sullivan (1996), Kurva regresi spline memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Menurut Budiantara (2009), model regresi spline mempunyai interpretasi statistik dan interpretasi visual yang sangat khusus dan sangat baik.

Diberikan data berpasangan \(\left(x_i,y_i\right),\) \(i=1,2,\ldots,n,\) dimana \(y_i\) adalah variabel respon dan \(x_i\) adalah variabel prediktor. Pola hubungan \(y_i\) dan \(x_i\) dapat dinyatakan dalam model regresi \[ y_i=f\left(x_i\right)+\varepsilon_i\ . \] Selanjutnya jika kurva regresi \(f\left(x_i\right)\) dihampiri dengan kurva regresi spline truncated, maka \[ \begin {align*} f\left(x_i\right)&=\beta_0+\beta_1x_i+\ldots+\beta_px_i^p+\lambda_1\left(x_i-\lambda_1\right)_+^p+\ldots+\lambda_q\left(x_i-\lambda_q\right)_+^p\\ &=\sum_{k=0}^{p}{\beta_kx_i^k}+\sum_{l=1}^{q}{\lambda_l\left(x_i-\lambda_l\right)_+^p}, \end {align*} \] dimana \[ \left(x_i-\lambda_l\right)_+^p=\left\{\begin{matrix}\left(x_i-\lambda_l\right)^p\ \ \ \ ,\ x_i\geq\lambda_l\\\ \\\ 0\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ ,\ x_i<\lambda_l\ .\\\end{matrix}\right. \] Kurva regresi \(f\left(x_i\right)\) merupakan kurva regresi nonparametrik spline truncated derajat \(p\) dengan banyaknya titik knot \(q.\) Derajat \(p\) merupakan derajat pada persamaan polinomial. Biasanya digunakan \(p\) = 1, 2 atau 3, karena untuk derajat kurva regresi di atasnya (lebih dari 3) bisa didekati dengan bentuk kurva polinomial tersebut. Kurva regresi polinomial derajat 1 biasa disebut dengan kurva regresi linier, kurva regresi polinomial derajat 2 biasa disebut dengan kurva regresi kuadratik, sedangkan kurva regresi polinomial derajat 3 biasa disebut dengan kurva regresi kubik. Titik-titik knot \(\lambda_1,\lambda_2,\ldots,\lambda_q\) adalah titik-titik knot yang menunjukkan pola perilaku dari kurva pada sub-sub interval yang berbeda, dimana \(\lambda_1<\lambda_2<\ldots<\lambda_q.\) Jika pendekatan regresi spline truncated memiliki derajat \(p\) = 1, maka akan menjadi regresi spline linier truncated, dimana bentuk model regresinya akan menjadi \[ \begin {align*} f\left(x_i\right)&=\beta_0+\beta_1x_i+\lambda_1\left(x_i-\lambda_1\right)_++\ldots+\lambda_q\left(x_i-\lambda_q\right)_+\\ &=\beta_0+\beta_1x_i+\sum_{l=1}^{q}{\lambda_l\left(x_i-\lambda_l\right)_+}. \end {align*} \] Jika persamaan kurva regresi nonparametrik spline truncated untuk \(i=1\) sampai dengan \(i=n\) digabungkan ke dalam bentuk persamaan vektor dan matriks akan menjadi \[ \left[\begin{matrix}f\left(x_1\right)\\f\left(x_2\right)\\\vdots\\f\left(x_n\right)\\\end{matrix}\right]=\left[\begin{matrix}1&x_1&\cdots&x_1^p&\left(x_1-\lambda_1\right)_+^p&\cdots&\left(x_1-\lambda_q\right)_+^p\\1&x_2&\cdots&x_2^p&\left(x_2-\lambda_1\right)_+^p&\cdots&\left(x_2-\lambda_q\right)_+^p\\\vdots&\vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\1&x_n&\cdots&x_n^p&\left(x_n-\lambda_1\right)_+^p&\cdots&\left(x_n-\lambda_q\right)_+^p\\\end{matrix}\right]\left[\begin{matrix}\beta_0\\\beta_1\\\vdots\\\beta_p\\\lambda_1\\\lambda_2\\\vdots\\\lambda_q\\\end{matrix}\right]\ \] Dalam notasi matriks dapat ditulis menjadi \[ \vec{f}\left(x\right)=\mathbf{X\left(\vec{\lambda}\right)}\vec{\theta}\ , \] dimana \[ \vec{f}\left(x\right)=\left[\begin{matrix}f\left(x_1\right)\\f\left(x_2\right)\\\vdots\\f\left(x_n\right)\\\end{matrix}\right]\ ,\ \ \ \ \ \ \ \ \ \ \vec{\theta}=\left[\begin{matrix}\beta_0\\\beta_1\\\vdots\\\beta_p\\\lambda_1\\\lambda_2\\\vdots\\\lambda_q\\\end{matrix}\right]\ , \] \[ \mathbf{X\left(\vec{\lambda}\right)}=\left[\begin{matrix}1&x_1&\cdots&x_1^p&\left(x_1-\lambda_1\right)_+^p&\cdots&\left(x_1-\lambda_q\right)_+^p\\1&x_2&\cdots&x_2^p&\left(x_2-\lambda_1\right)_+^p&\cdots&\left(x_2-\lambda_q\right)_+^p\\\vdots&\vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\1&x_n&\cdots&x_n^p&\left(x_n-\lambda_1\right)_+^p&\cdots&\left(x_n-\lambda_q\right)_+^p\\\end{matrix}\right]. \] Vektor \(\vec{f}\left(x\right)\) berukuran \(n\times1,\) matriks \(\mathbf{X\left(\vec{\lambda}\right)}\) berukuran \(n\times\left(p+q+1\right),\) sedangkan vektor \(\vec{\theta}\) berukuran \(\left(p+q+1\right)\times1.\) Sebelum estimasi terhadap kurva regresi \(\vec{f}\left(x\right),\) terlebih dahulu dilakukan estimasi terhadap parameter \(\vec{\theta}.\) Estimasi parameter \(\vec{\theta}\) dilakukan dengan menggunakan metode MLE. Fungsi likelihood yang diberikan adalah \[ \begin{align*} L\left(\vec{\theta},\sigma^2\middle|\vec{\lambda}\right) &=\prod_{i=1}^{n}{\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{1}{2\sigma^2}\varepsilon_i^2\right)}\\ &=\left(2\pi\sigma^2\right)^{-\frac{n}{2}}\exp\left(-\frac{1}{2\sigma^2}\left\|\vec{\lambda}\right\|^2\right)\\ &=\left(2\pi\sigma^2\right)^{-\frac{n}{2}}\exp\left(-\frac{1}{2\sigma^2}\left\|\vec{y}-\mathbf{G(\vec{\lambda})}\vec{\theta}\right\|^2\right). \end{align*} \] Estimator MLE yang dihasilkan adalah \[ \widehat{\vec{\theta}}\left(\vec{\lambda}\right)=\left[\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\mathbf{X\left(\vec{\lambda}\right)}\right]^{-1}\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\vec{y}. \] Dengan demikian, estimasi dari kurva regresi \(\vec{f}\left(x\right)\) adalah \[ \begin{align*} {\widehat{\vec{f}}}_{\vec{\lambda}}\left(x\right)&={\mathbf{X\left(\vec{\lambda}\right)}\left[\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\mathbf{X\left(\vec{\lambda}\right)}\right]}^{-1}\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\vec{y}\\ &=\mathbf{S\left(\vec{\lambda}\right)}\vec{y}, \end{align*} \] dimana: \[ \mathbf{S\left(\vec{\lambda}\right)}={\mathbf{X\left(\vec{\lambda}\right)}\left[\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\mathbf{X\left(\vec{\lambda}\right)}\right]}^{-1}\left(\mathbf{X\left(\vec{\lambda}\right)}\right)^\text{T}\ . \] Vektor \({\widehat{\vec{f}}}_{\vec{\lambda}}\left(x\right)\) dan \(\widehat{\vec{\theta}}\left(\vec{\lambda}\right)\) memiliki ukuran yang sama dengan vektor parameternya. Sedangkan matriks \(\mathbf{S\left(\vec{\lambda}\right)}\) berukuran \(n\times\left(p+q+1\right).\)

Titik-titik knot merupakan pengontrol keseimbangan antara kemulusan kurva dan kesesuaian kurva terhadap data. Pemilihan banyaknya titik knot, lokasi titik-titik knot optimum dapat dilakukan salah satunya dengan metode Generalized Cross Validation atau GCV (Eubank, 1999). \[ \text{GCV}\left(\vec{\lambda}\right)=\frac{\text{MSE}\left(\vec{\lambda}\right)}{\left(n^{-1}tr\left(\mathbf{I}-\mathbf{S\left(\vec{\lambda}\right)}\right)\right)^2}, \] dimana \[ \text{MSE}\left(\vec{\lambda}\right)=n^{-1}\sum_{i=1}^{n}\left(y_i-\hat{g}\left(x_i\right)\right)^2. \] Pemilihan banyaknya titik knot dan lokasi titik-titik knot optimum dilakukan dengan melihat nilai GCV yang minimum.

Baca Regresi Nonparametrik yang lain: Regresi Nonparametrik Kernel

Referensi:

Analisis Regresi: Parametrik, Nonparametrik dan Semiparametrik

Analisis regresi digunakan untuk mengetahui pola hubungan antara variabel respon dan variabel prediktor. Jika variabel respon adalah \(y_i\) dan variabel prediktor adalah \(x_i\) dimana \(i=1,2,\cdots,n,\) maka pasangan data \(x_i\text{,}y_i\) akan memiliki model hubungan fungsional \[ y_i=f\left(x_i\right)+\varepsilon_i\ , \] dimana \(f\left(x_i\right)\) adalah kurva regresi dan \(\varepsilon_i\) adalah error random yang diasumsikan identik, independen dan berdistribusi normal dengan mean nol dan varian \(\sigma^2\) (Eubank, 1999). Analisis regresi memiliki dua tujuan utama. Pertama, memberikan cara mengeksplorasi hubungan antara variabel respon dan variabel prediktor dan yang kedua adalah membuat prediksi (Silverman, 1985).

Model regresi umumnya dibagi ke dalam tiga bentuk, yaitu model regresi parametrik, model regresi nonparametrik dan model regresi semiparametrik. Bentuk model regresi tersebut tergantung pada kurva \(f\left(x_i\right)\). Apabila bentuk kurva \(f\left(x_i\right)\) diketahui, maka pendekatan model regresi yang digunakan adalah pendekatan Model Regresi Parametrik (Islamiyati & Budiantara, 2007). Apabila bentuk kurva \(f\left(x_i\right)\) tidak diketahui atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola datanya, maka pendekatan model regresi yang digunakan adalah pendekatan Model Regresi Nonparametrik (Lestari & Budiantara, 2010). Dalam beberapa kasus, sebagian bentuk pola data diketahui, sedangkan untuk sebagian yang lain bentuk pola datanya tidak diketahui. Pada kasus ini, pendekatan model regresi yang disarankan adalah pendekatan Model Regresi Semiparametrik (Wahba, 1990).

Menurut Budiantara (2009), dalam regresi parametrik terdapat asumsi yang sangat kaku dan kuat yaitu bentuk kurva regresi diketahui, misalnya linear, kuadratik, kubik, polinomial derajat-p, eksponen, dan lain-lain. Untuk memodelkan data menggunakan regresi parametrik linear, kuadrat, kubik atau yang lain, umumnya dimulai dengan membuat diagram pencar. Pendekatan regresi parametrik memiliki sifat yang sangat baik dari pandangan statistika inferensi, seperti sederhana, mudah interpretasinya, parsimoni, estimatornya tidak bias, tergolong estimator linear, efisien, konsisten, BLUE (Best Linear Unbiased Estimator), yang sangat jarang dimiliki oleh pendekatan regresi lain seperti regresi nonparametrik dan regresi semiparametrik. Dalam pandangan regresi nonparametrik, data mencari sendiri bentuk estimasi dari kurva regresinya tanpa harus dipengaruhi oleh faktor subyektifitas si peneliti. Ini berarti pendekatan model regresi nonparametrik sangatlah fleksibel dan sangat obyektif. Pendekatan model regresi parametrik yang sering digunakan oleh para peneliti adalah pendekatan model regresi linier sederhana dan model regresi linier berganda, sedangkan pada model regresi nonparametrik, pendekatan model regresi yang sering digunakan adalah pendekatan regresi spline dan regresi kernel.

Baca lebih detail: Regresi Spline Truncated dan Regresi Kernel

Regresi nonparametrik umumnya tidak mensyaratkan uji asumsi klasik. Misalnya pada regresi nonparametrik ridge yang tidak menyaratkan terjadinya multikolinieritas. Pelanggaran asumsi multikolinieritas biasanya terjadi pada regresi parametrik linier berganda dimana di antara variabel prediktor terdapat hubungan linier, sehingga pada estimasi parameter \[ \widehat{\mathbf{\beta}}=\left(\mathbf{X}^\text{T}\mathbf{X}\right)^{-1}\mathbf{X}^\text{T}\mathbf{y}\ \] menyebabkan determinan \(\mathbf{X}^\text{T}\mathbf{X}\) sama dengan 0 (matriks singular) atau determinan \(\mathbf{X}^\text{T}\mathbf{X}\) mendakati 0 (hampir singular). Adanya multikolinieritas menyebabkan terdapat akar karakteristik yang kecil dalam matriks \(\mathbf{X}^\text{T}\mathbf{X},\) yang mengakibatkan varian \(\widehat{\beta}\) menjadi besar. Multikolinieritas yang tinggi mengakibatkan estimator \(\widehat{\beta}\) yang dihasilkan dari metode Ordinary Least Square (OLS) menjadi tidak stabil (peka terhadap perubahan kecil pada data yang kelihatannya tidak penting).

Pada regresi nonparametrik ridge, estimasi \(\beta\) dimodifikasi menjadi \[ \widehat{\mathbf{\beta}}_R=\left(\mathbf{X}^\text{T}\mathbf{X}+\lambda\mathbf{I}\right)^{-1}\mathbf{X}^\text{T}\mathbf{y}\ , \] dimana \(0\le\lambda\le\infty,\) \(\lambda\) adalah nilai konstan yang dipilih sebagai indeks dari kelas estimator. Adanya konstanta \(\lambda\) menyebabkan matriks \(\mathbf{X}^\text{T}\mathbf{X}+\lambda\mathbf{I}\) memiliki determinan tidak sama dengan 0 (bukan matriks singular) atau tidak mendekati 0. Oleh karena itu, regresi nonparametrik ridge tidak mensyaratkan uji asumsi multikolinieritas, namun demikian estimator ridge bersifat bias, yaitu sebesar \[ Bias=\lambda\left(\mathbf{X}^\text{T}\mathbf{X}+\lambda\mathbf{I}\right)^{-1}\mathbf{\beta} . \] Sifat bias pada estimator regresi ridge bertentangan dengan sifat estimator yang baik, namun estimator ridge dapat mengatasi adanya multikolinieritas. Sifat tidak bias merupakan sifat yang dibutuhkan namun tidak terlalu penting. Hal ini disebabkan karena sifat tak bias tidak menunjukkan apapun mengenai penyebaran dari distribusi estimator. Suatu estimator yang tidak bias namun mempunyai varian yang besar seringkali menghasilkan estimasi yang jauh berbeda dari nilai parameter yang sebenarnya.

Referensi:
  • Budiantara, I. N. (2009). Spline dalam Regresi Nonparametrik dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang. Surabaya: ITS Press.
  • Eubank, R. L. (1999). Nonparametric Regression and Spline Smoothing. New York: Marcel Dekker, Inc.
  • Islamiyati, A., & Budiantara, I. N. (2007). "Model Spline dengan Titik-titik Knots dalam Regresi Nonparametrik". Jurnal INFERENSI, Vol. 3, hal. 11-21.
  • Lestari, B., & Budiantara, I. N. (2010). "Spline Estimator of Triple Response Nonparametric Regression Model". Jurnal Ilmu Dasar, Vol. 11, hal. 17-22.
  • Silverman, B. W. (1985). "Some Aspects of The Spline Smoothing Approach to Non-parametric Regression Curve Fitting". Journal of the Royal Statistical Society. Series B (Methodological), Vol. 47, No. 1, hal. 1-52.
  • Wahba, G. (1990). Spline Models for Observational Data. Philadelphia: Society for Industrial and Applied Mathematics.

Pengelompokan Negara Asal Wisatawan Mancanegara

I. PENDAHULUAN

Pariwisata telah menjadi salah satu andalan utama dalam menghasilkan devisa di berbagai negara di dunia termasuk di Indonesia. Wisatawan mancanegara yang mengunjungi Indonesia selama tahun 2013 mencapai 8,8 juta orang atau tumbuh sebesar 9,42 persen dibandingkan tahun sebelumnya. Hal ini telah meningkatkan penerimaan negara dari wisatawan mancanegara sebesar USD 10.054 juta.

Masuknya wisatawan mancanegara yang membawa valuta asing ke Indonesia, akan memperkuat neraca pembayaran dan perdagangan. Penerimaan devisa negara dari pariwisata bersumber dari uang yang dikeluarkan atau dibelanjakan oleh wisatawan asing selama yang bersangkutan melakukan kunjungan ke Indonesia. Pengeluaran tersebut berupa pengeluaran untuk penginapan (akomodasi), makan dan minum, transportasi lokal dan tour, cenderamata, tip, dan lain-lain.

Wisatawa mancanegara yang datang ke Indonesia berasal dari berbagai negara di dunia. Wisatawan mancanegara yang paling banyak mengunjungi Indonesia pada tahun 2013 adalah warga negara Singapura, Malaysia, Australia, Republik Cina, Jepang, Republik Korea, Filipina, Taiwan, Amerika Serikat dan Inggris Raya.

Penelitian ini bertujuan untuk melihat karakteristik wisatawan mancanegara berdasarkan negara asalnya dengan terlebih dahulu melakukan pengelompokan wisatawan menurut kelompok negara asalnya agar analisisnya lebih sederhana. Dengan adanya pengelompokan tersebut diharapkan bisa membantu pemerintah dalam pengambilan kebijakan terkait wisatawan mancanegara sesuai dengan daerah asalnya.


II. TINJAUAN PUSTAKA

2.1. Wisatawan Mancanegara

Wisatawan mancanegara adalah setiap pengunjung yang mengunjungi suatu negara di luar tempat tinggalnya, didorong oleh satu atau beberapa keperluan tanpa bermaksud memperoleh penghasilan di tempat yang dikunjungi dan lamanya kunjungan tersebut tidak lebih dari 12 (dua belas) bulan.

2.2. Analisis Komponen Utama

Tinjauan analisis komponen utama dapat dilihat pada materi: Analisis Komponen Utama.

2.3. Analisis Faktor

Tinjauan analisis faktor dapat dilihat pada materi: Analisis Faktor.

2.4. Analisis Cluster

Tinjauan analisis cluster dapat dilihat pada materi: Analisis Cluster.


III. METODOLOGI

Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Badan Pusat Statistik (BPS). BPS memperoleh data jumlah kedatangan wisatawan mancanegara dari pengumpulan kartu Arrival and Departure (A/D Card) yang dilakukan oleh Direktorat Jenderal Imigrasi. Data penerimaan, pengeluaran dan rata-rata lama tinggal wisatawan mancanegara diperoleh dari hasil Passenger Exit Survey yang dilakukan oleh Kementerian Pariwisata dan Ekonomi Kreatif bekerja sama dengan BPS.

Data mengenai wisatawan mancanegara mencakup semua wisatawan mancanegara yang tiba di Indonesia melalui bandara, pelabuhan dan melalui darat. Ada 93 pintu kedatangan yang berada diseluruh wilayah Indonesia, 65 diantaranya adalah pelabuhan, 24 adalah bandara dan 4 melalui darat. Empat bandara utama adalah Soekarno-Hatta (Jakarta), Ngurah Rai (Bali), Polonia (Medan) dan Sekupang (Batam).

Variabel yang digunakan adalah sebagai berikut.
X1 Jumlah kedatangan wisatawan mancanegara ke Indonesia,
X2 Rata-rata lama tinggal wisatawan mancanegara (hari),
X3 Rata-rata pengeluaran wisatawan mancanegara per kunjungan (USD),
X4 Penerimaan dari wisatawan mancanegara (juta USD).

Langkah-langkah yang dilakukan dalam penelitian ini adalah sebagai berikut.
  1. Melakukan pengumpulan data sekunder yang diperlukan dalam penelitian ini.
  2. Melakukan analisis komponen utama dan analisis faktor terhadap variabel-variabel yang digunakan.
  3. Melakukan analisis cluster berdasarkan faktor skor yang terbentuk dari analisis faktor.
  4. Melakukan analisis deskriptif terhadap kelompok-kelompok yang telah terbentuk serta membandingkan data antar kelompok.
  5. Membuat kesimpulan dan saran.
Semua pengolahan data dalam penelitian ini menggunakan perangkat lunak Microsoft Excel dan SPSS.


IV. HASIL DAN PEMBAHASAN

4.1. Analisis Komponen Utama dan Faktor

Sebelum melakukan analisis komponen utama dan analisis cluster, terlebih dahulu dilakukan Uji Kaiser Meyer Olkin (KMO) dan Uji Bartlett. Hasil uji KMO dan bartlett adalah sebagai berikut.

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. 0,564
Bartlett's Test of Sphericity Approx. Chi-Square 113,512
df 6
Sig. 0,000

Nilai KMO adalah 0,564, sedangkan nilai Uji Bartlett adalah 113,512 dengan p-value sebesar 0,000. Karena angka KMO sudah di atas 0,5 dan signifikansi Uji Bartlett di bawah 0,05 maka variabel-variabel yang digunakan dapat dianalisis lebih lanjut menggunakan analisis komponen utama dan analisis faktor.

Berikut ini ditampilkan output total varian yang mampu dijelaskan oleh komponen utama yang terbentuk.

Total Variance Explained
Component Initial Eigenvalues Rotation Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 2,702 67,562 67,562 1,939 48,475 48,475
2 1,147 28,679 96,241 1,911 47,766 96,241
3 0,089 2,222 98,464
4 0,061 1,536 100,000
Extraction Method: Principal Component Analysis.

Berdasarkan output tersebut, jumlah komponen utama yang terbentuk adalah 2 komponen utama, yaitu Faktor 1 dan Faktor 2. Dari kolom Rotation Sums of Squared Loadings, tampak bahwa Faktor 1 mampu menjelaskan varian sebesar 48,475%, sedangkan Faktor 2 mampu menjelaskan varian sebesar 47,766%. Jadi total varian yang mampu dijelaskan oleh kedua faktor tersebut adalah 96,241%.

Berikut ini ditampilkan output Communalities yang menjelaskan besarnya peranan variabel awal dalam membentuk faktor yang terbentuk.

Communalities
  Initial Extraction
X1 1,000 ,961
X2 1,000 ,958
X3 1,000 ,963
X4 1,000 ,967
Extraction Method: Principal Component Analysis.

Dari tabel tersebut, variabel X1 menjelaskan kedua faktor yang terbentuk sebesar 96,1%, variabel X2 sebesar 95,8%, variabel X3 sebesar 96,3% dan variabel X4 sebesar 96,7%.

Output Component Matrixa di bawah ini memberikan penjelasan seberapa besar korelasi masing-masing variabel awal dengan masing-masing faktor yang terbentuk.

Component Matrixa
  Component
1 2
X1 -0,863 0,465
X2 0,842 0,499
X3 0,807 0,559
X4 -0,773 0,608
Extraction Method: Principal Component Analysis.
a. 2 components extracted.


Agar korelasi masing-masing variabel dengan salah satu faktor menjadi semakin kuat, maka dilakukan rotasi. Hasil rotasinya adalah sebagai berikut.

Rotated Component Matrixa
  Component
1 2
X1 -0,289 0,936
X2 0,951 -0,234
X3 0,967 -0,167
X4 -0,126 0,975
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.a
a. Rotation converged in 3 iterations.


Proses rotasi menghasilkan korelasi yang kuat masing-masing variabel awal dengan salah satu faktor yang terbentuk. Hasil korelasi tersebut menunjukkan penempatan variabel ke dalam salah satu faktor.

Faktor 1 terbentuk kuat oleh variabel X2 (Rata-rata lama tinggal wisatawan mancanegara (hari)) dan X3 (Rata-rata pengeluaran wisatawan mancanegara per kunjungan (USD)), sedangkan Faktor 2 terbentuk dari variabel X1 (Jumlah kedatangan wisatawan mancanegara ke Indonesia) dan X4 (Penerimaan dari wisatawan mancanegara (juta USD)).

Berdasarkan variabel-variabel pembentuknya tersebut, maka Faktor 1 diberi nama Faktor Makro, sedangkan Faktor 2 diberi nama Faktor Mikro.

Berikut ini adalah output Component Score Coefficient Matrix yang menyajikan bentuk hubungan atau model persamaan antara faktor dengan variabel penyusunnya. Component Score Coefficient merupakan kontanta atau koefisien serupa dengan koefisien regresi \((\beta_i)\) pada persamaan regresi berganda.

Component Transformation Matrix
Component 1 2
1 0,714 -0,701
2 0,701 0,714
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.


Semua dimensi atau variabel penyusun faktor telah ditranspormasi ke dalam data standar atau data Z (data Z mempunyai rata-rata = 0, varians = 1, dan data tanpa satuan atau relatif). Nilai faktor untuk setiap sampel disebut dengan nilai skor faktor (SF) dan setiap nilai skor faktor merupakan data baru yang menyusun sebuah variabel baru dari sub-variabel penyusun atau dimensi atau itemnya.

Dari output Component Score Coefficient Matrix di bawah ini dapat dibuat model hubungan antara variabel awal dengan faktor yang terbentuk.

Component Score Coefficient Matrix
  Component
1 2
X1 -0,289 0,936
X2 0,951 -0,234
X3 0,967 -0,167
X4 -0,126 0,975
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.


Persamaan atau model hubungannya adalah sebagai berikut. \[ \begin {align*} F_1&=0\text{,}056ZX_1+0\text{,}527ZX_2+0\text{,}554ZX_3+0\text{,}167ZX_4 \\ F_2&=0\text{,}513ZX_1+0\text{,}092ZX_2+0\text{,}138ZX_3+0\text{,}578ZX_4 \end {align*} \] Dari persamaan tersebut dapat dibentuk skor faktor untuk setiap faktor yang selanjutnya digunakan untuk Analisis Cluster.

4.2. Analisis Cluster

Dengan menggunakan skor kedua faktor, dapat dibentuk kelompok dengan menggunakan Analisis Cluster. Proses pengelompokan menggunakan jarak eucledian dan metode Ward.

Dari hasil dendogram, dapat dibentuk 2 kelompok negara asal wisatawan mancanegara dengan melakukan pemotongan vertikal di garis 21, sehingga terbentuk Kelompok Negara I dan Kelompok Negara II. Negara-negara asal wisatawan mancanegara yang masuk ke dalam Kelompok Negara I dan Kelompok Negara II adalah sebagai berikut.
  1. Kelompok Negara I: Pakistan, Bangladesh, Thailand, Hongkong, India, Filipina, Taiwan, Rep. Korea, Selandia Baru, Brunei Darussalam, Srilanka, Malaysia dan Singapura.
  2. Kelompok Negara II: Kanada, Austria, Norwegia, Belgia Swiss, Swedia, Finlandia, Denmark, Inggris Raya, Amerika Serikat, Jerman, Perancis, Belanda, Rusia, Jepang, Rep. China dan Australia.
Jika diperhatikan lebih seksama, ternyata semua negara-negara yang masuk ke dalam Kelompok Negara I adalah negara-negara yang berada di benua Asia. Sedangkan kelompok kedua didominasi oleh negara di luar Asia. Hanya Jepang dan Republik China saja negara di wilayah Asia yang masuk ke dalam Kelompok Negara II.

4.3. Analisis Statistik Deskriptif

Statistik deskriptif digunakan untuk membandingkan karakteristik wisatawan mancanegara yang berasal dari Kelompok Negara I dan Kelompok Negara II. Perbandingannya bisa dilihat dari sisi rata-rata lama tinggal dan besarnya pengeluaran. Selain itu juga bisa dilihat dari rata-rata jumlah kedatangan dan jumlah penerimaan negara.

Rata-rata lama tinggal dan besarnya pengeluaran wisatawan mancanegara yang berasal dari Kelompok Negara I dan Kelompok Negara II disajikan dalam tabel berikut.

Rata-rata Lama Tinggal (Hari) dan Rata-rata Pengeluaran Wisatawan Mancanegara (USD)
Kelompok Negara Rata-rata lama tinggal (hari) Rata-rata pengeluaran (USD)
I 6,4 928,9
II 11,7 1.640,5

Rata-rata lama tinggal wisatawan mancanegara yang berasal dari Kelompok Negara I tidak lebih lama daripada yang berasal dari Kelompok Negara II yaitu hanya selama 6,4 hari, sedangkan yang berasal dari Kelompok Negara II selama 11,7 hari. Hal tersebut juga berhubungan dengan rata-rata pengeluarannya, dimana pengeluaran wisatawan mancanegara yang berasal dari Kelompok Negara I per kunjungan tidak lebih besar daripada Kelompok Negara II yaitu hanya USD 928,9, sedangkan rata-rata pengeluaran wisatawan mancanegara yang berasal dari Kelompok Negara II sebesar USD 1.640,5.

Rata-rata jumlah kedatangan wisatawan mancanegara dan besarnya penerimaan yang diterima oleh Indonesia disajikan dalam tabel berikut.

Rata-rata Jumlah Kedatangan dan Besarnya Penerimaan oleh Negara (Juta USD)
Kelompok Negara Rata-rata jumlah kedatangan per negara Rata-rata besarnya penerimaan oleh negara (juta USD)
I 338.512 267,4
II 203.747 283,6

Rata-rata jumlah kedatangan wisatawan mancanegara ke Indonesia untuk negara-negara yang berada di Kelompok Negara I lebih banyak daripada yang berasal dari Kelompok Negara II yaitu sebanyak 338.512 wisatawan, sedangkan pada Kelompok Negara II hanya 203.747 wisatawan.

Begitu juga dengan rata-rata penerimaan dari wisatawan mancanegara Kelompok Negara I lebih rendah dari Kelompok Negara II yaitu sebesar USD 267,4 juta. Sedangkan rata-rata pada Kelompok Negara II adalah USD 283,6 juta.

Dapat dilihat disini bahwa ternyata rata-rata jumlah kedatangan per negara untuk negara-negara Kelompok Negara II lebih kecil daripada Kelompok Negara I, namun penerimaan negara yang berasal dari negara yang berasal dari Kelompok Negara II lebih besar dari Kelompok Negara I.


V. KESIMPULAN DAN SARAN

5.1. Kesimpulan

Dengan menganalisis 4 variabel yaitu jumlah kedatangan wisatawan mancanegara ke Indonesia, rata-rata lama tinggal wisatawan mancanegara (hari), rata-rata pengeluaran wisatawan mancanegara per kunjungan (USD), penerimaan dari wisatawan mancanegara (juta USD) dengan menggunakan analisis komponen utama dan analisis faktor dapat dibentuk dua faktor. Faktor tersebut adalah Faktor Makro dan Faktor Mikro.

Dengan menggunakan skor faktor dari kedua faktor tersebut, dilakukan pengelompokan negara asal wisatawan mancanegara yang datang ke Indonesia. Kelompok yang dibentuk adalah dua kelompok, yaitu Kelompok Negara I dan Kelompok Negara II.

Negara asal wisatawan mancanegara yang masuk Kelompok Negara I adalah Pakistan, Bangladesh, Thailand, Hongkong, India, Filipina, Taiwan, Rep. Korea, Selandia Baru, Brunei Darussalam, Srilanka, Malaysia dan Singapura. Sedangkan negara asal yang masuk Kelompok Negara II adalah Italia, Kanada, Austria, Norwegia, Belgia Swiss, Swedia, Finlandia, Denmark, Inggris Raya, Amerika Serikat, Jerman, Perancis, Belanda, Rusia, Jepang, Rep. China dan Australia.

5.2. Saran
  1. Variabel yang digunakan untuk dijadikan dasar melakukan analisis cluster masih sedikit sehingga perlu penambahan variabel.
  2. Kelompok yang terbentuk ternyata terbentuk menurut wilayahnya. Semua anggota Kelompok Negara I diisi oleh negara-negara yang berasal dari wilayah Asia. Sedangkan Kelompok Negara II didominasi oleh negara-negara di luar wilayah Asia. Oleh karena itu ada baiknya untuk penelitian selanjutnya pengelompokan bisa langsung dilakukan dan menganalisis perbedaan karakteristik wisatawan mancanegara menurut keberadaan negara asalnya yaitu yang berada di Benua Asia dan yang berada di luar Benua Asia.
  3. Sebenarnya setelah dilakukan pengelompokan, akan dilakukan uji beda rata-rata antar kelompok untuk setiap variabel. Namun karena data masing-masing variabel setiap kelompok tidak berdistribusi normal, maka pengujian tidak dapat dilakukan. Untuk penelitian selanjutnya, data negara-negara asal wisatawan mancanegara mesti lebih diperbanyak sehingga data setiap variabel masing-masing kelompok bisa memiliki distribusi normal.

DAFTAR PUSTAKA
  • http://www.bps.go.id/menutab.php?tabel=1&kat=2&id_subyek=16 diakses pada 22 November 2014
  • Lumaksono, dkk. 2012. Dampak Ekonomi Pariwisata Internasional pada Perekonomian Indonesia, Forum Pascasarjana Vol. 35 No. 1 Januari 2012:53-68
  • Morrison DF. 1967. Multivariate Statistical Methods. New York Mc.Graw-Hill, Inc. 2013
  • Sarwoko. 2011. Stasionaritas Produk Domestik Bruto Riil Perkapita dari Lima Besar Negara Asal Wisatawan Mancanegara ke Indonesia Tahun 1970-2009, Jurnal Akuntansi dan Manajemen, Vol. 22, No. 1, April 2011 Hal. 85-94

Penulis: Rory

Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)

Abstrak

Penelitian ini bertujuan melihat hubungan indeks-h dengan jumlah sitasi dengan menggunakan statistik korelasi dan regresi linier sederhana. Data yang digunakan adalah data indeks-h dan jumlah sitasi ilmuwan di Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD) yang bersumber dari Webometrics.

Keyword: h-index, citation, simple linier regression



I. Pendahuluan

Indeks-h (h-index) adalah indeks yang memberikan informasi produktivitas dan pengaruh seorang ilmuwan berdasarkan publikasi ilmiah yang dihasilkannya (Sidiropoulus, Katsaros & Manolopoulos, 2007). Hirsch (2007) mendefinisikan indeks-h sebagai jumlah publikasi ilmiah yang jumlah kutipannya lebih tinggi atau sama dengan h. Indeks ini merupakan sebuah indeks yang berguna untuk mengkarakterisasi output ilmiah seorang ilmuwan.

Pengukuran indeks-h cukup sederhana. Seorang ilmuwan memiliki indeks-h jika sebanyak h dari Np publikasi ilmiahnya memiliki setidaknya h sitasi dan publikasi ilmiah (NP-h) lainnya memiliki kurang atau sama dengan h sitasi (Hirsch, 2005). Kesederhanaan penghitungan ini merupakan alasan mengapa Hirsch (2005) mengusulkan metode pengukuran indeks-h sebagai indikator produktivitas dan pengaruh seorang ilmuwan. Indikator ini dalam prakteknya mudah diterapkan (Ball, 2005). Sejak diperkenalkan pada akhir tahun 2005, indikator ini telah mendapat perhatian besar baik dari komunitas ilmiah maupun dari masyarakat umum (Ruch & Ball, 2012).

Melalui metode pengukuran indeks-h, dapat diketahui bahwa indeks-h sangat dipengaruhi oleh jumlah publikasi ilmiah yang dihasilkan oleh seorang ilmuwan dan jumlah rujukan oleh ilmuwan lain terhadap publikasi ilmiah tersebut. Semakin banyak publikasi ilmiah seorang ilmuwan dan semakin banyak juga dirujuk oleh ilmuwan lain maka semakin tinggi indeks-h-nya.

Penelitian ini bertujuan untuk melihat bagaimana hubungan antara indeks-h dengan jumlah rujukan (sitasi). Data yang digunakan adalah data hasil peringkat Webometrics pada Bulan Mei 2015. Pada website Webometrics terdapat daftar nama 750 ilmuwan Indonesia yang diurutkan berdasarkan indeks-h dari yang tertinggi ke yang rendah. Webometrics (2015) mengukur indeks-h berdasarkan informasi dari Google Scholar. Data indeks-h ilmuwan yang digunakan pada penelitian ini adalah data indeks-h ilmuwan dari perguruan tinggi Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD). Kedua perguruan tinggi ini merupakan perguruan tinggi yang populer di Indonesia.

Alat analisis yang digunakan adalah analisis regresi linier sederhana dan korelasi. Model yang terbentuk dari analisis regresi linier sederhana merupakan model dengan parameter yang berbentuk linier. Model analisis ini sangat sederhana sehingga menyebabkan model ini mudah untuk dianalisis.


II. Metodologi

Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi variabel. Hubungan dalam korelasi belum dapat dikatakan sebagai hubungan sebab akibat. Korelasi dilambangkan dengan \(\rho\), sedangkan estimatornya \(r\). Estimasi \(\rho\) oleh \(r\) adalah \[ \rho=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}\sqrt{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2}} \] Pengujian tingkat korelasi dilakukan dengan hipotesis \(\text{H}_o:\rho=0\) dan \(\text{H}_1:\rho\neq0.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Persamaan model regresi linier sederhana adalah sebagai berikut. \[ Y=\beta_o+\beta_1x+\varepsilon \] Menurut Walpole, Myers, Myers dan Ye (1993), persamaan tersebut dapat diestimasi dengan metode kuadrat terkecil berdasarkan data berpasangan \((x_i,y_i),\) dimana \(i=1,2,3,\cdots,n.\) Estimasi \(\beta_o\) dan \(\beta_1\) adalah \(b_o\) dan \(b_1\) dimana \[ b_1=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}} \] dan \[ \begin {align*} b_o&=\frac{\displaystyle\sum_{i=1}^ny_i-b_1\sum_{i=1}^nx_i}{n}\\ &=\bar{y}-b_1\bar{x} \end {align*} \] Hasil estimasi persamaan model regresinya adalah \[ \hat{y}=b_o+b_1x \] Pengujian kelayakan parameter dari model regresi dilakukan dengan hipotesis \(\text{H}_o:\beta_j=0\) dan \(\text{H}_1:\beta_j\neq0,\) dimana \(j=0,1.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{b_j}{Se(b_j)} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Untuk mengetahui seberapa besar pengaruh variabel independen dalam menjelaskan variabel independen digunakan koefisien determinasi \((R^2).\) \[ R^2=\frac{\displaystyle\sum_{i=1}^n\left(\hat{y}_i-\bar{y}\right)^2}{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2} \] Model regresi yang telah terbentuk dengan metode kuadrat terkecil bisa dinilai baik jika residualnya berdistribusi normal. Pengujian residual berdistribusi normal bisa dilakukan menggunakan uji Kolmogorov-Smirnov dengan \(\text{H}_o\) : residual berdistribusi normal dan \(\text{H}_1\) : residual tidak berdistribusi normal. Statistik uji yang dignakan adalah \[ KS=\max\left\{\left|F_o(x)-S(x-1)\right|\right\};\left\{\left|S(x)-F_o(x)\right|\right\} \] Keputusan gagal menolak \(\text{H}_o\) jika \(KS<KS_\text{tabel}\) atau \(\textit{p-value}>\alpha.\)

Dalam penelitian ini, indeks-h merupakan variabel dependen \((y)\) sedangkan jumlah sitasi merupakan variabel independen \((x)\). Tingkat signifikansi \((\alpha)\) yang digunakan dalam penelitian ini adalah 5%.


III. Hasil pembahasan

Tabel 1 menyajikan eksplorasi data indeks-h ilmuwan UGM dan UNPAD. Dari 750 peringkat indeks-h profil ilmuwan di Indonesia versi Webometrics pada Mei 2015, UGM menempatkan sebanyak 66 ilmuwan di dalamnya, sedangkan UNPAD menempatkan sebanyak 25 ilmuwan. Rata-rata indeks-h ilmuwan UGM adalah 7,2424 sedangkan rata-rata indeks-h ilmuwan UNPAD adalah 7,3600. Indeks-h tertinggi dari ilmuwan UGM adalah 17, sedangkan dari UGM adalah 14.

Tabel 1. Eksplorasi data indeks-h
Perguruan Tinggi Jumlah Ilmuan Minimum Maksimum Rata-rata Standar Deviasi
UGM 66 5 17 72,424 27,121
UNPAD 25 5 14 73,600 25,801

Selanjutnya Tabel 2. menyajikan eksplorasi data jumlah sitasinya. Rata-rata jumlah sitasi ilmuwan UGM adalah 448,9697 dan UNPAD 360,4800. Jumlah sitasi terbanyak di UGM adalah 5,745, sedangkan di UNPAD 2,513.

Tabel 2. Eksplorasi data jumlah sitasi
Perguruan Tinggi Jumlah Ilmuan Minimum Maksimum Rata-rata Standar Deviasi
UGM 66 5 17 72,424 27,121
UNPAD 25 5 14 73,600 25,801

Korelasi antara indeks-h dengan jumlah sitasi di UGM adalah 0,579, sedangkan di UNPAD sebesar 0,733. Nilai \(\textit{p-value}\) kedua korelasi indeks-h dan jumlah sitasi tersebut lebih kecil dari \(\alpha\). Bentuk korelasi antara indeks-h dan jumlah sitasi masing-masing perguruan tinggi digambarkan dalam grafik plot data jumlah sitasi dan indeks h pada Gambar 1.

Dengan menggunakan metode kuadrat terkecil, model regresi yang terbentuk untuk UGM adalah \(\hat{y}=6\text{,}4235+0\text{,}0018x\) dengan koefisien determinasi 33,50%, sedangkan untuk UNPAD adalah \(\hat{y}=5\text{,}9809 +0\text{,}0038x\) dengan koefisien determinasi 53,70%.

Berdasarkan hasil uji kenormalan Kolmogorov-Smirnov, residual model regresi UGM tidak memenuhi asumsi normal, sedangkan residual UNPAD memenuhi asumsi normal.

Gambar 1. Plot data jumah sitasi dan indeks-h
GAMBAR

IV. Pembahasan

UGM lebih banyak menempatkan posisinya di peringkat 750 ilmuwan Indonesia versi Webometrics dibandingkan dengan UNPAD. Begitu juga dengan indeks-h maksimum yang dimiliki oleh UGM lebih tinggi dari indeks-h maxsimum UNPAD. Namun begitu, rata-rata indeks-h ilmuwan UGM dan rata-rata indeks-h ilmuwan UNPAD yang berada di 750 peringkat Webometrics tersebut tidak berbeda terlalu jauh. Hal yang cukup berbeda adalah jumlah sitasi yang tertinggi, dimana jumlah sitasi tertinggi dari UGM jauh lebih tinggi dari jumlah sitasi tertinggi dari UNPAD, begitu juga dengan rata-rata jumlah sitasi UGM jauh lebih tinggi dari rata-rata jumlah sitasi UNPAD.

Korelasi antara indeks-h dan jumlah sitasi dan UGM ternyata tidak cukup tinggi, namun di UGM sudah bisa dibilang cukup. Kondisi ini berbeda jauh dari hasil penelitan Cronin & Meho (2006) yang menyatakan bahwa terdapat korelasi kuat dan positif antara indek-h dan jumlah sitasi.

Regresi untuk UGM tidak bisa dikatakan layak. Hal ini disebabkan karena residual dari model tersebut tidak berdistribusi normal. Sedangkan regresi untuk UNPAD sudah memenuhi asumsi kenormalan residual, begitu juga dengan asumsi kelayakan parameter. Dari model untuk UNPAD dapat diinterpretasikan bahwa setiap penambahan jumlah sitasi seorang ilmuwan dari UNPAD sebanyak 1 sitasi, maka akan meningkatkan indeks-h-nya sebanyak 0,0038. Namun begitu indeks-h yang mampu dijelaskan oleh jumlah sitasi hanya 53,70%.


V. Kesimpulan dan Saran

Korelasi indeks-h dan jumlah sitasi hasil penelitian ini tidak terlalu besar. Begitu juga dengan hubungan dalam regresinya tidak begitu kuat. Untuk penelitian selanjutnya bisa dilakukan dengan penambahan variabel penjelas, misalnya variabel jumlah publikasi ilmiah yang dihasilkan dan jumlah sitasi yang dilakukan ke publikasi sendiri. Dengan begitu diharapkan koefisien determinasi model menjadi lebih baik. Selain itu bisa juga dengan menggunakan metode analisis lain seperti regresi semiparametrik dan regresi nonparametrik.


Daftar Pustaka


Penulis: Rory, 2015

Karakteristik Perumahan Rumahtangga Perikanan dan Bukan Perikanan di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II, Kabupaten Tanjung Jabung Barat, Provinsi Jambi, Tahun 2010

I. PENDAHULUAN

Masyarakat pesisir pada umumnya bekerja di sektor perikanan, yaitu sebagai nelayan. Besarnya potensi laut menjadi daya tarik bagi masyarakat tidak hanya untuk memenuhi kebutuhan ekonomi rumahtangga tetapi juga sebagai hobi. Pendapat Panayotou yang dikalimatkan lagi oleh Subade dan Abdullah (1993) dengan kalimat bahwa nelayan memiliki kepuasan hidup dengan menangkap ikan dan tidak semata-mata untuk meningkatkan pendapatan.

Sayangnya sektor perikanan tangkap umumnya tidak membuat kehidupan sosial ekonomi masyarakat menjadi lebih baik. Nelayan masih identik dengan kemiskinan. Hasil penelitian Muflikhati tahun 2010 memperlihatkan bahwa sebanyak 32,14 persen dari 16,42 juta jiwa masyarakat pesisir masih hidup di bawah garis kemiskinan dengan indikator pendapatan US$ 1 per hari (Data Direktorat PMP 2006). Menurut penelitian Badan Pusat Statistik (BPS) tahun 2011, secara umum, taraf kesejahteraan penduduk perikanan di daerah pesisir masih rendah, baik dari sisi ekonomi, pendidikan maupun kesehatan.

Kemiskinan identik dengan pemukiman kumuh dan perumahan yang tidak layak. Hasil penelitian BPS 2011, dari tujuh karakteristik perumahan yang diteliti di wilayah pesisir, ada empat karakteristik yang menggambarkan kualitas perumahan rumahtangga perikanan di pesisir yang lebih memerlukan perhatian. Memerlukan perhatian yang dimaksud adalah kondisi tempat tinggal kurang/tidak memenuhi standar hidup sehat/layak. Karakteristik tersebut adalah luas lantai tempat tinggal, tempat pembuangan akhir tinja, pengguna listrik dan cara memperoleh air minum.

Hingga saat ini belum ada survei atau sensus yang secara khusus ditujukan untuk menyajikan data sosial ekonomi rumahtangga perikanan, baik di pesisir maupun bukan pesisir (BPS, 2011). Oleh karena itu, tulisan ini mencoba meneliti kondisi sosial ekonomi rumahtangga yang tinggal di wilayah pesisir, baik itu rumahtangga perikanan maupun rumahtangga bukan perikanan, dilihat dari sisi perumahan tempat tinggalnya. Data yang digunakan adalah data Sensus Penduduk 2010 (SP2010) yang pada kuesionernya terdapat pertanyaan-pertanyaan yang berhubungan dengan kondisi perumahan rumahtangga.

Daerah yang diteliti adalah dua kelurahan yaitu Kelurahan Tungkal Harapan dan Kelurahan Tungkal II yang terletak di Kuala Tungkal. Kuala Tungkal merupakan ibukota Kabupaten Tanjung Jabung Barat dan terletak di muara Sungai Pengabuan. Karena letaknya di muara sungai ini membuat masyarakatnya banyak yang bekerja di sektor perikanan. Dua kelurahan yang dipilih adalah kelurahan yang paling banyak rumahtangganya yang bekerja di sektor perikanan.


II. TINJAUAN PUSTAKA

2.1 Rumahtangga Perikanan

Rumahtangga adalah seseorang atau sekelompok orang yang mendiami sebagian atau seluruh bangunan fisik atau sensus, dan biasanya tinggal bersama serta makan dari satu dapur. Rumahtangga umumnya terdiri dari ibu, bapak, anak, orang tua/mertua, famili, pembantu dan lainnya.

Perikanan adalah semua kegiatan yang berhubungan dengan pengelolaan dan pemanfaatan sumber daya ikan dan lingkungannya mulai dari pra produksi, produksi, pengolahan sampai dengan pemasaran yang dilaksanakan dalam suatu sistem bisnis perikanan (Undang-Undang Nomor 45 Tahun 2009 tentang Perubahan Atas Undang-Undang Nomor 31 Tahun 2004 tentang Perikanan).

Rumahtangga perikanan adalah rumahtangga yang sekurang-kurangnya memiliki satu anggota rumahtangga yang bekerja di lapangan usaha/bidang pekerjaan utama perikanan. Sensus Penduduk 2010 (SP2010) adalah sensus penduduk yang dilakukan oleh Badan Pusat Statistik (BPS) di Indonesia pada tanggal 1-31 Mei 2010. Selain menanyakan karakteristik rumahtangga dan keterangan individu anggota rumahtangga, SP2010 juga menanyakan kondisi dan fasilitas perumahan dan bangunan tempat tinggal.

2.2 Mosaic Plot

Mosaic plot diperkenalkan oleh Hartigan dan Kleiner (1981, 1984) dan kemudian dikembangkan oleh Friendly (1992b, 1994, 1997, 1999a) yaitu suatu metode grafik untuk memvisualisasikan suatu tabel kontingensi \(n\)-arah (\(n\)-way contingency tables) dan membuat model-model yang menerangkan hubungan-hubungan di antara variabel-variabelnya. Frekuensi-frekuensi di dalam tabel kontingensi menggambarkan kumpulan dari empat persegi panjang dalam bentuk "tiles" yang mana luasnya adalah proporsi dari frekuensi observasi, luasnya dinyatakan dalam bentuk warna.

Penggambaran mosaic plot menggunakan peluang yang diketahui. Untuk tabel dua-arah, dengan frekuensi \(n_{ij}\) dan peluang \(p_{ij}=\frac {n_{ij}}{n_{++}}\) adalah suatu unit persegi yang dibagi dengan empat persegi panjang dimana lebarnya merupakan proporsi dari frekuensi marjinal observasi \(n_{i+}\) dimana peluang marjinalnya \(p_i=\frac{n_{i+}}{n_{++}}.\) Untuk setiap empat persegi panjang dibagi lagi secara horizontal terhadap proporsi peluang untuk variabel kedua, \(p_{i/j}=\frac {n_{ij}}{n_{i+}},\) karenanya luas untuk setiap tiles adalah proporsi dari frekuensi observasi dan peluangnya adalah \(p_{ij}=p_i\times p_{j/i}=\left(\frac{n_{i+}}{n_{++}}\times \frac{n_{ij}}{n_{i+}}\right).\)


III. METODOLOGI

Data yang digunakan dalam penelitian ini adalah data kondisi perumahan rumahtangga yang tinggal di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II yang diperoleh dari hasil SP2010. Kondisi perumahan tersebut adalah sebagai berikut.
  1. Status kepemilikan bangunan tempat tinggal,
  2. Jenis lantai terluas,
  3. Luas lantai tempat tinggal,
  4. Sumber penerangan utama,
  5. Bahan bakar utama untuk memasak,
  6. Sumber utama air minum,
  7. Keberadaan fasilitas buang air besar,
  8. Tempat akhir pembuangan tinja.
Langkah-langkah yang dilakukan dalam penelitian ini adalah sebagai berikut.
  1. Mengumpulkan raw data SP2010 Kelurahan Tungkal Harapan dan Kelurahan Tungkal II.
  2. Menentukan rumahtangga perikanan dan rumahtangga bukan perikanan sesuai dengan konsep rumahtangga perikanan.
  3. Melakukan tabulasi silang variabel-variabel perumahan.
  4. Melakukan analisis deskriptif hasil tabulasi silang variabel perumahan.
  5. Melakukan eksplorasi data dengan mosaic plot.
  6. Membuat kesimpulan dan saran.
Semua pengolahan data yang dilakukan dalam penelitian ini menggunakan perangkat lunak Microsoft Excel dan SPSS.


IV. HASIL DAN PEMBAHASAN

4.1 Rumahtangga

Jumlah rumahtangga di Kelurahan Tungkal Harapan hasil SP2010 adalah 3.216 rumahtangga, sedangkan di Kelurahan Tungkal II adalah 4.581 rumahtangga.

Tabel 1. Jumlah rumahtangga perikanan dan bukan perikanan
Kelurahan Rumahtangga Jumlah
Perikanan Bukan Perikanan
(1) (2) (3) (4)
Tungkal Harapan 449
(13,96%)
2.767
(86,04%)
3.216
(100,00%)
Tungkal II 1.021
(22,29%)
3.560
(77,71%)
4.581
(100,00%)

Dari Tabel 1, tampak bahwa jumlah rumahtangga perikanan di Kelurahan Tungkal Harapan adalah 449 rumahtangga atau sebanyak 13,96 persen dari total rumahtangga di Kelurahan Tungkal Harapan. Sedangkan jumlah rumahtangga perikanan di Kelurahan Tungkal II adalah 1.021 rumahtangga, atau sebanyak 22,29 persen dari total rumahtangga di Kelurahan Tungkal II. Dari data tersebut tampak bahwa di kedua kelurahan, persentase rumahtangga perikanan lebih kecil daripada rumahtangga bukan perikanan.

4.2 Karakteristik Perumahan

1. Status penguasaan bangunan tempat tinggal

Dilihat dari status penguasaan bangunan tempat tinggalnya, di Kelurahan Tungkal Harapan, persentase rumahtangga perikanan yang tinggal pada bangunan tempat tinggal bukan milik sendiri lebih kecil daripada rumahtangga bukan perikanan. Persentase rumahtangga perikanan yang tinggal pada bangunan tempat tinggal bukan milik sendiri adalah 34,30 persen, sedangkan untuk rumahtangga bukan perikanan adalah 35,16 persen.

Tabel 2. Persentase rumahtangga yang tinggal di bangunan tempat tinggal bukan milik sendiri
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 34,30 35,16
Tungkal II 38,98 29,63

Hal yang berbeda terjadi di Kelurahan Tungkal II dimana persentase rumahtangga perikanan yang tinggal di bangunan bukan milik sendiri lebih besar dibandingkan dengan rumahtangga bukan perikanan. Persentase rumahtangga perikanan yang tinggal di bangunan bukan milik sendiri adalah 38,98 persen, sedangkan untuk rumahtangga bukan perikanan hanya 29,63 persen.

2. Jenis lantai terluas

Pada Tabel 3 terlihat bahwa di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II, persentase rumahtangga yang tinggal di bangunan tempat tinggal dengan jenis lantai terluas kayu, bambu atau tanah, baik pada rumahtangga perikanan maupun rumahtangga bukan perikanan, masih sangat tinggi yaitu lebih dari 90,00 persen. Hal ini bisa dimaklumi karena jenis tanah di kedua kelurahan tersebut adalah rawa, sehingga jenis rumah yang cocok dibangun pada wilayah tersebut adalah rumah panggung yang berbahan dasar kayu karena pembangunannya lebih mudah dengan biaya yang lebih murah. Mendirikan bangunan yang berbahan dasar semen atau beton memerlukan biaya yang jauh lebih besar dan lebih beresiko.

Tabel 3. Persentase rumahtangga dengan jenis lantai terluas kayu, bambu atau tanah
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 98,44 92,48
Tungkal II 98,82 91,85

Persentase rumahtangga perikanan yang tinggal di bangunan tempat tinggal yang berlantai kayu, bambu atau tanah di Kelurahan Tungkal Harapan maupun di Kelurahan Tungkal II lebih tinggi dibandingkan dengan rumahtangga non perikanan. Di Kelurahan Tungkal Harapan, persentase rumahtangga perikanan yang tinggal di bangunan tempat tinggal dengan jenis lantai terluas kayu, bambu atau tanah adalah 98,44 persen sedangkan untuk rumahtangga bukan perikanan hanya 92,48 persen. Sedangkan untuk Kelurahan Tungkal II, persentase rumahtangga perikanan yang tinggal di bangunan tempat tinggal dengan jenis lantai terluas kayu, bambu atau tanah adalah 98,82 persen, sedangkan untuk rumahtangga bukan perikanan hanya 91,85 persen.

3. Luas lantai tempat tinggal

Baik di Kelurahan Tungkal Harapan maupun di Kelurahan Tungkal II, persentase rumahtangga perikanan yang luas lantainya kurang dari 8 m2 perkapita lebih besar daripada rumahtangga bukan perikanan.

Tabel 4. Persentase rumahtangga dengan luas lantai tempat tinggal kurang dari 8 m2 perkapita
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 26,73 13,48
Tungkal II 24,39 11,97

Pada Tabel 4 tampak bahwa di Kelurahan Tungkal Harapan, persentase rumahtangga perikanan yang luas lantainya kurang dari 8 m2 perkapita sebanyak 26,73 persen, sedangkan untuk rumahtangga bukan perikanan hanya 13,48 persen. Di Kelurahan Tungkal II, persentase rumahtangga perikanan yang luas lantainya kurang dari 8 m2 perkapita sebanyak 24,39 persen, sedangkan untuk rumahtangga bukan perikanan hanya 11,97 persen.

4. Sumber penerangan utama

Di Kelurahan Tungkal Harapan, rumahtangga perikanan lebih banyak yang belum menggunakan listrik sebagai sumber penerangan utama dibandingkan dengan rumahtangga bukan perikanan. Persentase rumahtangga perikanan yang belum menggunakan listrik sebagai sumber penerangan utama adalah sebanyak 8,24 persen, sedangkan untuk rumahtangga bukan perikanan sebanyak 6,51 persen.

Tabel 5. Persentase rumahtangga yang menggunakan listrik sebagai sumber penerangan utama
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 8,24 6,51
Tungkal II 7,93 13,48

Hal yang berbeda terjadi di Kelurahan Tungkal II dimana persentase rumahtangga bukan perikananlah yang paling banyak tidak menggunakan listrik sebagai sumber penerangan utama yaitu sebesar 13,48 persen, sedangkan rumahtangga perikanan hanya 7,93 persen.

5. Bahan bakar utama untuk memasak

Pada Tabel 6 tampak bahwa di Kelurahan Tungkal Harapan maupun di Kelurahan Tungkal II, persentase rumahtangga perikanan yang menggunakan arang atau kayu sebagai bahan bakar utama untuk memasak lebih tinggi dibandingkan rumahtangga bukan perikanan.

Tabel 6. Persentase rumahtangga yang menggunakan arang atau kayu sebagai bahan bakar utama untuk memasak
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 31,18 18,14
Tungkal II 44,66 31,80

Di Kelurahan Tungkal Harapan, persentase rumahtangga perikanan yang menggunakan arang atau kayu sebagai bahan bakar utama untuk memasak adalah 31,18 persen, sedangkan pada rumahtangga bukan perikanan hanya 18,14 persen. Di Kelurahan Tungkal II, persentase rumahtangga perikanan yang menggunakan arang atau kayu sebagai bahan bakar untuk memasak sebanyak 44,66 persen, sedangkan pada rumahtangga bukan perikanan sebanyak 31,80 persen.

6. Sumber utama air minum

Sebagian besar rumahtangga di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II masih menggunakan sumur/mata air tidak terlindung, air sungai atau air hujan sebagai sumber utama air minum. Persentasenya disajikan pada Tabel 7 di bawah ini.

Tabel 7. Persentase rumahtangga yang menggunakan sumur/mata air tidak terlindung, air sungai, air hujan sebagai sumber utama air minum
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 99,33 89,81
Tungkal II 99,22 89,44

Baik di Kelurahan Tungkal Harapan maupun di Kelurahan Tunggal II, penggunaan air sumur/mata air tidak terlindung, air sungai atau air hujan sebagai sumber utama air minum oleh rumahtangga perikanan masih sangat tinggi yaitu mencapai 99,33 persen di Kelurahan Tungkal Harapan dan 99,22 persen di Kelurahan Tungkal II. Untuk rumahtangga bukan perikanan yang menggunakan air sumur/mata air tidak terlindung, air sungai atau air hujan sebagai sumber utama air minum adalah sebanyak 89,81 persen di Kelurahan Tungkal Harapan dan 89,44 persen di Kelurahan Tungkal II.

7. Keberadaan fasilitas buang air besar

Di Kelurahan Tungkal Harapan, persentase rumahtangga perikanan yang tidak memiliki jamban lebih besar daripada rumahtangga bukan perikanan. Persentase rumahtangga perikanan yang tidak memiliki jamban adalah 3,56 persen, sedangkan pada rumahtangga bukan perikanan adalah 1,48 persen.

Tabel 8. Persentase rumahtangga yang tidak memiliki jamban
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 3,56 1,48
Tungkal II 2,64 3,71

Kondisi yang berbeda terjadi di Kelurahan Tungkal II dimana persentase rumahtangga perikanan yang tidak memiliki jamban lebih kecil dibandingkan rumahtangga bukan perikanan. Persentase rumahtangga perikanan yang tidak memiliki jamban adalah 2,64 persen, sedangkan pada rumahtangga perikanan sebanyak 3,71 persen.

8. Tempat akhir pembuangan tinja

Persentase rumahtangga perikanan yang tidak menggunakan tangki septik di Kelurahan Tungkal Harapan maupun di Kelurahan Tungkal II jauh lebih tinggi dibandingkan rumahtangga bukan perikanan. Hal ini terjadi karena rumahtangga perikanan di kedua kelurahan tersebut bertempat tinggal di tepi muara sungai sehingga tempat pembuangan akhir tinjanya pada umumnya adalah sungai.

Tabel 9. Persentase rumahtangga yang tidak mempunyai tangki septik
Kelurahan Rumahtangga
Perikanan Bukan Perikanan
(1) (2) (3)
Tungkal Harapan 88,64 63,06
Tungkal II 82,08 44,72

Persentase rumahtangga perikanan yang tidak menggunakan tangki septik di Kelurahan Tungkal Harapan adalah 88,64 persen, sedangkan untuk rumahtangga bukan perikanan adalah sebanyak 63,06 persen. Di Kelurahan Tungkal II, persentase rumahtangga perikanan yang tidak menggunakan tangki septik adalah sebanyak 82,08 persen, sedangkan pada rumahtangga bukan perikanan hanya 44,72 persen.

4.3 Eksplorasi data dengan grafik mosaic plot

Berikut ini akan disajikan eksplorasi data dengan menggunakan grafik mosaic plot. Kondisi perumahan yang digrafikkan dalam mosaic plot digambarkan berdasarkan jumlah kondisi perumahan yang dikategorikan baik. Kondisi yang dikategorikan baik tersebut adalah sebagai berikut.
  1. Status penguasaan rumah adalah milik sendiri.
  2. Jenis lantai terluas adalah semen atau beton.
  3. Luas lantai ≥ 8 m2 perkapita.
  4. Sumber penerangan utama adalah listrik.
  5. Bahan bakar utama untuk memasak adalah gas atau minyak tanah.
  6. Sumber air minum utama air kemasan, ledeng, pompa, sumur/mata air terlindung.
  7. Memiliki jamban.
  8. Memiliki tangki septik.
Semakin banyak karakteristik tersebut yang dimiliki oleh suatu rumahtangga, maka semakin baik kondisi perumahan rumahtangganya. Kondisi paling baik jika rumahtangga memiliki semua karakteristik baik di atas atau dengan jumlah 8 karakteristik. Kondisi paling buruk adalah tidak satu pun karakteristik baik di atas dimiliki oleh suatu rumahtangga atau dengan jumlah karakteristik sebanyak 0 karakteristik.

Berikut ini ditampilkan grafik eksplorasi data perumahan rumahtangga perikanan dan bukan perikanan di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II dilihat dari jumlah karakteristik perumahan dengan kategori baik yang dimiliki oleh rumahtangga yang digambarkan dengan mosaic plot.

Grafik 1. Karakteristik perumahan di rumahtangga perikanan dan bukan perikanan


Grafik di atas menggambarkan eksplorasi data kondisi perumahan rumahtangga perikanan dan bukan perikanan di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II. Warna coklat pekat menandakan bahwa kondisi perumahan rumahtangga dalam kelompok tersebut hanya memiliki 2 karakteristik baik atau kurang. Kondisi ini perlu mendapat perhatian lebih karena kondisi ini menandakan bahwa kondisi perumahan rumahtangga tersebut dalam kondisi buruk.

Semakin pudar warna coklatnya (semakin ke bawah) maka semakin banyak karakteristik perumahan dengan kondisi baik yang dimiliki oleh rumahtangga. Kondisi warna paling pudar (paling bawah) menunjukkan rumahtangga tersebut memiliki jumlah karakteristik baik sebanyak 6 atau lebih. Kondisi perumahan rumahtangga di kelompok ini sudah tergolong pada kelompok baik.

Luas persegi panjang menunjukkan jumlah rumahtangga pada kelompok yang dikategorikan berdasarkan kelurahan, jenis rumahtangga dan jumlah karakteristik baik yang dimiliki. Semakin besar luasnya, maka semakin banyak jumlah rumahtangga di dalam kelompok kategori tersebut.


V. KESIMPULAN DAN SARAN

5.1 Kesimpulan

Dari delapan karakteristik perumahan yang diteliti pada rumahtangga perikanan dan bukan perikanan di Kelurahan Tungkal Harapan dan Kelurahan Tungkal II, terdapat tujuh karakteristik perumahan rumahtangga perikanan di Kelurahan Tungkal Harapan yang masih rendah dibandingkan dengan rumahtangga bukan perikanan, karakteristik tersebut yaitu:
  1. Jenis lantai terluas,
  2. Luas lantai tempat tinggal,
  3. Sumber penerangan utama,
  4. Bahan bakar utama untuk memasak,
  5. Sumber utama air minum,
  6. Keberadaan fasilitas buang air besar,
  7. Tempat akhir pembuangan tinja.
Sedangkan di Kelurahan Tungkal II, hanya enam karakteristik perumahan yang lebih rendah dari rumahtangga bukan perikanan. Karakteristik tersebut adalah:
  1. Status kepemilikan bangunan tempat tinggal,
  2. Jenis lantai terluas,
  3. Luas lantai tempat tinggal,
  4. Bahan bakar utama untuk memasak,
  5. Sumber utama air minum,
  6. Tempat akhir pembuangan tinja.
5.2 Saran
  1. Dengan adanya mosaic plot diharapkan bisa memberikan gambaran bagi pemerintah mengenai kebijakan mana yang lebih diutamakan berdasarkan kondisi dan jumlah rumahtangga yang tergambar dari grafik tersebut.
  2. Data yang digunakan adalah data SP2010 yang tujuan utamanya adalah untuk mendapatkan karakteristik rumahtangga secara umum. Oleh karena itu, jika ingin mendapatkan data sosial ekonomi khususnya perumahan yang terbaru dari rumahtangga perikanan atau yang tinggal di daerah pesisir sebaiknya melakukan sensus/survey khusus sehingga bisa melakukan analisis yang lebih mendalam.

DAFTAR PUSTAKA



Penulis: Rory

Pengelompokan Provinsi di Indonesia Berdasarkan Produktivitas Tanaman Pangan Tahun 2013

I. PENDAHULUAN

Indonesia merupakan salah satu negara yang beriklim tropis. Negara Indonesia mempunyai kekayaan alam yang melimpah terutama pada jenis tanaman pangan (padi dan palawija). Namun begitu, jenis tanaman pangan tersebut masih ada yang diimpor dari luar negeri untuk pemenuhan kebutuhan masyarakat. Oleh karena itu, agar kecukupan pangan bisa terpenuhi, upaya yang harus dilakukan pemerintah adalah meningkatkan produktivitas tanaman pangan.

Berikut ini adalah tabel luas panen, produksi dan produktivitas tanaman pangan di Indonesia tahun 2013.

Luas Panen, Produksi dan Produktivitas Tanaman Pangan di Indonesia Tahun 2013
Jenis Tanaman Pangan Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
Padi 13.835.252 71.279.709 51,52
Jagung 3.821.504 18.511.853 48,44
Kedelai 550.793 779.992 14,16
Kacang Tanah 519.056 701.68 13,52
Kacang Hijau 182.075 204.67 11,24
Ubi Kayu 1.065.752 23.936.921 224,60
Ubi Jalar 161.850 2.386.729 147,47

Jika produktivitas dirinci per provinsi sebagaimana yang ada pada Lampiran 1, ternyata terdapat provinsi yang memiliki produktivitas tertinggi dan provinsi yang memiliki produktivitas terendah yang rentangnya sangat jauh. Berikut ini adalah tabel produktivitas tertinggi dan terendah di Indonesia.

Luas Panen, Produksi dan Produktivitas Tanaman Pangan di Indonesia Tahun 2013
Jenis Tanaman Pangan Produktivitas Tertinggi
(Ku/Ha)
Produktivitas Terendah
(Ku/Ha)
(1) (2) (3)
Padi 59,83 27,84
Jagung 72,06 17,10
Kedelai 16,56 9,42
Kacang Tanah 16,56 9,63
Kacang Hijau 13,67 5,76
Ubi Kayu 397,66 102,47
Ubi Jalar 296,81 71,22

Dari tabel tersebut masih ada provinsi yang produktivitas tanaman pangannya 2 kali produktivitas yang lain. Bahkan produktivitas ubi jalar di Sumatera Barat empat kali produktivitas Kalimantan tengah.

Karena tingginya perbedaan produktivitas tersebut, perlu adanya pengelompokan provinsi-provinsi di Indonesia berdasarkan produktivitas tanaman pangan. Dengan adanya pengelompokan tersebut, diharapkan memudahkan pemerintah dalam mengambil keputusan dengan baik mengenai kebijakan yang cocok untuk mendapatkan perhatian yang lebih banyak dalam meningkatkan produktivitas pertanian tanaman pangan.


II. TINJAUAN PUSTAKA

2.1 Tanaman Pangan

Tanaman pangan merupakan jenis tanaman yang dapat menghasilkan karbohidrat dan protein. Tanaman pangan terdiri dari padi dan palawija.

Padi terdiri dari padi sawah dan padi ladang. Padi sawah adalah padi yang ditanam di lahan sawah. Selain itu, yang termasuk padi sawah ialah padi rendengan, padi gadu, padi gogo rancah, padi pasang surut, padi lebak, padi rembesan dan lain-lain. Sedangkan padi ladang adalah padi yang ditanam di tegal/kebun/ladang atau huma.

Palawija terdiri dari jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar.

2.2. Analisis Cluster

Tinjauan analisis cluster dapat dilihat pada materi: Analisis Cluster.


2.3. Analisis Diskriminan

Tinjauan analisis diskriminan dapat dilihat pada materi: Analisis Diskriminan.



III. METODOLOGI

Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Badan Pusat Statistik (BPS). Data luas panen merupakan data yang dikumpulkan oleh Dinas Pertanian atau Dinas serupa yang bertanggung jawab akan data pertanian di tingkat kabupaten/kota di bawah koordinasi Kementerian Pertanian. Dalam hal ini BPS hanya sebagai pengolah dan pengguna data. Data produktivitas atau hasil per hektar dikumpulkan oleh BPS melalui Survei Ubinan yang dilakukan setiap subround (empat bulanan). Data produktivitas ini dikumpulkan dengan mengikuti kaidah pengambilan sampel pada ilmu statistik. Kedua data tersebut nantinya digunakan untuk menghitung angka produksi tanaman pangan.

Variabel yang digunakan untuk analisis cluster dan analisis diskriminan adalah variabel produktivitas tanaman pangan (padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar), dimana variabel tersebut dinotasikan sebagai berikut.

X1 Produktivitas padi
X2 Produktivitas jagung
X3 Produktivitas kedelai
X4 Produktivitas kacang tanah
X5 Produktivitas kacang hijau
X6 Produktivitas ubi kayu
X7 Produktivitas ubi jalar

Langkah-langkah yang dilakukan dalam penelitian ini adalah sebagai berikut.
  1. Mengumpulkan data luas panen, produksi dan produktivitas setiap provinsi di Indonesia. Data diperoleh dari website BPS.
  2. Melakukan uji multikolinieritas sebelum melakukan analisis cluster karena analisis cluster membutuhkan asumsi tidak terjadi multikolinieritas.
  3. Melakukan pengelompokan dengan menggunakan analisis cluster metode hierarki Sehingga terbentuk kelompok provinsi.
  4. Melakukan analisis diskriminan untuk menguji ketepatan pengelompokan dan membuat fungsi pengelompokannya.
  5. Melakukan analisis deskriptif dari kelompok yang terbentuk.
Semua pengolahan yang dilakukan dalam penelitian ini menggunakan parangkat lunak Microsoft Excel dan SPSS.


IV. HASIL DAN PEMBAHASAN

4.1. Analisis Cluster

Tabel pada Lampiran 1 menyajikan data luas panen, produksi dan produktivitas pertanian tanaman pangan (padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar) di 34 provinsi di Indonesia. Namun data yang digunakan untuk pengelompokan dengan analisis cluster dan membuat fungsi pembeda dengan analisis diskriminan adalah data produktivitas saja.

Pada tabel tersebut, dari 34 provinsi, terdapat 3 provinsi yang datanya kurang lengkap untuk dilakukan analisis lebih lanjut. Ketiga provinsi tersebut adalah Provinsi Bangka Belitung, Kepulauan Riau dan DKI Jakarta. Ketidaklengkapan data akan menyebabkan hasil pengelompokan menjadi kurang baik. Oleh karena itu data ketiga provinsi tersebut tidak digunakan dalam penelitian. Sehingga data yang digunakan dalam penelitian ini menjadi 31 data.

Pengelompokan dalam analisis cluster memerlukan data yang telah distandarisasi. Hasil standarisasi data produktivitas ditampilkan pada Lampiran 2.

Asumsi yang harus dipenuhi dalam analisis cluster adalah tidak terjadi multikolinearitas. Pemeriksaan multikolinearitas dilakukan dengan melihat nilai VIF.

Collinearity Statistics
Variabel Produktivitas Tolerance VIF
(1) (2) (3)
Zscore:  Padi 0,517 1,934
Zscore:  Jagung 0,398 2,515
Zscore:  Kedelai 0,498 2,007
Zscore:  Kacang Tanah 0,365 2,739
Zscore:  Kacang Hijau 0,815 1,228
Zscore:  Ubi Kayu 0,624 1,603
Zscore:  Ubi Jalar 0,551 1,815

Dari tabel Collinearity Statistics di atas, tidak terdapat nilai VIF yang lebih dari 10, sehingga tidak terdapat multikolinearitas. Oleh karena itu, analisis cluster dapat dilanjutkan.

Proses pengelompokan dilakukan menggunakan jarak eucledian ditampilkan dalam dendogram yang terdapat dalam Lampiran 3. Dalam penelitian ini, kelompok yang akan terbentuk adalah 3 kelompok dengan membuat perpotongan pada garis vertikal 10 di dendogram.

Kelompok tang terbentuk adalah kelompok 1, kelompok 2 dan kelompok 3. Kelompok 1 terdiri dari 4 provinsi, kelompok 2 terdiri dari 18 provinsi, dan kelompok 3 terdiri dari 9 provinsi. Nama-nama provinsi yang masuk ke dalam masing-masing kelompok adalah sebagai berikut.
  1. Kelompok 1: Jawa Tengah, Jawa Timur, Jawa Barat dan Sumatera Barat.
  2. Kelompok 2: Sulawesi Utara, Gorontalo, Sumatera Selatan, Sulawesi Selatan, Kalimantan Selatan, Maluku, Aceh, Kalimantan Timur, Jambi, Bengkulu, Nusa Tenggara Barat, Sumatera Utara, Lampung, Sulawesi Barat, Banten, Bali, DI Yogyakarta, Sulawesi Tengah.
  3. Kelompok 3: Riau, Sulawesi Tenggara, Papua Barat, Papua, Maluku Utara, Nusa Tenggara Timur, Kalimantan Tengah, Kalimantan Utara, Kalimantan Barat.

4.2. Analisis Diskriminan

Analisis diskriminan dilakukan untuk menguji perbedaan antar kelompok sekaligus membuat fungsi pembeda antar kelompok tersebut.

Analisis diskriminan membutuhkan asumsi normalitas. Hasil pemeriksaan kenormalan dengan uji Kolmogorov-Smirnov adalah sebagai berikut.

Kolmogorov-Smirnova
Variabel Produktivitas Statistic df sig.
(1) (2) (3) (4)
Padi ,100 31 0,200
Jagung ,082 31 0,200
Kedelai ,099 31 0,200
Kacang Tanah ,144 31 0,103
Kacang Hijau ,164 31 0,034
Ubi Kayu ,155 31 0,055
Ubi Jalar ,228 31 0,000

Dari Uji Kolmogorov-Smirnov pada tabel di atas, nilai signifikansi yang kurang dari 0,05 adalah produktivitas kacang hijau dan produktivitas ubi jalar, sehingga kedua variabel tersebut tidak berdistribusi normal. Kedua variabel tersebut dikeluarkan dari analisis diskriminan.

Asumsi tidak ada multikolineartitas untuk analisis diskriminan dilihat dari tabel Pooled Within-Groups Matricesa.

Pooled Within-Groups Matricesa
Correlation Padi Jagung Kedelai Kacang Tanah Ubi Kayu
(1) (2) (3) (4) (5) (6)
Padi 1,000 -0,205 0,052 -0,113 -0,100
Jagung -0,205 1,000 -0,317 0,112 0,235
Kedelai 0,052 -0,317 1,000 0,441 -0,334
Kacang Tanah -0,113 0,112 0,441 1,000 -0,129
Ubi Kayu -0,100 0,235 -0,334 -0,129 1,000
a. The covariance matrix has 28 degrees of freedom.

Dari tabel tersebut tidak ada angka korelasi yang mencapai 0,5 atau di atasnya sehingga kita mengidentifikasi tidak ada multikolinieritas antar variabel.

Pemeriksaan apakah ketiga kelompok memang terdapat perbedaan dilakukan dengan uji kesamaan rata-rata.

Tests of Equality of Group Means
Wilks' Lambda F df1 df2 Sig.
(1) (2) (3) (4) (5) (6)
Padi 0,322 29,544 2 28 0,000
Jagung 0,342 26,878 2 28 0,000
Kedelai 0,735 5,040 2 28 0,013
Kacang Tanah 0,528 12,525 2 28 0,000
Ubi Kayu 0,694 6,169 2 28 0,006

Dilihat dari tabel Tests of Equality of Group Means, nilai signifikansinya tidak ada yang melebihi 0,5, sehingga masing-masing variabel mempunyai rata-rata yang berbeda untuk kedua kelompok.

Asumsi berikutnya adalah homokedastisitas atau kesamaan matriks varian-kovarian. Hasil uji statistiknya menggunakan uji Box's M adalah sebagai berikut.

Test Results
Box's M 55,116
F Approx. 2,682
  df1 15
  df2 1,047,949
  Sig. 0,000

Nilai signifikansinya adalah 0,000 atau kurang dari 0,05 sehingga matriks varian-kovariannya sama.

Koefisien fungsi linier diskriminan yang terbentuk dari hasil output adalah sebagai berikut.

Canonical Discriminant Function Coefficients
Variabel Produktivitas Function
1 2
(1) (2) (3)
Padi 0,153 -0,064
Jagung 0,085 -0,011
Kedelai 0,250 -0,058
Kacang Tanah 0,134 0,051
Ubi Kayu 0,005 0,016
(Constant) -16,320 ,507
Unstandardized coefficients

Jika dinotasikan, fungsi liniernya adalah sebagai berikut

Y1 = -16,320 + (0,153 Padi) + (0,085 Jagung) + (0,250 Kedelai) + (0,134 Kacang tanah) + (0,005 Ubi kayu)
Y2 = 0,507 + (-0,064 Padi) + (-0,011 Jagung) + (-0,058 Kedelai) + (0,051 Kacang tanah) + (0,016 Ubi kayu)

Terkait dengan fungsi linier tersebut, pengelompokan dilakukan dengan dasar centroid pada tabel di bawah.

Functions at Group Centroids
Kelompok Function
1 2
(1) (2) (3)
1 4,322 0,582
2 0,792 -0,236
3 -3,505 0,213
Unstandardized coefficients

Daerah territorialnya terdapat pada Lampiran 5. Dengan menggunakan fungsi diskriminan, group centroid dan territorial map tersebut, kita bisa mengidentifikasi provinsi yang belum dikelompokkan (Kepulauan Riau, Bangka Belitung dan DKI Jakarta) jika datanya sudah tersedia, apakah provinsi tersebut dikelompokkan ke dalam kelompok 1, 2 atau 3.

Tabel di bawah ini adalah tabel Classification Results yang menunjukkan angka hit ratio.

Classification Resultsa
Wilayah Predicted Group Membership Total
1 2 3
(1) (2) (3) (4) (5) (6) (7)
Original Count 1 4 0 0 4
2 0 18 0 18
3 0 0 9 9
% 1 100,0 0,0 0,0 100,0
2 0,0 100,0 0,0 100,0
3 0,0 0,0 100,0 100,0
a. 100,0% of original grouped cases correctly classified.

Angka hit ratio atau ketepatan pengelompokan adalah 100%.

4.3. Analisis Deskriptif

Berikut ini disajikan hasil tabulasi data luas panen, produksi dan produktivitas masing-masing tanaman pangan (padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar) untuk tiga wilayah yang baru saja terbentuk.

Luas Panen, Produksi dan Produktivitas Padi
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 6.400.179 36.907.704 57,67
II 6.132.574 29.955.316 48,85
III 1.290.144 4.376.571 33,92

Dari tabel luas panen, produksi dan produktivitas padi di atas, tampak bahwa Wilayah I memiliki produktivitas tanaman padi tertinggi, yaitu sebesar 57,67 Ku/Ha. Selanjutnya adalah wilayah II yaitu sebesar 48,85 Ku/Ha. Produktivitas paling rendah adalah pada wilayah III, yaitu sebesar 33,92 Ku/Ha.

Luas Panen, Produksi dan Produktivitas Jagung
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 1.966.193 10.341.285 52,60
II 1.485.685 7.159.968 48,19
III 369.053 1.009.027 27,34

Dari tabel luas panen, produksi dan produktivitas jagung, terlihat bahwa produktivitas jagung tertinggi berada di Wilayah I, yaitu sebesar 52,60 Ku/Ha, diikuti oleh Wilayah II yaitu sebesar 48,19 Ku/Ha, dan yang paling rendah adalah Wilayah III, yaitu hanya 27,34 Ku/Ha.

Luas Panen, Produksi dan Produktivitas Kedelai
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 1.966.193 10.341.285 52,60
II 1.485.685 7.159.968 48,19
III 369.053 1.009.027 27,34

Dari tabel luas panen, produksi dan produktivitas kedelai, Wilayah I memiliki produktivitas kedelai tertinggi yaitu 15,39 Ku/Ha, diikuti Wilayah II sebesar 12,64 Ku/Ha dan Wilayah III sebesar 11,22 Ku/Ha. Dibandingkan dengan produktivitas padi dan jagung sebelumnya, produktivitas kedelai berbeda tidak terlalu jauh.

Luas Panen, Produksi dan Produktivitas Kacang Tanah
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 302.721 436.667 14,42
II 185.553 232.615 12,54
III 30.272 31.873 10,53

Tabel luas panen, produksi dan produktivitas kacang tanah menunjukkan bahwa produktivitas kacang tanah di Wilayah I merupakan produktivitas yang tertinggi, yaitu sebesar 14,42 Ku/Ha, diikuti Wilayah II yaitu 12,54 Ku/Ha dan Wilayah III sebesar 10,53 Ku/Ha. Selisih produktivitas antar wilayah tidak terlalu tinggi sama seperti produktivitas kedelai.

Luas Panen, Produksi dan Produktivitas Kacang Hijau
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 116.515 133.718 11,48
II 49.734 57.188 11,50
III 15.826 13.764 8,70

Pada tabel luas panen, produksi dan produktivitas kacang hijau, tampak bahwa produktivitas kacang hijau di Wilayah I dan II tidak berbeda terlalu jauh dimana produktivitas kacang hijau di Wilayah I sebesar 11,48 Ku/Ha dan di Wilayah II sebesar 11,50 Ku/Ha. Produktivitas kacang hijau di Wilayah III lebih rendah dibandingkan dengan Wilayah I dan II yaitu hanya 8,70 Ku/Ha.

Luas Panen, Produksi dan Produktivitas Ubi Kayu
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 430.985 10.048.071 233,14
II 511.381 12.358.064 241,66
III 121.876 1.508.053 123,74

Dilihat dari tabel luas panen, produksi dan produktivitas ubi kayu di atas, tampak bahwa produktivitas ubi kayu tertinggi berada di Wilayah II, yaitu sebesar 241,66 Ku/Ha diikuti oleh Wilayah I, yaitu sebesar 233,14 Ku/Ha. Produktivitas ubi kayu paling rendah berada wilayah III yaitu hanya 123,74 Ku/Ha.

Luas Panen, Produksi dan Produktivitas Ubi Jalar
Wilayah Luas Panen
(Ha)
Produksi
(Ton)
Produktivitas
(Ku/Ha)
(1) (2) (3) (4)
I 60.315 1.196.411 198,36
II 47.497 588.97 124,00
III 53.436 596.594 111,65

Dari tabel luas panen, produksi dan produktivitas ubi jalar, produktivitas ubi jalar tertinggi berada di Wilayah I yaitu sebesar 198,36 Ku/Ha. Kemudian diikuti oleh Wilayah II yaitu hanya 124,00 Ku/Ha, dan produktivitas terendah berada di Wilayah III yaitu 111,65 Ku/Ha.

Jika dilihat dari hasil statistik deskriptif di atas, dapat dilihat gambaran bahwa Wilayah I merupakan wilayah yang memiliki produktivitas tanaman tertinggi dengan mendominasi produktivitas tertinggi untuk 5 jenis tanaman pangan, yaitu padi, jagung, kedelai, kacang tanah dan ubi jalar. Sedangkan Wilayah II merupakan wilayah dengan produktivitas tanaman pangan sedang dimana mendominasi produktivitas tertinggi di dua jenis tanaman pangan yaitu kacang hijau dan ubi kayu. Wilayah III merupakan wilayah dengan produktivitas tanaman pangan terendah dimana produktivitas setiap jenis tanaman pangan selalu paling rendah dibandingkan dengan wilayah yang lainnya.


V. KESIMPULAN DAN SARAN

5.1. Kesimpulan

Untuk melihat tingkat produktivitas tanaman pangan di provinsi di Indonesia, maka perlu adanya pengelompokan provinsi di Indonesia. Dengan begitu akan memudahkan pemerintah dalam pengambilan kebijakan terkait masalah tanaman pangan.

Dengan menggunakan analisis cluster, pengelompokan provinsi-provinsi di Indonesia berdasarkan variabel produktivitas tanaman pangan (padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar) tahun 2013 menghasilkan tiga kelompok wilayah tanaman pangan. Wilayah I terdiri dari Provinsi Jawa Tengah, Jawa Timur, Jawa Barat dan Sumatera Barat. Wilayah II terdiri dari Provinsi Sulawesi Utara, Gorontalo, Sumatera Selatan, Sulawesi Selatan, Kalimantan Selatan, Maluku, Aceh, Kalimantan Timur, Jambi, Bengkulu, Nusa Tenggara Barat, Sumatera Utara, Lampung, Sulawesi Barat, Banten, Bali, DI Yogyakarta, Sulawesi Tengah. Wilayah III terdiri dari Provinsi Riau, Sulawesi Tenggara, Papua Barat, Papua, Maluku Utara, Nusa Tenggara Timur, Kalimantan Tengah, Kalimantan Utara, Kalimantan Barat.

Wilayah I merupakan wilayah yang mempunyai produktivitas tanaman pangan tertinggi. Wilayah II memiliki produktivitas tanaman pangan sedang. Sedangkan Wilayah III memiliki produktivitas rendah.

5.2 Saran

Penelitian ini belum memperhatikan jenis tanaman pangan yang lebih rinci, seperti padi harus dibagi ke dalam bentuk padi sawah dan padi ladang. Keduanya memiliki produktivitas yang berbeda.


DAFTAR PUSTAKA

Hair, J. F., JR., Anderson, R. E., Tatham, R. L. and Black, W. C., Multivariate Data Analysis, fifth edition, Prentice-Hall, Inc., USA, 1998
Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. New Jersey: Prentice Hall, Inc.
Morrison DF. 1967. Multivariate Statistical Methods. New York Mc.Graw-Hill, Inc. 2013


Penulis: Rory