Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index) | Rumus Statistik

Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)

Abstrak

Penelitian ini bertujuan melihat hubungan indeks-h dengan jumlah sitasi dengan menggunakan statistik korelasi dan regresi linier sederhana. Data yang digunakan adalah data indeks-h dan jumlah sitasi ilmuwan di Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD) yang bersumber dari Webometrics.

Keyword: h-index, citation, simple linier regression



I. Pendahuluan

Indeks-h (h-index) adalah indeks yang memberikan informasi produktivitas dan pengaruh seorang ilmuwan berdasarkan publikasi ilmiah yang dihasilkannya (Sidiropoulus, Katsaros & Manolopoulos, 2007). Hirsch (2007) mendefinisikan indeks-h sebagai jumlah publikasi ilmiah yang jumlah kutipannya lebih tinggi atau sama dengan h. Indeks ini merupakan sebuah indeks yang berguna untuk mengkarakterisasi output ilmiah seorang ilmuwan.

Pengukuran indeks-h cukup sederhana. Seorang ilmuwan memiliki indeks-h jika sebanyak h dari Np publikasi ilmiahnya memiliki setidaknya h sitasi dan publikasi ilmiah (NP-h) lainnya memiliki kurang atau sama dengan h sitasi (Hirsch, 2005). Kesederhanaan penghitungan ini merupakan alasan mengapa Hirsch (2005) mengusulkan metode pengukuran indeks-h sebagai indikator produktivitas dan pengaruh seorang ilmuwan. Indikator ini dalam prakteknya mudah diterapkan (Ball, 2005). Sejak diperkenalkan pada akhir tahun 2005, indikator ini telah mendapat perhatian besar baik dari komunitas ilmiah maupun dari masyarakat umum (Ruch & Ball, 2012).

Melalui metode pengukuran indeks-h, dapat diketahui bahwa indeks-h sangat dipengaruhi oleh jumlah publikasi ilmiah yang dihasilkan oleh seorang ilmuwan dan jumlah rujukan oleh ilmuwan lain terhadap publikasi ilmiah tersebut. Semakin banyak publikasi ilmiah seorang ilmuwan dan semakin banyak juga dirujuk oleh ilmuwan lain maka semakin tinggi indeks-h-nya.

Penelitian ini bertujuan untuk melihat bagaimana hubungan antara indeks-h dengan jumlah rujukan (sitasi). Data yang digunakan adalah data hasil peringkat Webometrics pada Bulan Mei 2015. Pada website Webometrics terdapat daftar nama 750 ilmuwan Indonesia yang diurutkan berdasarkan indeks-h dari yang tertinggi ke yang rendah. Webometrics (2015) mengukur indeks-h berdasarkan informasi dari Google Scholar. Data indeks-h ilmuwan yang digunakan pada penelitian ini adalah data indeks-h ilmuwan dari perguruan tinggi Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD). Kedua perguruan tinggi ini merupakan perguruan tinggi yang populer di Indonesia.

Alat analisis yang digunakan adalah analisis regresi linier sederhana dan korelasi. Model yang terbentuk dari analisis regresi linier sederhana merupakan model dengan parameter yang berbentuk linier. Model analisis ini sangat sederhana sehingga menyebabkan model ini mudah untuk dianalisis.


II. Metodologi

Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi variabel. Hubungan dalam korelasi belum dapat dikatakan sebagai hubungan sebab akibat. Korelasi dilambangkan dengan \(\rho\), sedangkan estimatornya \(r\). Estimasi \(\rho\) oleh \(r\) adalah \[ \rho=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}\sqrt{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2}} \] Pengujian tingkat korelasi dilakukan dengan hipotesis \(\text{H}_o:\rho=0\) dan \(\text{H}_1:\rho\neq0.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Persamaan model regresi linier sederhana adalah sebagai berikut. \[ Y=\beta_o+\beta_1x+\varepsilon \] Menurut Walpole, Myers, Myers dan Ye (1993), persamaan tersebut dapat diestimasi dengan metode kuadrat terkecil berdasarkan data berpasangan \((x_i,y_i),\) dimana \(i=1,2,3,\cdots,n.\) Estimasi \(\beta_o\) dan \(\beta_1\) adalah \(b_o\) dan \(b_1\) dimana \[ b_1=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}} \] dan \[ \begin {align*} b_o&=\frac{\displaystyle\sum_{i=1}^ny_i-b_1\sum_{i=1}^nx_i}{n}\\ &=\bar{y}-b_1\bar{x} \end {align*} \] Hasil estimasi persamaan model regresinya adalah \[ \hat{y}=b_o+b_1x \] Pengujian kelayakan parameter dari model regresi dilakukan dengan hipotesis \(\text{H}_o:\beta_j=0\) dan \(\text{H}_1:\beta_j\neq0,\) dimana \(j=0,1.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{b_j}{Se(b_j)} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Untuk mengetahui seberapa besar pengaruh variabel independen dalam menjelaskan variabel independen digunakan koefisien determinasi \((R^2).\) \[ R^2=\frac{\displaystyle\sum_{i=1}^n\left(\hat{y}_i-\bar{y}\right)^2}{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2} \] Model regresi yang telah terbentuk dengan metode kuadrat terkecil bisa dinilai baik jika residualnya berdistribusi normal. Pengujian residual berdistribusi normal bisa dilakukan menggunakan uji Kolmogorov-Smirnov dengan \(\text{H}_o\) : residual berdistribusi normal dan \(\text{H}_1\) : residual tidak berdistribusi normal. Statistik uji yang dignakan adalah \[ KS=\max\left\{\left|F_o(x)-S(x-1)\right|\right\};\left\{\left|S(x)-F_o(x)\right|\right\} \] Keputusan gagal menolak \(\text{H}_o\) jika \(KS<KS_\text{tabel}\) atau \(\textit{p-value}>\alpha.\)

Dalam penelitian ini, indeks-h merupakan variabel dependen \((y)\) sedangkan jumlah sitasi merupakan variabel independen \((x)\). Tingkat signifikansi \((\alpha)\) yang digunakan dalam penelitian ini adalah 5%.


III. Hasil pembahasan

Tabel 1 menyajikan eksplorasi data indeks-h ilmuwan UGM dan UNPAD. Dari 750 peringkat indeks-h profil ilmuwan di Indonesia versi Webometrics pada Mei 2015, UGM menempatkan sebanyak 66 ilmuwan di dalamnya, sedangkan UNPAD menempatkan sebanyak 25 ilmuwan. Rata-rata indeks-h ilmuwan UGM adalah 7,2424 sedangkan rata-rata indeks-h ilmuwan UNPAD adalah 7,3600. Indeks-h tertinggi dari ilmuwan UGM adalah 17, sedangkan dari UGM adalah 14.

Tabel 1. Eksplorasi data indeks-h
Perguruan Tinggi Jumlah Ilmuan Minimum Maksimum Rata-rata Standar Deviasi
UGM 66 5 17 72,424 27,121
UNPAD 25 5 14 73,600 25,801

Selanjutnya Tabel 2. menyajikan eksplorasi data jumlah sitasinya. Rata-rata jumlah sitasi ilmuwan UGM adalah 448,9697 dan UNPAD 360,4800. Jumlah sitasi terbanyak di UGM adalah 5,745, sedangkan di UNPAD 2,513.

Tabel 2. Eksplorasi data jumlah sitasi
Perguruan Tinggi Jumlah Ilmuan Minimum Maksimum Rata-rata Standar Deviasi
UGM 66 5 17 72,424 27,121
UNPAD 25 5 14 73,600 25,801

Korelasi antara indeks-h dengan jumlah sitasi di UGM adalah 0,579, sedangkan di UNPAD sebesar 0,733. Nilai \(\textit{p-value}\) kedua korelasi indeks-h dan jumlah sitasi tersebut lebih kecil dari \(\alpha\). Bentuk korelasi antara indeks-h dan jumlah sitasi masing-masing perguruan tinggi digambarkan dalam grafik plot data jumlah sitasi dan indeks h pada Gambar 1.

Dengan menggunakan metode kuadrat terkecil, model regresi yang terbentuk untuk UGM adalah \(\hat{y}=6\text{,}4235+0\text{,}0018x\) dengan koefisien determinasi 33,50%, sedangkan untuk UNPAD adalah \(\hat{y}=5\text{,}9809 +0\text{,}0038x\) dengan koefisien determinasi 53,70%.

Berdasarkan hasil uji kenormalan Kolmogorov-Smirnov, residual model regresi UGM tidak memenuhi asumsi normal, sedangkan residual UNPAD memenuhi asumsi normal.

Gambar 1. Plot data jumah sitasi dan indeks-h
GAMBAR

IV. Pembahasan

UGM lebih banyak menempatkan posisinya di peringkat 750 ilmuwan Indonesia versi Webometrics dibandingkan dengan UNPAD. Begitu juga dengan indeks-h maksimum yang dimiliki oleh UGM lebih tinggi dari indeks-h maxsimum UNPAD. Namun begitu, rata-rata indeks-h ilmuwan UGM dan rata-rata indeks-h ilmuwan UNPAD yang berada di 750 peringkat Webometrics tersebut tidak berbeda terlalu jauh. Hal yang cukup berbeda adalah jumlah sitasi yang tertinggi, dimana jumlah sitasi tertinggi dari UGM jauh lebih tinggi dari jumlah sitasi tertinggi dari UNPAD, begitu juga dengan rata-rata jumlah sitasi UGM jauh lebih tinggi dari rata-rata jumlah sitasi UNPAD.

Korelasi antara indeks-h dan jumlah sitasi dan UGM ternyata tidak cukup tinggi, namun di UGM sudah bisa dibilang cukup. Kondisi ini berbeda jauh dari hasil penelitan Cronin & Meho (2006) yang menyatakan bahwa terdapat korelasi kuat dan positif antara indek-h dan jumlah sitasi.

Regresi untuk UGM tidak bisa dikatakan layak. Hal ini disebabkan karena residual dari model tersebut tidak berdistribusi normal. Sedangkan regresi untuk UNPAD sudah memenuhi asumsi kenormalan residual, begitu juga dengan asumsi kelayakan parameter. Dari model untuk UNPAD dapat diinterpretasikan bahwa setiap penambahan jumlah sitasi seorang ilmuwan dari UNPAD sebanyak 1 sitasi, maka akan meningkatkan indeks-h-nya sebanyak 0,0038. Namun begitu indeks-h yang mampu dijelaskan oleh jumlah sitasi hanya 53,70%.


V. Kesimpulan dan Saran

Korelasi indeks-h dan jumlah sitasi hasil penelitian ini tidak terlalu besar. Begitu juga dengan hubungan dalam regresinya tidak begitu kuat. Untuk penelitian selanjutnya bisa dilakukan dengan penambahan variabel penjelas, misalnya variabel jumlah publikasi ilmiah yang dihasilkan dan jumlah sitasi yang dilakukan ke publikasi sendiri. Dengan begitu diharapkan koefisien determinasi model menjadi lebih baik. Selain itu bisa juga dengan menggunakan metode analisis lain seperti regresi semiparametrik dan regresi nonparametrik.


Daftar Pustaka


Penulis: Rory, 2015

0 Komentar untuk "Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)"