Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)

Abstrak
Penelitian ini bertujuan melihat hubungan indeks-h dengan jumlah sitasi dengan menggunakan statistik korelasi dan regresi linier sederhana. Data yang digunakan adalah data indeks-h dan jumlah sitasi ilmuwan di Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD) yang bersumber dari Webometrics.

Keyword: h-index, citation, simple linier regression

I. Pendahuluan
Indeks-h (h-index) adalah indeks yang memberikan informasi produktivitas dan pengaruh seorang ilmuwan berdasarkan publikasi ilmiah yang dihasilkannya (Sidiropoulus, Katsaros & Manolopoulos, 2007). Hirsch (2007) mendefinisikan indeks-h sebagai jumlah publikasi ilmiah yang jumlah kutipannya lebih tinggi atau sama dengan h. Indeks ini merupakan sebuah indeks yang berguna untuk mengkarakterisasi output ilmiah seorang ilmuwan.

Pengukuran indeks-h cukup sederhana. Seorang ilmuwan memiliki indeks-h jika sebanyak h dari Np publikasi ilmiahnya memiliki setidaknya h sitasi dan publikasi ilmiah (NP-h) lainnya memiliki kurang atau sama dengan h sitasi (Hirsch, 2005). Kesederhanaan penghitungan ini merupakan alasan mengapa Hirsch (2005) mengusulkan metode pengukuran indeks-h sebagai indikator produktivitas dan pengaruh seorang ilmuwan. Indikator ini dalam prakteknya mudah diterapkan (Ball, 2005). Sejak diperkenalkan pada akhir tahun 2005, indikator ini telah mendapat perhatian besar baik dari komunitas ilmiah maupun dari masyarakat umum (Ruch & Ball, 2012).

Melalui metode pengukuran indeks-h, dapat diketahui bahwa indeks-h sangat dipengaruhi oleh jumlah publikasi ilmiah yang dihasilkan oleh seorang ilmuwan dan jumlah rujukan oleh ilmuwan lain terhadap publikasi ilmiah tersebut. Semakin banyak publikasi ilmiah seorang ilmuwan dan semakin banyak juga dirujuk oleh ilmuwan lain maka semakin tinggi indeks-h-nya.

Penelitian ini bertujuan untuk melihat bagaimana hubungan antara indeks-h dengan jumlah rujukan (sitasi). Data yang digunakan adalah data hasil peringkat Webometrics pada Bulan Mei 2015. Pada website Webometrics terdapat daftar nama 750 ilmuwan Indonesia yang diurutkan berdasarkan indeks-h dari yang tertinggi ke yang rendah. Webometrics (2015) mengukur indeks-h berdasarkan informasi dari Google Scholar. Data indeks-h ilmuwan yang digunakan pada penelitian ini adalah data indeks-h ilmuwan dari perguruan tinggi Universitas Gadjah Mada (UGM) dan Universitas Padjajaran (UNPAD). Kedua perguruan tinggi ini merupakan perguruan tinggi yang populer di Indonesia.

Alat analisis yang digunakan adalah analisis regresi linier sederhana dan korelasi. Model yang terbentuk dari analisis regresi linier sederhana merupakan model dengan parameter yang berbentuk linier. Model analisis ini sangat sederhana sehingga menyebabkan model ini mudah untuk dianalisis.

II. Metodologi
Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi variabel. Hubungan dalam korelasi belum dapat dikatakan sebagai hubungan sebab akibat. Korelasi dilambangkan dengan \(\rho\), sedangkan estimatornya \(r\). Estimasi \(\rho\) oleh \(r\) adalah \[ \rho=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}\sqrt{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2}} \] Pengujian tingkat korelasi dilakukan dengan hipotesis \(\text{H}_o:\rho=0\) dan \(\text{H}_1:\rho\neq0.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Persamaan model regresi linier sederhana adalah sebagai berikut. \[ Y=\beta_o+\beta_1x+\varepsilon \] Menurut Walpole, Myers, Myers dan Ye (1993), persamaan tersebut dapat diestimasi dengan metode kuadrat terkecil berdasarkan data berpasangan \((x_i,y_i),\) dimana \(i=1,2,3,\cdots,n.\) Estimasi \(\beta_o\) dan \(\beta_1\) adalah \(b_o\) dan \(b_1\) dimana \[ b_1=\frac{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\displaystyle\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}} \] dan \[ \begin {aligned} b_o&=\frac{\displaystyle\sum_{i=1}^ny_i-b_1\sum_{i=1}^nx_i}{n}\\ &=\bar{y}-b_1\bar{x} \end {aligned} \] Hasil estimasi persamaan model regresinya adalah \[ \hat{y}=b_o+b_1x \] Pengujian kelayakan parameter dari model regresi dilakukan dengan hipotesis \(\text{H}_o:\beta_j=0\) dan \(\text{H}_1:\beta_j\neq0,\) dimana \(j=0,1.\) Statistik ujinya adalah \[ t_{\text{hitung}}=\frac{b_j}{Se(b_j)} \] dimana \(\text{H}_o\) ditolak jika \(\left|t_{\text{hitung}}\right|>t_{\text{tabel}}\) atau \(\textit{p-value}<\alpha.\)

Untuk mengetahui seberapa besar pengaruh variabel independen dalam menjelaskan variabel independen digunakan koefisien determinasi \((R^2).\) \[ R^2=\frac{\displaystyle\sum_{i=1}^n\left(\hat{y}_i-\bar{y}\right)^2}{\displaystyle\sum_{i=1}^n\left(y_i-\bar{y}\right)^2} \] Model regresi yang telah terbentuk dengan metode kuadrat terkecil bisa dinilai baik jika residualnya berdistribusi normal. Pengujian residual berdistribusi normal bisa dilakukan menggunakan uji Kolmogorov-Smirnov dengan \(\text{H}_o\) : residual berdistribusi normal dan \(\text{H}_1\) : residual tidak berdistribusi normal. Statistik uji yang dignakan adalah \[ KS=\max\left\{\left|F_o(x)-S(x-1)\right|\right\};\left\{\left|S(x)-F_o(x)\right|\right\} \] Keputusan gagal menolak \(\text{H}_o\) jika \(KS<KS_\text{tabel}\) atau \(\textit{p-value}>\alpha.\)

Dalam penelitian ini, indeks-h merupakan variabel dependen \((y)\) sedangkan jumlah sitasi merupakan variabel independen \((x)\). Tingkat signifikansi \((\alpha)\) yang digunakan dalam penelitian ini adalah 5%.

III. Hasil pembahasan
Tabel 1 menyajikan eksplorasi data indeks-h ilmuwan UGM dan UNPAD. Dari 750 peringkat indeks-h profil ilmuwan di Indonesia versi Webometrics pada Mei 2015, UGM menempatkan sebanyak 66 ilmuwan di dalamnya, sedangkan UNPAD menempatkan sebanyak 25 ilmuwan. Rata-rata indeks-h ilmuwan UGM adalah 7,2424 sedangkan rata-rata indeks-h ilmuwan UNPAD adalah 7,3600. Indeks-h tertinggi dari ilmuwan UGM adalah 17, sedangkan dari UGM adalah 14.

Tabel 1. Eksplorasi data indeks-h

Perguruan Tinggi	Jumlah Ilmuan	Minimum	Maksimum	Rata-rata	Standar Deviasi
UGM	66	5	17	72,424	27,121
UNPAD	25	5	14	73,600	25,801

Selanjutnya Tabel 2. menyajikan eksplorasi data jumlah sitasinya. Rata-rata jumlah sitasi ilmuwan UGM adalah 448,9697 dan UNPAD 360,4800. Jumlah sitasi terbanyak di UGM adalah 5,745, sedangkan di UNPAD 2,513.

Tabel 2. Eksplorasi data jumlah sitasi

Perguruan Tinggi	Jumlah Ilmuan	Minimum	Maksimum	Rata-rata	Standar Deviasi
UGM	66	5	17	72,424	27,121
UNPAD	25	5	14	73,600	25,801

Korelasi antara indeks-h dengan jumlah sitasi di UGM adalah 0,579, sedangkan di UNPAD sebesar 0,733. Nilai \(\textit{p-value}\) kedua korelasi indeks-h dan jumlah sitasi tersebut lebih kecil dari \(\alpha\). Bentuk korelasi antara indeks-h dan jumlah sitasi masing-masing perguruan tinggi digambarkan dalam grafik plot data jumlah sitasi dan indeks h pada Gambar 1.

Dengan menggunakan metode kuadrat terkecil, model regresi yang terbentuk untuk UGM adalah \(\hat{y}=6\text{,}4235+0\text{,}0018x\) dengan koefisien determinasi 33,50%, sedangkan untuk UNPAD adalah \(\hat{y}=5\text{,}9809 +0\text{,}0038x\) dengan koefisien determinasi 53,70%.

Berdasarkan hasil uji kenormalan Kolmogorov-Smirnov, residual model regresi UGM tidak memenuhi asumsi normal, sedangkan residual UNPAD memenuhi asumsi normal.

Gambar 1. Plot data jumah sitasi dan indeks-h GAMBAR

IV. Pembahasan
UGM lebih banyak menempatkan posisinya di peringkat 750 ilmuwan Indonesia versi Webometrics dibandingkan dengan UNPAD. Begitu juga dengan indeks-h maksimum yang dimiliki oleh UGM lebih tinggi dari indeks-h maxsimum UNPAD. Namun begitu, rata-rata indeks-h ilmuwan UGM dan rata-rata indeks-h ilmuwan UNPAD yang berada di 750 peringkat Webometrics tersebut tidak berbeda terlalu jauh. Hal yang cukup berbeda adalah jumlah sitasi yang tertinggi, dimana jumlah sitasi tertinggi dari UGM jauh lebih tinggi dari jumlah sitasi tertinggi dari UNPAD, begitu juga dengan rata-rata jumlah sitasi UGM jauh lebih tinggi dari rata-rata jumlah sitasi UNPAD.

Korelasi antara indeks-h dan jumlah sitasi dan UGM ternyata tidak cukup tinggi, namun di UGM sudah bisa dibilang cukup. Kondisi ini berbeda jauh dari hasil penelitan Cronin & Meho (2006) yang menyatakan bahwa terdapat korelasi kuat dan positif antara indek-h dan jumlah sitasi.

Regresi untuk UGM tidak bisa dikatakan layak. Hal ini disebabkan karena residual dari model tersebut tidak berdistribusi normal. Sedangkan regresi untuk UNPAD sudah memenuhi asumsi kenormalan residual, begitu juga dengan asumsi kelayakan parameter. Dari model untuk UNPAD dapat diinterpretasikan bahwa setiap penambahan jumlah sitasi seorang ilmuwan dari UNPAD sebanyak 1 sitasi, maka akan meningkatkan indeks-h-nya sebanyak 0,0038. Namun begitu indeks-h yang mampu dijelaskan oleh jumlah sitasi hanya 53,70%.

V. Kesimpulan dan Saran
Korelasi indeks-h dan jumlah sitasi hasil penelitian ini tidak terlalu besar. Begitu juga dengan hubungan dalam regresinya tidak begitu kuat. Untuk penelitian selanjutnya bisa dilakukan dengan penambahan variabel penjelas, misalnya variabel jumlah publikasi ilmiah yang dihasilkan dan jumlah sitasi yang dilakukan ke publikasi sendiri. Dengan begitu diharapkan koefisien determinasi model menjadi lebih baik. Selain itu bisa juga dengan menggunakan metode analisis lain seperti regresi semiparametrik dan regresi nonparametrik.

Daftar Pustaka

Ball, P. (2005). Index aims for fair ranking of scientists. Nature, 436(7053), 900-900.
Cronin, B., & Meho, L. (2006). Using the h‐index to rank influential information scientistss. Journal of the American Society for Information Science and Technology, 57(9), 1275-1278.
Hirsch, J. E. (2005). An index to quantify an individual's scientific research output. Proceedings of the National academy of Sciences of the United States of America, 102(46), 16569-16572.
Hirsch, J. E. (2007). Does the h index have predictive power?. Proceedings of the National Academy of Sciences, 104(49), 19193-19198.
Ruch, S., & Ball, R. (2012). Various Correlations between the H-Index and Citation Rate (CPP) in Neuroscience and Quantum Physics: New Findings.International Journal of Information Science and Management (IJISM), 8(1), 1-19.
Sidiropoulos, A., Katsaros, D., & Manolopoulos, Y. (2007). Generalized Hirsch h-index for disclosing latent facts in citation networks. Scientometrics, 72(2), 253-280.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (1993). Probability and statistics for engineers and scientists (Vol. 5). New York: Macmillan.
Webometrics, (2015), Ranking of scientists in Indonesian Institutions according to their Google Scholar Citations public profiles, diakses Mei 2015, http://www.webometrics.info/en/node/96

Penulis: Rory, 2015

Search This Blog

Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)

Data Tunggal

Data Berkelompok

Tabel Distribusi Statistik

Uji Z

Uji t

Statistik Inferensial Lainnya

Search This Blog

Hubungan Antara Jumlah Sitasi (Citation) dan Indeks-h (h-index)

Artikel yang berhubungan:

Data Tunggal

Data Berkelompok

Tabel Distribusi Statistik

Uji Z

Uji t

Statistik Inferensial Lainnya