Skip to main content

Uji Kolmogorov Smirnov

Uji Kolmogorov Smirnov (KS) adalah alat uji statistik yang digunakan untuk menentukan apakah suatu sampel berasal dari suatu populasi yang memiliki sebaran data tertentu atau mengikuti distribusi statistik tertentu. Distribusi statistik yang sering diuji menggunakan uji KS adalah Distribusi Normal (apakah suatu berdistribusi normal).

Uji Kolmogorov Smirnov (KS) didasarkan pada Fungsi Distribusi Empiris (FDE). Jika diberikan \(N\) titik data terurutan yaitu \(Y_1, Y_2, ..., Y_N,\) maka FDE didefinisikan sebagai \[E_N = \frac{n_i}{N}\] \(n_i\) adalah jumlah titik yang kurang dari \(Y_i,\) dimana nilai \(Y_i\) adalah data yang telah diurutkan dari nilai yang terkecil hingga nilai yang terbesar. FDE adalah fungsi yang naik sebesar \(1/N\) pada setiap titik data.

Grafik di bawah ini adalah plot dari FDE dengan Fungsi Distribusi Kumulatif (FDK) Distribusi Normal untuk 100 bilangan acak normal. Garis berwarna hitam adalah FDE dan garis berwarna biru adalah FDK Distribusi Normal. Tes KS didasarkan pada jarak maksimum antara kedua kurva tersebut. Jika FDE mendekati FDK Distribusi Normal artinya sebaran data mengikuti Distribusi Normal.

Uji KS memiliki beberapa keterbatasan, yaitu:

  1. Ukuran sampel untuk pengujian KS sebaiknya sama atau lebih besar dari 30 \((N \geq 30).\)
  2. Data harus berskala interval atau ratio (kuantitatif).
  3. Hanya berlaku untuk pengujian pada distribusi kontinu (Distribusi Normal, Distribusi Eksponensial, Distribusi Chi-Square dan lain-lain).
  4. Cenderung lebih sensitif di bagian pusat distribusi daripada di bagian ujung fungsi distribusi kumulatif.
  5. Mungkin batasan yang paling serius adalah distribusi harus ditentukan sepenuhnya. Artinya, jika parameter lokasi, skala, dan bentuk diperkirakan dari data tersebut, maka wilayah kritis uji KS tidak lagi valid. Ini biasanya harus ditentukan dengan simulasi.

Langkah-langkah melakukan Uji Kolmogorov Smirnov:

  1. Hipotesis
  2. \(\text{H}_0 :\) Data mengikuti distribusi tertentu
    \(\text{H}_1 :\) Data tidak mengikuti distribusi tertentu
  3. Statistik Uji
  4. Statistik uji menggunakan \(D,\) yaitu nilai maksimum dari \(F(Y_i) - \frac{i-1}{N}\) atau \(\frac{i-1}{N} - F(Y_i).\) Secara matematis dapat ditulis menjadi \[D = \max_{1 < i < N}\left(F(Y_i) - \frac{i-1}{N}, \frac{i-1}{N} - F(Y_i) \right)\] dimana \(F(Y_i)\) adalah peluang distribusi kumulatif.
  5. Kaidah Keputusan
    • Terima \(\text{H}_0\) jika nilai \(D\) kecil dari nilai \(D_{N,\alpha}\) pada tabel Kolmogorov Smirnov \((D < D_{N,\alpha}).\)
    • Tolak \(\text{H}_0\) jika nilai jika nilai \(D\) sama atau lebih besar dari nilai \(D_{N,\alpha}\) pada tabel Kolmogorov Smirnov \((D_N \geq D_{N,\alpha}).\)
  6. Kesimpulan
    • Jika \(\text{H}_0\) diterima maka data mengikuti distribusi tertentu.
    • Jika \(\text{H}_0\) ditolak maka data tidak mengikuti distribusi tertentu.

CONTOH SOAL

Suatu penelitian dilakukan untuk mengetahui berat badan mahasiswa yang mengikuti pelatihan kebugaran fisik/jasmani. Banyaknya sampel penelitian adalah sebanyak 32 orang yang diambil secara random (acak). Data yang berat badan yang diperoleh dari penelitian tersebut adalah sebagai berikut ; 78, 78, 95, 90, 78, 80, 82, 77, 72, 84, 68, 67, 87, 78, 77, 88, 97, 89, 97, 98, 70, 72, 70, 69, 67, 90, 97, 88, 90, 77, 89, 69 kg. Selidikilah dengan \(\alpha = 5\%,\) apakah data berat badan mahasiswa diambil dari populasi mahasiswa yang berdistribusi normal?

PENYELESAIAN

1. Merumuskan Hipotesis

\(\text{H}_0 :\) Data berat badan mahasiswa mengikuti distribusi normal
\(\text{H}_1 :\) Data berat badan mahasiswa tidak mengikuti distribusi normal

2. Menghitung nilai \(D\)

Gunakan Microsoft Excel untuk melakukan penghitungan nilai \(D.\) Langkah penghitungan adalah sebagai berikut.

  • Hitung nilai Rata-rata dan Standar Deviasi
  • Masukkan data ke Microsoft Excel seperti gambar di bawah ini. Kemudian hitung rata-rata pada sel C35 menggunakan kode =AVERAGE(B2:B33) dan standar deviasi pada sel C36 menggunakan kode =STDEV(B2:B33).

  • Hitung nilai \(F(Y_i)\)
  • \(F(Y_i)\) dihitung pertama kali di sel C2 menggunakan kode =NORM.DIST(B2;$B$35;$B$36;TRUE) kemudian rumus tersebut berjalan dari C2 berjalan sampai dengan C33.

  • Hitung nilai \(F(Y_i) - \frac{i-1}{N}\) dan \(\frac{i-1}{N}\ - F(Y_i)\)
  • Hitung \(F(Y_i) - \frac{i-1}{N}\) pertama kali pada sel D2 dengan code =C2-((A2-1)/$A$33) kemudian rumus tersebut berjalan sampai dengan D33
    Selanjutnya hitung \(\frac{i-1}{N}\ - F(Y_i)\) pada sel D33 dengan kode =(A2/$A$33)-C2 kemudian rumus tersebut berjalan dari E2 sampai dengan E33.

  • Hitung nilai \(D\)
  • Nilai \(D\) dihitung dengan kode =MAX(D2:D33;E2:E33)

    Berdasarkan hasil penghitungan menggunakan Microsoft Excel di atas, diperoleh nilai \(D\) adalah 0.136873037.

3. Kaidah Keputusan

Jika nilai \(D\) < \(D_{32, 0\text{,}05}\) maka \(H_0\) diterima, jika nilai \(D\) ≥ \(D_{32, 0\text{,}05}\) maka \(\text{H}_0\) ditolak.

4. Kesimpulan

Berdasarkan hasil di atas, dapat disimpulkan bahwa nilai \(D\) adalah 0,136873037 < (0.2404163056), maka \(\text{H}_0\) diterima yang berarti bahwa data fisik/jasmani yang mengikuti pelatihan kebugaran berdistribusi normal.