Perbedaan Statistik Parametrik dan Nonparametrik

Berikut ini ditampilkan secara sederhana perbedaan statistik parametrik dan nonparametrik.

No
Statistik Paramerik
Statistik Nonparametrik
(1)
(2)
(3)
1
Memerlukan asumsi distribusi dari data yang digunakan. Biasanya distribusi data yang diperlukan adalah distribusi normal. Tidak memerlukan asumsi distribusi sehingga sebaran data bebas.
2
Memerlukan jenis data bersifat metrik (kuantitatif). Bisa dikatakan juga bahwa data yang digunakan hanya data dalam bentuk data interval atau rasio. Memerlukan data metrik (kuantitaif) dan nonmetrik (kualitatif). Atau bisa dikatakan bahwa data yang digunakan bisa dalam bentuk data nominal, ordinal, interval atau rasio.
3
Biasanya jumlah data yang digunakan lebih atau sama dengan 30 (data berukuran besar), sebab data yang lebih atau sama dengan 30 diasumsikan mengikuti teorema limit pusat (central limit teorema). Biasanya jumlah data yang digunakan kurang dari 30.

Diharapkan dengan mengetahui perbedaan statistik parametrik dan non parametrik di atas, maka kita dengan mudah bisa menentukan dengan tepat alat uji statistik apa yang akan digunakan dalam pengujian suatu kelompok data.

Mendeteksi Kemungkinan Adanya Outlier Dilihat Dari Rata-rata dan Median

Kadang hanya dengan melihat rata-rata dan median saja kita bisa mendeteksi kemungkinan adanya outlier pada sekelompok data. Caranya adalah dengan melihat jarak antara rata-rata dan median sekelompok data tersebut. Semakin jauh jarak antara rata-rata dan mediannya maka semakin besar kemungkinan adanya outlier dalam sekelompok data tersebut. Begitu juga sebaliknya.

Misalkan suatu kelompok data mempunyai rata-rata 14 dan median 5. Jika dilihat jarak antara rata-rata dan media sekelompok data tersebut, maka dimungkinkan adanya outlier karena jaraknya yang cukup jauh.

Mari kita periksa datanya: 3, 3, 4, 5, 6, 7, 70

Ternyata terdapat data yang cukup besar yaitu 70. Data tersebut menyebabkan rata-rata dari sekelompok data tersebut menjadi besar.

Coba bandingkan dengan data berikut ini: 3, 3, 4, 5, 6, 7, 7

Sekelompok data tersebut memiliki rata-rata 5 dan median 5. Tidak ada outlier dalam data tersebut, karena jarak rata-rata dan mediannya sangat dekat.

Jadi, cara sederhana ini, bisa kita gunakan sebagai langkah awal untuk mendeteksi adanya outlier dari sekelompok data. Untuk memastikan adanya outlier, maka kita bisa menggunakan metode mendeteksi outlier.

Distribusi Seragam Kontinu

Distribusi seragam kontinu adalah distribusi yang peluang setiap peubah acaknya sama.
Fungsi Padat Peluang


dimana a < x < b
a = batas bawah
b = batas atas

Mean
E(X) = (b + a)/2

Varian
Var(X) = (ba)2/12

Fungsi Pembangkit Momen


Fungsi Karakteristik


Fungsi Pembangkit Peluang
 

Distribusi Seragam Diskret

Distribusi seragam diskret merupakan distribusi yang semua peubah acaknya memiliki nilai peluang yang sama.

Fungsi Padat Peluang





Mean (µ)
E(X) = (n + 1) / 2

Varian
Var(X) = (n2 – 1) / 12

Fungsi Pembangkit Momen
Mx(t) = (et + e2t + e3t + ... + ent) / n

Fungsi Karakteristik
Cx(t) = eit + e2it + e3it + ... + enit

Fungsi Pembangkit Peluang
Gx(t) = (e1 + e2 + e3 + ... + en) / n

Distribusi Bernoulli

Percobaan Bernoulli adalah percobaan yang menghasilkan dua kemungkinan yaitu sukses (0) dan gagal (1).

Fungsi Padat Peluang



Mean (µ)
E(X) = p

Varian
Var(X) = p (1 - p)

Fungsi Pembangkit Momen (MGF)
Mx(t) = 1 – p + pet

Fungsi Karakteristik
Cx(t) = 1 – p + peit

Fungsi Pembangkit Peluang
Gx(t) = 1 – p + pet

Pengertian Ruang Sampel dan Titik Sampel

Ruang Sampel adalah himpunan dari semua hasil yang mungkin terjadi pada suatu percobaan/kejadian. Misalnya:
  1. Sebuah dadu dilempar ke atas, maka kemungkinan mata dadu yang muncul paling atas adalah 1, 2, 3, 4, 5 atau 6. Sehingga ruang sampel dari mata dadu yang muncul paling atas pada pelemparan sebuah dadu adalah 1, 2, 3, 4, 5 dan 6.
  2. Suatu pabrik memproduksi sejenis produk kesehatan. Kemungkinan produk yang dihasilkan adalah produk yang “cacat” dan “tidak cacat”. Sehingga ruang sampel dari sebuah produk yang dihasilkan oleh pabrik tersebut adalah produk yang "cacat" dan produk yang "tidak cacat".
  3. Sebuah koin dilempar ke atas. Setelah jatuh, maka kemungkinan sisi yang muncul paling atas adalah “Gambar” atau “Angka”. Sehingga ruang sampel dari sisi yang muncul pada pelemparan sebuah koin adalah "Angka" dan "Gambar".
Ruang sampel secara matematis biasanya dilambangkan dengan T. Sehingga ruang sampel pada contoh di atas bisa ditulis seperti di bawah ini.
  1. Ruang sampel sisi yang muncul pada sebuah dadu yang dilempar, T = {1, 2, 3, 4, 5, 6}
  2. Ruang sampel produk yang dihasilkan sebuah pabrik, T = {Cacat, Tidak Cacat}
  3. Ruang sampel sisi yang muncul pada sebuah koin yang dilempar, T = {Angka, Gambar}
Kemungkinan-kemungkinan yang akan muncul dalam ruang sampel disebut juga dengan Titik Sampel. Sehingga titik sampel merupakan unsur atau anggota dari ruang sampel.

Agar titik-titik sampel dalam suatu ruang sampel bisa tersusun dengan baik, maka pencatatannya bisa dibantu dengan menggunakan Diagram Pohon.

Uji Hipotesis Rata-rata Satu Populasi, Varian Tidak Diketahui (Uji t)

1. Hipotesis:

    1. dua arah
          Ho : µ = µo
          H1 : µ ≠ µo
    2. satu arah
          Ho : µ = µo
          H1 : µ > µ
          atau
          Ho : µ = µo
          H1 : µ < µo
      2. Penghitungan (Uji Statistik):

      3. Daerah kritis:
      1. dua arah : tα/2 (lihat tabel t)
      2. satu arah : tα (lihat tabel t)
      4. Keputusan:
      1. dua arah : tolak Ho jika t > tα/2 atau t < - tα/2
      2. satu arah
        untuk H1 : µ > µo, tolak Ho jika t > tα
        untuk H1 : µ < µo, tolak Ho jika t < tα
      Keterangan:
      µ = rata-rata populasi
      µo = rata-rata uji
       = rata-rata sampel
      s = standar deviasi (simpangan baku)
      n = jumlah sampel
      α = tingkat signifikansi

      Solusi Untuk Data yang Tidak Berdistribusi Normal

      Data yang berdistribusi normal atau mendekati normal adalah syarat wajib untuk melakukan analisis statistik parametrik. Biasanya pada data yang jumlah sampelnya sedikit (di bawah 30) sering tidak berdistribusi normal sehingga analisis statistik parametrik tidak bisa dilakukan. Solusi jika ingin melanjutkan analisis data tersebut adalah dengan menggunakan analisis statistik nonparametrik.

      Karena statistik parametrik lebih powerfull daripada statistik nonparametrik maka sebaiknya kita melakukan penambahan sampel agar distribusi data bisa mendekati kenormalan dan analisis statistik parametrik bisa dilakukan. Data yang jumlah sampelnya sudah mencapai ratusan atau ribuan biasanya sudah bisa dianggap normal sehingga kita tidak usah lagi melakukan uji kenormalan.

      Kadang pada kondisi tertentu penambahan sampel tidak bisa dilakukan. Hal ini bisa karena jika melakukan penambahan sampel maka akan memakan biaya yang cukup besar. Bisa juga karena kondisi waktu pendataan pada sampel tambahan sudah tidak sesuai lagi dengan kondisi waktu pendataan pada sampel sebelumnya.

      Jika keadaannya demikian, maka solusi lainnya adalah dengan mentransformasi data ke bentuk lain. Misalnya bentuk log x, ln x atau 1/x, kemudian data hasil transformasi tersebut diuji lagi kenormalannya. Jika ternyata data hasil transformasi masih tidak berdistribusi normal juga, maka melakukan analisis dengan statistik nonparametrik adalah solusi yang terbaik.

      Penggunaan Metode Statistik Untuk Penelitian

      Metode statistik ada dua, yaitu statistik deskriptif dan statistik induktif. Statistik deskriptif menjelaskan karakteristik dari data, seperti rata-rata, median, modus, simpangan baku, dan berbagai karakteristik data lainnya. Statistik deskriptif juga menjelaskan data dalam bentuk grafik agar data lebih mudah dipahami oleh pengguna data. Sedangkan statistik induktif merupakan metode untuk menarik inferensi mengenai populasi. Statistik induktif berupa penaksiran, pengujian hipotesis, peramalan dan lain-lain.

      Pada sebuah laporan hasil penelitian seperti skripsi, tesis atau lainnya yang mengandung data statistik, analisis di dalam hasil penelitian tersebut tidak terlepas dari metode statistik deskriptif. Di dalamnya akan terdapat tabel, grafik, dan angka-angka lain yang menyajikan penjelasan mengenai karakteristik data hasil penelitian. Selanjutnya jika ada penaksiran, pengujian atau peramalan di dalam penelitian tersebut maka maka akan terdapat pula analisis yang menggunakan metode statistik induktif.

      Jika lebih diperhatikan isi dari laporan penelitian maka metode statistik yang pertama disajikan adalah metode statistik dekriptif kemudian dilanjutkan dengan statistik induktif. Kedua-duanya sejalan dalam menjelaskan laporan penelitian.

      Jadi jelas sudah jika ingin membuat laporan penelitian seperti skripsi dan tesis maka kita tidak akan terlepas dari kedua metode statistik tersebut di atas. Dari awal pembuatan skripsi atau tesis sebaiknya kita sudah membayangkan bagaimana penyajian statistik deskriptifnya dan metode statistik induktif apa yang akan digunakan.

      Beberapa Pengertian Umum dalam Himpunan

      Pelajaran himpunan lebih mudah dipelajari bila digambarkan dalam Diagram Venn. Diagram Venn adalah diagram yang menggambarkan hubungan antara kejadian-kejadian dan semestanya. Untuk mempelajari lebih jauh mengenai himpunan lebih baik kita terlebih dahulu mengetahui konsep-konsep umum dalam himpunan.

      Ruang Sampel adalah semua hasil yang memiliki kemungkinan terjadi dalam suatu percobaan. Ruang sampel biasanya diberi lambang S atau T.

      Kejadian adalah himpunan bagian dari ruang sampel. Biasanya diberi dengan lambang A, B atau huruf kapital lainnya selain lambang ruang sampel (S).

      Komplemen adalah himpunan yang unsur-unsur bukan unsur kejadian.Misalkan S = {1, 2, 3, 4, 5, 6} dan A = {2, 4} maka komplemen dari A adalah yang bukan A yaitu A' = { 1, 3, 5,6}.

      Irisan (∩) adalah semua unsur kejadian yang masuk ke dalam sebuah himpunan dan juga masuk ke dalam himpunan lainnya. Misalkan S = {1, 2, 3, 4, 5, 6}, A = {2, 4} dan B = {1, 4, 6}, maka irisan dari A dan B adalah A∩B = {4}.

      Gabungan (U) adalah semua unsur yang ada dalam dua atau lebih himpunan. Misalkan S = {1, 2, 3, 4, 5, 6}, A = {2, 4} dan B = {1, 4, 6}, maka gabungan dari A dan B adalah AUB = {1, 2, 4, 6}.