Varian dan Standar Deviasi (Simpangan Baku)

Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar kuadrat dari varian. \[s=\sqrt{s^2}\] Oleh karena itu, jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.

Penghitungan

Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.


Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.


Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n).


Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka n sebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi: 


Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).


Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan :

Rumus varian :


Rumus standar deviasi (simpangan baku) :


Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
 = rata-rata
n = ukuran sampel


Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung komponen untuk rumus varian.


Dari tabel tersebut dapat ketahui:

 

Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.


Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian.


Hasil tersebut bisa dibuktikan dengan menggunakan Microsoft Excel. Lihat artikel:

41 Responses to "Varian dan Standar Deviasi (Simpangan Baku)"

  1. sumber dari mana gan ? butuh buat tugas nih

    BalasHapus
    Balasan
    1. Sumber referensi sendiri aja gan, dari catatan-catatan kuliah. Referensi yang bisa saya sarankan adalah "Statistik: Teori dan Aplikasi" oleh J. Supranto.

      Hapus
    2. Kalo datanya n =60 , gimana cara hitungnya?

      Hapus
    3. Kalau n = 60, rumusnya tetap sama.

      Hapus
  2. kalau simpangan baku untuk satu data saja, apakah itu nol min ??

    BalasHapus
    Balasan
    1. Betul gan. Tapi secara statistik, sampel jangan hanya satu gan. Setidaknya lebihlah dari dua, semakin banyak sampel semakin baik untuk mengestimasi populasi.

      Hapus
  3. Kegunaan standar deviasi ini apa ya mas? Misal nilainya 9, atau 0, gitu pengaruhnya apa?

    BalasHapus
    Balasan
    1. Standar deviasi digunakan untuk mengetahui keragaman data. Misalnya rata-rata nilai matematika siswa kelas 1 adalah 70 dengan standar deviasi adalah 0. Maka dari informasi tersebut bisa dipastikan bahwa seluruh nilai matematika siswa adalah 70.

      Jika standar deviasinya kecil maka nilai siswa berada di sekitar nilai 70. Makin besar standar deviasi, semakin beragam data tersebut. Jika standar deviasinya besar, maka bisa saja ada siswa yang mendapat nilai 0 dan ada juga yang mendapat nilai 100.

      Hapus
  4. gan kalau misalnya untu menghitung SD dari rentang usia itu yg menjadi Xi nya apa?

    BalasHapus
    Balasan
    1. Yang menjadi Xi tentu saja usianya.

      Hapus
    2. berarati total jumlah usianya? bukan frekuensi dari rentang usianya?

      Hapus
    3. Maaf,datanya data tunggal atau data berkelompok?

      Hapus
  5. bedanya data sample sama populasi apa ya?

    BalasHapus
    Balasan
    1. Untuk memahami perbedaan data pupulasi dan sampel, silakan baca dahulu artikel Populasi dan Sampel Populasi dan Sampel. Silakan ditanya lagi jika masih belum mengerti. Terimakasih.

      Hapus
  6. Saya mau tanya kalo mau uji hipotesis terus datanya tidak berdistribusi normal itu gimna ya? Hipotesis sy berbentuk komparatif

    BalasHapus
    Balasan
    1. Coba gunakan uji statistik nonparametrik.

      Hapus
    2. Saya mau tanya kenapa data yang kita uji harus berdistribusi normal? maksud dan pengertian distribusi normal dalam uji statistik gimana ya?

      Hapus
    3. Karena tabel distribusi yang kita gunakan adalah tabel normal.

      Dalam blog ini sudah banyak dibahas mengenai distribusi normal. Silahkan dipelajari..

      Hapus
  7. ini data tunggal min??

    BalasHapus
    Balasan
    1. Betul, datanya adalah data tunggal.

      Hapus
  8. Maaf,10.289613 ini dapatnya dari mana����

    BalasHapus
    Balasan
    1. 10.289613 maksudnya adalah 10 × 289613. 10 adalah banyaknya sampel (n) dan 289613 adalah ∑ xi kuadrat.

      Hapus
  9. maaf mas mau tanya, data tunggal dan data kelompok itu maksudnya bagaimana ??

    BalasHapus
    Balasan
    1. Data tunggal adalah data yang disajikan per unit, misalnya data nilai ujian siswa: 50, 74, 81, 59, 73, 83, 52, 45, 65, 90; sedangkan data berkelompok adalah data yang disajikan perkelompok interval, misalnya: \begin{matrix}
      \textrm{Interval} & \textrm{Frekuensi} (f_{i})\\
      41 - 60 & 3\\
      61 - 80 & 4\\
      81 - 100 & 3
      \end{matrix}

      Hapus
  10. gan untuk mencari nilai R square, lebih bagus dirata-ratain ada standar deviasinya tetapi sampelnya hanya 5 atau tidak usah dirata-ratain tetapi sampelnya ada 20?

    BalasHapus
    Balasan
    1. Maaf, yang agan maksudkan masih kurang jelas. Buat saya jika sampel lebih banyak maka akan semakin baik.

      Hapus
  11. Maksudnya data tunggal apa min?

    BalasHapus
    Balasan
    1. Coba lihat beberapa komentar sebelum komentar ini. Di sana telah saya jelaskan tentang data tunggal dan data berkelompok.

      Hapus
  12. kak aku hasilnya negatif ?
    ada ya hasilnya negatif?

    BalasHapus
    Balasan
    1. Tidak mungkin, pasti salah perhitungann. Coba periksa kembali cara menghitungnya.

      Hapus
  13. kak mau nanya, saya sedang menulis proposal penelitian yang berkaitan dengan keluhan muskuloskeletal pada pemahat katu dan pelukis di suatu kecamatan, saya disarankan untuk memakai rumus besaran sampel yg berisi selisih rerata populasi, di rumus tersebut juga berisi harga varian populasi, yang mau saya tanyakan dimana kita dapat nilai dari harga varian populasi ? sedangkan saya tidak tau jumlah keseluruhan pemahatkayu dan pelukis di kecamatan tersebut, mohon bantuannya . terima kasih

    BalasHapus
    Balasan
    1. Varian populasi bisa kita tetapkan sendiri misalnya berdasarkan informasi dari penelitian-penelitian sebelumnya.

      Jika kita tidak mengetahui varian populasi, kita masih bisa menggunakan uji selisih rata-rata dimana varian populasinya tidak diketahui.

      Hapus
  14. Kak mau tanya, untuk standar deviasi itu bisa atau tidak menggunakan 2 data saja ?
    Untuk n-1 . saya lagi membuat penelitian dgn menggunakan indeks eckel , saya masih bingung dalam perhitungan per tahun.

    Mohon bantuannya kak..terimakasih

    BalasHapus
    Balasan
    1. Dengan menggunakan rumus bisa saja dihitung, tetapi berdasarkan teori statistik, jumlah data minimal sebaiknya adalah 3.

      Hapus
  15. Kak? Kenapa standar deviasi itu tidak akan berubah nilainya jika data tersebut hanya di operasikan penjumlahan atau pengurangan. Contoh nya seperti apa?

    BalasHapus
    Balasan
    1. Karena jika data dijumlahkan, jarak antar data tetap sama. Misalnya data 1, 2 dan 3, standar deviasinya adalah 1. Ketika datanya dijumlahkan dengan 10, maka akan terbentuk data baru, yaitu 11, 12 dan 13. Standar deviasi data baru tersebut sama dengan standar deviasi data sebelumnya, yaitu 1.

      Hapus
  16. Itu kan contohnya varian data tunggal..? Tolomg min kasih contoh mencari varian data klompok. Thanks

    BalasHapus
  17. Kak mau tanya gimana jika nilai standar deviasi ulangan 1,2,3 dalam 1 perlakuan lebih besar dari rata2 apakah hasil penelitian kita akurat

    BalasHapus
  18. saya mau tanya pnelititan saya tentang kadar kolesterol,dan saya sedang mencari besar sampel menggunakan varian. yg menjadi varian saya jumlah populasinya atau kadar kolesterolnya ?

    BalasHapus
  19. Rumus diatas udah termasuk varian, standar deviasi, sama koefisien standar deviasinya ya?

    BalasHapus
  20. Adakah yang bisa membantu menyelesaikan soal ini ..????
    Materi : Data Kelompok (Kuartil,Desil,
    dan Persentil)
    Cari S^2 dan S dari data :
    42,5 38,7 40,6 52,7 21,4 16,3 25,8
    Dengan diketahui :
    BB=24 P=8 banyak kelas=7 sigma F=80
    Mkdh sebelumnya,,,

    BalasHapus