Varian dan Standar Deviasi (Simpangan Baku)

Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar kuadrat dari varian.


Oleh karena itu, jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.

Penghitungan

Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.


Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.


Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n).


Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka n sebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi: 


Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).


Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan :

Rumus varian :


Rumus standar deviasi (simpangan baku) :


Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
 = rata-rata
n = ukuran sampel


Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung komponen untuk rumus varian.


Dari tabel tersebut dapat ketahui:

 

Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.


Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian.


Hasil tersebut bisa dibuktikan dengan menggunakan Microsoft Excel. Lihat artikel:

Rata-rata Hitung (Mean)

Rata-rata atau Mean adalah ukuran statistik kecenderungan terpusat sama halnya seperti Median dan Modus.

Rata-rata ada beberapa macam, yaitu rata-rata hitung (aritmatik), rata-rata geometrik, rata-rata harmonik dan lain-lain. Tetapi jika hanya disebut dengan kata "rata-rata" saja, maka rata-rata yang dimaksud adalah rata-rata hitung (aritmatik).

Penghitungan

Penghitungan rata-rata dilakukan dengan menjumlahkan seluruh nilai data suatu kelompok sampel, kemudian dibagi dengan jumlah sampel tersebut. Jadi jika suatu kelompok sampel acak dengan jumlah sampel n, maka bisa dihitung rata-rata dari sampel tersebut dengan rumus sebagai berikut.


Jika dinotasikan dengan notasi sigma, maka rumus di atas menjadi:


Keterangan:
 = rata-rata hitung
xi = nilai sampel ke-i
n = jumlah sampel

Contoh Penghitungan

Misalkan kita ingin mengetahui rata-rata tinggi badan siswa di suatu kelas. Kita bisa mengambil sampel misalnya sebanyak 10 siswa dan kemudian diukur tinggi badannya. Dari hasil pengukuran diperoleh data tinggi badan kesepuluh siswa tersebut dalam ukuran sentimeter (cm) sebagai berikut.

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data di atas dapat dihitung rata-rata dengan menggunakan rumus rata-rata :


sehingga


Dari hasil penghitungan, bisa diambil kesimpulan bahwa rata-rata tinggi badan siswa di kelas tersebut adalah 170,1 cm. Hasil tersebut bisa dibuktikan dengan menggunakan Microsoft Excel di halaman Menghitung Rata Dengan Microsoft Excel.

Contoh Soal No. 1

Hitunglah rata-rata dari data 6, 6, 4, 6, 2, 5, 5, 6, 7, 6, 8!

Jawab:

Dari data tersebut dapat kita ketahui bahwa jumlah data adalah 11 (n = 11). Dengan menggunakan rumus kita dapat menghitung rata-ratanya.


Rata-rata dari data tersebut adalah 5,55.

Contoh Soal No. 2

Diberikan data sebagai berikut: 4, 3, 5, 4, 6, 3, 6, 7, 8, 7, 8, 8. Hitunglah rata-ratanya!

Jawab:

Jumlah data di atas adalah sebelas (n = 11). Rata-rata


Rata-rata dari data tersebut adalah 5,75.

Contoh Soal No. 3

Rata-rata nilai ujian matakuliah statistika 29 orang mahasiswa adalah 70. Ketika nilai ujian matakuliah statistika milik Andi  digabungkan dengan nilai-nilai mahasiswa tersebut, rata-rata nilai naik menjadi 71. Berapakah nilai Andi tersebut?

Jawab:

Soal tersebut dapat diselesaikan dengan menambahkan total keseluruhan nilai mahasiswa dengan nilai Andi kemudian dibagi dengan jumlah mahasiswa yang nilainya dijumlahkan (termasuk Andi).

Dari soal diketahui jumlah mahasiswa sebelum nilai Andi dimasukkan adalah 29 (n = 29) dan rata-ratanya adalah 70 ( = 70). Total keseluruhan nilai mahasiswa sebelum nilai Andi dimasukkan adalah


Dengan masuknya nilai Andi, jumlah mahasiswa bertambah menjadi 30 (n = 30) dan rata-rata nilainya naik menjadi 71 ( = 71). Selanjutnya nilai Andi dapat diketahui dengan memasukkan komponen yang baru tersebut pada rumus rata-rata.


Dengan demikian, nilai rata-rata Andi adalah 100.

Contoh Soal No. 4

Berikut ini adalah data nilai mahasiswa untuk mata kuliah statistika, nilai mahasiswa diurutkan dari yang terendah ke yang tertinggi: 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 9. Menurut pertimbangan dosen, mahasiswa harus mengulang ujian kembali untuk memperbaiki nilai apabila nilai yang mereka dapatkan berada di bawah rata-rata. Berapa orangkah yang harus memperbaiki nilainya tersebut?

Jawab:

Sebelum menghitung jumlah mahasiswa yang harus memperbaiki nilainya, kita harus menghitung dulu rata-rata nilai tersebut. Diketahui banyaknya data adalah 20 (n = 20), sehingga nilai rata-ratanya dapat dihitung sebagai berikut.


Rata-rata nilai mahasiswa adalah 6, dengan demikian mahasiswa yang harus mengulang ujian adalah mahasiswa yang nilainya berada di bawah 6. Jumlah mahasiswa yang nilainya di bawah 6 adalah 8 orang.

Contoh Soal No. 5

Sebuah keluarga memiliki 8 orang anak, yaitu A, B, C, D, E, F, G, H. Umur A adalah 2x + 1 tahun, umur B adalah x + 1 tahun, umur C, D, E, F, G dan H berturut-turut adalah x + 2, x + 3, x + 4, x + 5, x + 6 dan x + 7 tahun. Jika rata-rata umur semua anak tersebut adalah 7. Berapakah umur A?

Jawab:

Umur A adalah 2x + 1, dimana untuk menghitungnya, nilai x harus kita ketahui terlebih dahulu. Dari soal diketahui rata-rata umur adalah 7 dan banyaknya data adalah 8 (n = 8). Jika komponen-komponen yang diketahui dalam soal di atas dimasukkan ke dalam rumus rata-rata, maka


Nilai x adalah 3, dengan demikian umur A adalah 2(3) + 1 =  7 tahun.

Perubahan Jumlah Penduduk

Perubahan jumlah penduduk di suatu wilayah disebabkan oleh 3 komponen, yaitu fertilitas (kelahiran), mortalitas (kematian) dan migrasi (perpindahan penduduk).

Pt = Po + (B – D) + (I – E)

Keterangan:
Pt = penduduk pada tahun t (penduduk yang akan dihitung jumlahnya)
Pt = jumlah penduduk pada tahun dasar
B = jumlah kelahiran
D = jumlah kematian
I = jumlah migrasi masuk
E = jumlah migrasi keluar

Baca juga:
  1. Laju Pertumbuhan Penduduk Geometrik
  2. Laju Pertumbuhan Penduduk Eksponensial

Jangkauan atau Rentang (Range)

Dalam sekelompok data kuantitatif akan terdapat data dengan nilai terbesar dan data dengan nilai terkecil. Rentang (range) atau disebut juga dengan jangkauan adalah selisih antara data dengan nilai yang terbesar dengan data denga nilai yang terkecil tersebut. \[R = x_{max} - x_{min}\] dimana $R$ adalah range (jangkauan atau rentang), $x_{max}$ adalah nilai data yang paling besar dan $x_{min}$ nilai data yang paling kecil.

Contoh Soal No. 1

Hitunglah rentang dari data \[20, 21, 19, 17, 20, 21, 23, 24, 25\] Jawab:

Data terbesar ($x_{max}$) adalah 25 dan data terkecil ($x_{min}$) adalah 17. Dengan demikian, rentang/jangkauan adalah \begin{align*} R &= x_{max} - x_{min}\\ &= 25 - 17\\ &= 8 \end{align*}
Contoh Soal No. 2

Nilai ujian akhir matakuliah statistika mahasiswa adalah \[70, 72, 69, 67, 54, 60, 49, 75, 59, 63\] Hitunglah range dari data tersebut!

Jawab:

Dari data tersebut diperoleh $x_{max}=75$ dan $x_{min}=49$. Range data tersebut adalah \begin{align*} R &= x_{max} - x_{min}\\ &= 75 - 49\\ &= 26 \end{align*}
Contoh Soal No. 3

Data banyaknya mobil yang lewat pada suatu jalan tiap jamnya adalah \[51, 35, 29, 57, 21, 40, 25, 47, 25, 53, 48, 43, 27, 34, 37\] Berapakah range dari data tersebut?

Jawab:

Diketahui $x_{max}=57$ dan $x_{min}=21$. Range data tersebut adalah \begin{align*} R &= x_{max} - x_{min}\\ &= 57 - 21\\ &= 36 \end{align*}

Distribusi Beta

Distribusi beta digunakan sebagai penaksiran kasar dari suatu missing data distribusi dari suatu proporsi.

Fungsi Padat Peluang
dimana a > 0 dan b > 0 dan fungsi beta B(a,b) adalah
Baca: Fungsi Beta
Mean
E(X) = a (b + a)-1

Varian
Var(X) = ab (a + b + 1)-1 (ba)-2
Baca: Nilai Harapan Distribusi Beta
Fungsi Pembangkit Momen


Fungsi Karakteristik
 

Distribusi Weibull

Distribusi Weibull biasanya digunakan untuk menyelesaikan masalah-masalah yang menyangkut lama waktu (umur) suatu objek yang mampu bertahan hingga akhirnya objek tersebut tidak berfungsi sebagaimana mestinya (rusak atau mati).

Distribusi Weibull memiliki parameter λ dan k, dimana parameter λ dan k tersebut lebih besar dari 0.

Fungsi Kepadatan Peluang


Fungsi distribusi kumulatif dari distribusi Weibull adalah


dimana λ > 0 adalah parameter bentuk dan k > 0 adalah parameter skala. Fungsi kepadatan peluangnya adalah turunan dari fungsi distribusi kumulatifnya tersebut.


dengan demikian dapat didefinisikan fungsi kepadatan peluangnya adalah


Mean dan varian distribusi Weibull adalah


Mean dan Varian


Mean dan varian dari distribusi Weibull dapat diperoleh dengan metode momen. Proses metode momen untuk mendapatkan mean dan varian adalah sebagai berikut.

Mean


Mean diperoleh dari momen pertama E(X) = µ.


pada persamaan tersebut di misalkan


maka persamaan tersebut akan menjadi


Selanjutnya disubstitusikan dengan fungsi Gamma (baca kembali Fungsi Gamma), dimana pada fungsi Gamma


dengan demikian mean distribusi Weibull adalah


Varian


Varian diperoleh persamaan


untuk menyelesaikan persamaan tersebut harus diketahui terlebih dahulu momen kedua E(X2).


hampir sama dengan penyelesaian pada momen pertama, pada persamaan di atas juga dimisalkan


Sehingga persamaannya menjadi


Selanjutnya, dapat diketahui varian dari distribusi Waibull adalah


Distribusi Khi-Kuadrat (Chi Square)

Jika parameter α pada distribusi gamma diganti menjadi v/2, dan β diganti menjadi 2, dimana v adalah bilangan bulat positif, maka distribusi gamma tersebut akan menjadi distribusi khi-kuadrat.
Baca: Distribusi Gamma dan Fungsi Gamma
Distribusi khi-kuadrat ini memiliki parameter tunggal yaitu v, atau disebut juga dengan derajat kebebasan.

Fungsi Kepadatan Peluang

Mean
µ = v

Varian
σ2 = 2v
Baca: Nilai Harapan Distribusi Khi-Kuadrat
Fungsi Pembangkit Momen (MGF)
Mx(t) = (1 – 2t)-v/2
Baca: MGF Distribusi Khi-Kuadrat
Fungsi Karakteristik
Cx(t) = (12it)-v/2

Fungsi Pembangkit Peluang
Gx(t) = (1 – 2 ln t)-v/2

Rasio Beban Tanggungan (Dependency Ratio)

Rasio beban tanggungan atau disebut juga rasio tanggungan keluarga adalah perbandingan antara jumlah penduduk usia tidak produktif (penduduk usia muda dan penduduk usia lanjut) dengan jumlah penduduk usia produktif.





P0-14 = Penduduk usia muda (0-14 tahun)
P65+ = Penduduk usia lanjut (65 tahun ke atas)
P15-64 = Penduduk usia produktif (15-64 tahun)

Distribusi Eksponensial

Distribusi eksponensial diterapkan dalam teori reliabilitas (waktu tahan), waktu tunggu, masalah antrian dan lain-lain.

Fungsi Padat Peluang

Mean
E(X) = θ-1

Varian
Var(X) = θ-2
Baca:
  1. Nilai Harapan Distribusi Eksponensial
  2. Estimasi Parameter pada Distribusi Eksponensial dengan Metode MLE
Fungsi Pembangkit Momen (MGF)
Mx(t) = θ (θ – t)-1
Baca: MGF Distribusi Eksponensial
Fungsi Karakteristik
Cx(t) = θ (θ – it)-1

Fungsi Pembangkit Peluang
Gx(t) = θ (θ – ln t)-1

Distribusi Gamma

Distribusi gamma diaplikasikan dalam lamanya waktu untuk menyelesaikan pekerjaan. Distribusi gamma sering diterapkan dalam teori antrian dan teori reabiliti.

Fungsi Padat Peluang






dimana α > 0 dan β > 0

Mean
E(X) = αβ

Varian
Var(X) = αβ2

Fungsi Pembangkit Momen
Mx(t) = (1 – βt)-α

Fungsi Karakteristik
Cx(t) = (1 – βit)-α

Fungsi Pembangkit Peluang
Gx(t) = (1 – β ln t)-α

Baca juga:
  1. Fungsi Gamma
  2. Estimasi Parameter Pada Distribusi Gamma Dengan Metode MLE
  3. Nilai Harapan Distribusi Gamma
  4. MGF Distribusi Gamma