Mengapa Varian dan Standar Deviasi Sampel Menggunakan n-1 | Rumus Statistik

Mengapa Varian dan Standar Deviasi Sampel Menggunakan n-1

Rata-rata populasi didefinisikan oleh \(\mu=\frac{1}{N}\sum_{i=1}^{N}X_i.\) Rata-rata populasi tersebut dapat diestimasi menggunakan rata-rata sampel yaitu \(\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i.\) Begitu juga dengan standar deviasi populasi \( \sigma=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(X_i-\mu)^2}\) dapat diestimasi menggunakan standar deviasi sampel yaitu \(S=\sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2}.\)

Pada rumus-rumus di atas, dapat kita ketahui bahwa pembagi pada rumus rata-rata populasi adalah \(N\) dan rata-rata sampel adalah \(n,\) sedangkan pembagi pada standar deviasi populasi adalah \(N\) dan standar deviasi sampel adalah \(n-1.\)

Salah satu pertanyaan yang sering ditanyakan mengenai standar deviasi adalah mengapa pembagi pada standar deviasi sampel adalah \(n-1\) dan bukan \(n?\)

Ada dua cara untuk menjawab pertanyan tersebut, yaitu dengan melakukan pembuktian secara teoritis dan pembuktian secara empiris. Pembuktian secara teoritis adalah dengan melakukan kajian terhadap rumus standar deviasi tersebut sedangkan pembuktian secara empiris adalah dengan melakukan kajian menggunakan data.

Pembuktian Secara Teoritis

Salah satu syarat estimator yang baik adalah tidak bias (unbiased). Penggunaan \(n-1\) pada rumus standar deviasi sampel sebenarnya dimaksudkan untuk memenuhi syarat dari estimator yang baik tersebut.

Apa itu estimator tak bias (unbiased estimator)?

Misalkan parameter populasi adalah \(\theta,\) maka kita mengharapkan parameter tersebut dapat diestimasi oleh estimator \(\hat\theta\) dengan bias sama dengan 0. \[ B[\hat\theta]=E[\hat\theta]-\theta=0 \] sehingga, \(E[\hat\theta]=\theta.\) Dengan demikian estimator \(\hat\theta\) disebut dengan estimator tak bias.

Sekarang kita akan membuktikan apakah menggunakan \(n\) atau \(n-1\) sebagai pembagi pada rumus standar deviasi sampel sehingga diperoleh standar deviasi sampel yang tak bias \((E[S]=\sigma).\) Untuk mempermudah pembuktian tersebut, kita akan menggunakan varian sebagai pengganti standar deviasi, dimana varian adalah kuadrat dari standar deviasi. Dengan demikian, pembuktian yang ingin ditunjukkan adalah \(E[S^2]=\sigma^2.\)

Pembuktian I : menggunakan pembagi \(n\) pada rumus standar deviasi. \[ \begin{align*} E[S_n^2]&=E\left[\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^2\right]\\ &=E\left[\frac{1}{n}\sum_{i=1}^{n}\left(X_i^2-2X_i\bar{X}+\bar{X}^2\right)\right]\\ &=E\left[\frac{1}{n}\sum_{i=1}^{n}X_i^2-\bar{X}^2\right]\\ &=\left(\frac{1}{n}n(\mu^2+\sigma^2)\right)-\left(\mu^2+\frac{\sigma^2}{n}\right)\\ &=\frac{(n-1)\sigma^2}{n} \end{align*} \] Dengan demikian, \(E[S_n^2]\neq\sigma^2,\) sehingga \(S_n^2\) adalah estimator yang bias.

Pembuktian II : menggunakan pembagi \(n-1.\) \[ \begin{align*} E[S_{n-1}^2]&=E\left[\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2\right]\\ &=E\left[\frac{1}{n-1}\sum_{i=1}^{n}\left(X_i^2-2X_i\bar{X}+\bar{X}^2\right)\right]\\ &=E\left[\frac{1}{n-1}\left(\sum_{i=1}^{n}X_i^2-n\bar{X}^2\right)\right]\\ &=\left(\frac{n}{n-1}\left(\mu^2+\sigma^2\right)\right)-\left(\frac{n}{n-1}\left(\mu^2+\frac{\sigma^2}{n}\right)\right)\\ &=\sigma^2 \end{align*} \] Dengan demikian, \(S_{n-1}^2\) adalah estimator yang tidak bias bagi \(\sigma^2\).

Catatan:
  1. \(\sigma^2=E(X^2)-\mu^2\)
  2. \(\sigma_{\bar{X}}^2=E(\bar{X}^2)-\mu^2\)
  3. \(\sigma_{\bar{X}}^2=\frac{\sigma^2}{n}\)


Pembuktian Secara Empiris

Sudah disebutkan sebelumnya bahwa salah satu syarat estimator yang baik adalah tidak bias. Sifat tak bias suatu estimator dapat diperiksa melalui data yaitu dengan mengevaluasi estimator setiap sampel yang mungkin pada suatu populasi. Estimator dikatakan tak bias apabila rata-rata dari seluruh estimator sampel tersebut sama dengan parameter populasi.

Misalkan banyaknya data populasi adalah \(3\) yaitu \(2, 4, 6.\) Mari kita cek rata-rata dan varian populasi tersebut. \[ \begin{align*} \mu&=\frac{1}{3}(2+4+6)=4\\ \sigma^2&=\frac{1}{3}\left({(2-4)}^2+{(4-4)}^2+{(6-4)}^2\right)\\ &=\frac{4+0+4}{3}\\ &=\frac{8}{3} \end{align*} \] Sekarang kita akan buktikan apakah dengan menggunakan pembagi \(n\) atau dengan \(n-1\) yang membuat varian sampel \(S^2\) menjadi tidak bias.

Jika dilakukan pengambilan sampel dengan pengembalian sebanyak 2 elemen dari populasi, maka banyaknya daftar sampel yang mungkin adalah sebanyak 9 (gunakan Aturan Perkalian (Ilmu Peluang)). Kita dapat menghitung rata-rata dan varian masing-masing dari setiap daftar sampel, yaitu

Daftar sampel yang mungkin Rata-rata sampel \((\bar{X})\) Varian sampel \((S_n^2)\) Varian sampel \((S_{n-1}^2)\)
(2, 2)200
(2, 4)312
(2, 6)448
(4, 2)312
(4, 4)400
(4, 6)512
(6, 2)448
(6, 4)512
(6, 6)600

Rata-rata dari semua rata-rata sampel \(\bar{X}\) sama dengan \[ \frac{2+3+4+3+4+5+4+5+6}{9}=\frac{36}{9}=4 \] sehingga rata-rata \(\bar{X}\) sama dengan \(\mu\). Dengan demikian, \(\bar{X}\) adalah estimator tak bias bagi \(\mu.\)

Rata-rata dari semua varian sampel \(S_n^2\) sama dengan \[ \frac{0+1+4+1+0+1+4+1+0}{9}=\frac{12}{9}=\frac{4}{3} \] sehingga rata-rata \(S_n^2\) tidak sama dengan \(\sigma^2\). Dengan demikian, \(S_n^2\) adalah estimator bias bagi \(\sigma^2.\)

Rata-rata dari semua varian sampel \(S_{n-1}^2\) sama dengan \[ \frac{0+2+8+2+0+2+8+2+0}{9}=\frac{24}{9}=\frac{8}{3} \] sehingga rata-rata \(S_{n-1}^2\) tidak sama dengan \(\sigma^2\). Dengan demikian, \(S_{n-1}^2\) adalah estimator tak bias bagi \(\sigma^2.\)

0 Komentar untuk "Mengapa Varian dan Standar Deviasi Sampel Menggunakan n-1"