Central Limit Theory

Rata-rata sampel acak dari suatu populasi memiliki nilai yang diharapkan μ dan standar deviasi σ(n) dengan μ dan σ adalah parameter populasi.

library(dplyr)
library(haven)
library(here)
library(tidyverse)
library(ggplot2)
library(ggrepel)
library(stargazer)
library(visreg)
library(kableExtra)
library(reshape2)
library(fBasics)
library(questionr)
library(ggmosaic)
library(pander)
library(DescTools)
library(conf)
n <- 25; curve(dnorm(x, mean=0, sd=1/sqrt(n)), -3, 3,
xlab="x", ylab="Densities of sample mean", bty="l")
n <- 5; curve(dnorm(x, mean=0, sd=1/sqrt(n)), add=TRUE)
n <- 1; curve(dnorm(x, mean=0, sd=1/sqrt(n)), add=TRUE)

Normal parent population

Ketika sampel X1, X2, X3,…, Xn diperoleh dari populasi Normal (μ, σ), X¯ berdistribusi normal. Gambar diatas menunjukkan kepadatan populasi dan distribusi sampel dari X¯ untuk n = 5 dan n = 25 ketika μ=0 dan σ=1.

Dari gambar terlihat seiring betambahnya n, X¯ semakin kecil. Jika ukuran sampel bertamah 4 kali lipat, maka standar deviasinya 12 dari populasi.

Kepadatan terkonsentrasi pada mean. Semakin besar probablitas, nilai acak X¯ semakin dekat dengan mean. Hal ini dikenal dengan hukum bilangan besar (law of large numbers). Misalnya tinggi wanita dewasa berdistribusi normal dengan rata-rata 65 inci dan standar deviasi 2,2 inci. Rata-rata 20 wanita dewasa dipilih secara acak dan diperoleh rata-rata yang sama tetapi standar deviasi lebih besar 15 kali. Perbandingan probabilitas rata-rata antara sampel 64 dan 65 dengan individu adalah:

mu <- 65; sigma <- 2.2; n <- 20
pnorm(65, mu, sigma/sqrt(n)) - pnorm(64, mu, sigma/sqrt(n)) # rata-rata
[1] 0.4789631
pnorm(65, mu, sigma) - pnorm(64, mu, sigma) # individu
[1] 0.1752819

Non normal parent population

Central limit theory menyatakan bahwa setiap populasi induk (parent population) dengan rata-rata μ dan standar deviasi σ, distribusi sampel dari X¯ untuj jumlah populasi (n) yang besar adalah

PX¯μσ/nbP(Zb)

Contoh:

Waktu yang dibutuhkan untuk mencuci mobil bervariasi. Checker mrmiliki rata-rata historis waktu mencuci satu jam per mobil, dengan standar deviasi satu jam. Jika terdapat 30 mobil yang dicuci, berapa probabilitas rata-rata mencuci mobil 0.9 jam atau kurang? Kami berasumsi bahwa setiap waktu mencuci memiliki populasi induk yang tidak ditentukan dengan μ=1 dan σ=1, dan urutan waktu pencucian mobil acak, serta n cukup besar sehingga X¯ kira-kira berdistribusi Normal(μ,σ/30). Sehingga P(X¯0.9) adalah

pnorm(0.9, mean=1, sd = 1/sqrt(20))
[1] 0.3273604

Tredapat konsekuensi lain dari teorema limit pusat. Misalnya jika kami mengganti σ dengan standar deviasi sampel s dan X¯ distandarisasi maka

PX¯μs/nbP(Zb)