Distribusi Frekuensi

Distribusi Frekuensi

Distribusi frekuensi adalah tabel yang menunjukkan atau melaporkan jumlah pengamatan ke dalam setiap kategori variabel penelitian (Frankfort-Nachmias, Leon-Guerrero, and Davis 2019).

Tabel distribusi frekuensi sederhana dicontohkan seperti pada seperti Table 1 dan Table 2.

Distribusi Frekuensi Variabel Nominal

Distribusi frekuensi variabel nominal dicontohkan seperti pada Table 1

wvs |> 
  count(jenis_kelamin) |> 
  gt() |>
  cols_label(jenis_kelamin = "Jenis kelamin",
             n = "Frekuensi") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(
    source_note = "Sumber: Data WVS 7")
Table 1: Frekuensi responden berdasarkan jenis kelamin
Jenis kelamin Frekuensi
Laki-laki 1314
Perempuan 1569
Sumber: Data WVS 7

Distribusi Frekuensi Variabel Ordinal

wvs |> 
  count(bahagia_recode) |> 
  mutate(bahagia_recode = factor(bahagia_recode, c("Tidak bahagia sama sekali",
                                                   "Tidak begitu bahagia",
                                                   "Cukup bahagia",
                                                   "Sangat bahagia"))) |> 
  arrange(desc(bahagia_recode)) |> 
  gt() |>
  cols_label(n = "Frekuensi",
             bahagia_recode = "Kebahagiaan") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(
    source_note = "Sumber: Data WVS 7") %>%  
  cols_align(align = "left",
             columns = bahagia_recode)
Table 2: Frekuensi responden berdasarkan kebahagiaan
Kebahagiaan Frekuensi
Sangat bahagia 1277
Cukup bahagia 1450
Tidak begitu bahagia 133
Tidak bahagia sama sekali 23
Sumber: Data WVS 7

Distribusi Frekuensi Variabel Interval

wvs |> 
  mutate(`Usia` = case_when(usia <= 30 ~ "18-30",
                                   usia <= 50 ~ "31-50",
                                   usia <= 70 ~ "51-70",
                                   usia > 70  ~ ">70")) |> 
  count(`Usia`) |> 
  gt() |> 
  cols_label(n = "Frekuensi") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(source_note = "Sumber: Data WVS 7")
Table 3: Frekuensi responden berdasarkan interval usia
Usia Frekuensi
18-30 859
31-50 1492
51-70 504
>70 28
Sumber: Data WVS 7

Proporsi dan Persentase

Proporsi

Proporsi frekuensi (\(p\)) diperoleh dengan membagi frekuensi setiap kategori (\(f\)) dengan total pengamatan (\(N\)):

\[ p = \frac{f} {N} \]

Frekuensi responden yang berjenis kelamin laki-laki adalah

\[ p_{laki-laki} = \frac {1314} {2883}=0.456 \]

Sedangkan frekuensi responden yang berjenis kelamin perempuan adalah

\[ p_{perempuan} = \frac {1569} {2883}=0.544 \]

wvs |> 
  count(jenis_kelamin) |> 
  mutate(Proporsi = round(n / sum(n), 2)) |> 
  gt() |>
  cols_label(jenis_kelamin = "Jenis kelamin",
             n = "Frekuensi") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(
    source_note = "Sumber: Data WVS 7")
Table 4: Proporsi responden berdasarkan jenis kelamin
Jenis kelamin Frekuensi Proporsi
Laki-laki 1314 0.46
Perempuan 1569 0.54
Sumber: Data WVS 7

Persentase

Proporsi frekuensi (\(p\)) diperoleh dengan membagi frekuensi setiap kategori (\(f\)) dengan total pengamatan (\(N\)) lalu dikalikan \(100\). Dalam laporan statistik, kebanyakan frekuensi disajikan dalam bnetuk persentase, bukan proporsi. Persentase mengekspresikan ukuran frekuensi seolah-olah ada 100 total pengamatan.

\[ persentase = \frac{f} {N} (100) \]

Sehingga persentae responden yang berjenis kelamin perempuan adalah \[ persentase_{perempuan} = \frac {1569} {2883} (100) =54.4 \%\]

wvs |> 
  count(jenis_kelamin) |> 
  mutate(Proporsi = n / sum(n),
         Persen = Proporsi * 100) |> 
  mutate(Proporsi = round(Proporsi, 2),
         Persen = round(Persen, 1)) |> 
  gt() |>
  cols_label(jenis_kelamin = "Jenis kelamin",
             n = "Frekuensi") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(
    source_note = "Sumber: Data WVS 7")
Table 5: Persentase responden berdasarkan jenis kelamin
Jenis kelamin Frekuensi Proporsi Persen
Laki-laki 1314 0.46 45.6
Perempuan 1569 0.54 54.4
Sumber: Data WVS 7

Persentase Kumulatif

Table 6: Persentase kumulatif responden berdasarkan jenis kelamin
#wvs |> count(bahagia) |> 
#  gt() |>
#  cols_label(n = "Frekuensi (f)",
#             bahagia = "Kebahagiaan") |> 
#  opt_stylize(style = 6, color = "cyan") |>#

#  count(jenis_kelamin) |> 
#  mutate(Proporsi = n / sum(n),
#         Persen = Proporsi * 100,
#         Kumulatif = cumsum(Persen)) |> 
#  mutate(Proporsi = round(Proporsi, 2),
#         Persen = round(Persen, 1),
#         Kumulatif = round(Kumulatif, 1)) |> 
#  gt() |>
#  cols_label(jenis_kelamin = "Jenis kelamin",
#             n = "Frekuensi") |> 
#  opt_stylize(style = 6, color = "blue") |>
#
#  tab_source_note(
#    source_note = "Sumber: Data WVS 7")

Rates dan Rasio

Rates menunjukkan prevalensi hasil atau peristiwa yang menarik perhatian pada populasi tertentu. Rates menunjukkan tentang frekuensi suatu kejadian relatif terhadap berapa kali peristiwa tersebut terjadi pada suatu kelompok tertentu.

\[ Rate = \frac {f_{kejadian \, aktual}} {f_{kemungkinan\,kejadian}} \] Contoh sederhana adalah menghitung tingkat perceraian. Bagaimana kita tahu berapa banyak perceraian yang mungkin terjadi dalam periode waktu tertentu? Kita bisa menggunakan jumlah pernikahan yang terjadi dalam tahun tertentu atau jumlah semua pernikahan yang terjadi pada suatu populasi sebagai denominator. Rates Perceraian adalah jumlah perceraian yang terjadi dalam satu tahun dibagi dengan jumlah pernikahan yang terjadi pada tahun yang sama atau jumlah semua pernikahan yang terjadi pada suatu populasi.

Publikasi Badan Pusat Statistik (BPS) tahun 2015 menunjukkan angka perceraian di Indonesia di tahun 2016 sebanyak \(365,633\) dan angka pernikahan di tahun yang sama sebanyak \(1,837,185\), sehingga rates perceraian di Indonesia pada tahun 2016 adalah \(0.199\) atau \(19.9 \%\)

\[ Perceraian = \frac {365,633} {1,837,185}=0.199 \]

Rasio menunjukkan ukuran suatu kategori relatif terhadap kategori lainnya. Rasio diperoleh dari hasil pembagian frekuensi suatu kategori (\(f_1\)) dengan frekuensi kategori yang lain (\(f_2\)).

\[ Rasio = \frac{f_1} {f_2} \]

Memvisualisasikan variabel tunggal

Bar plot

ggplot(wvs, aes(x = bahagia)) +
  geom_bar(width = 0.5)

Histogram

ggplot(wvs, aes(x = usia)) +
  geom_histogram(bins = 30) +
  geom_freqpoly(bins = 30)

Cumulative frequency plot (ogive)

ggplot(wvs, aes(pendidikan_terakhir)) +
  stat_ecdf()

Membandingkan dua kelompok dalam 1 variabel

Membandingkan dengan tabel

wvs |> 
  count(kota_desa, bahagia) |> 
  group_by(kota_desa) |> 
  mutate(Persen = round(n / sum(n) * 100, 2)) |> 
  rename(Frekuensi = n,
         Bahagia = bahagia) |> 
  pivot_longer(c(Frekuensi, Persen)) |> 
  pivot_wider(names_from = c(kota_desa, name),
              values_from = value) |> 
  gt() |> 
  tab_spanner_delim("_") |> 
  opt_stylize(style = 6, color = "blue") |>
  tab_source_note(source_note = "Sumber: Data WVS 7")
Table 7: Distribusi frekuensi responden berdasarkan jenis kelamin dan kebahagiaan
Bahagia Pedesaan Perkotaan
Frekuensi Persen Frekuensi Persen
1 16 0.76 7 0.89
2 99 4.72 34 4.33
3 1061 50.57 389 49.55
4 922 43.95 355 45.22
Sumber: Data WVS 7

Membandingkan dengan visualisasi

ggplot(wvs, aes(x = bahagia,
                fill = kota_desa)) +
  geom_bar(position = "dodge")

References

Frankfort-Nachmias, Chava, Anna Leon-Guerrero, and Georgiann Davis. 2019. Social Statistics for a Diverse Society. Sage Publications.