Soal Pilihan Ganda (40 soal)
1. Pertanyaan. Apa yang membedakan populasi (population) dengan sampel (sample) dalam statistik?
A. Populasi hanya berisi angka, sampel berisi karakter.B. Populasi mencakup seluruh elemen yang menjadi objek studi; sampel adalah sebagian dari populasi.
C. Sampel lebih besar dari populasi.
Kunci: B
Pembahasan: Populasi = seluruh unit yang diteliti (mis. seluruh rumah tangga di kota X). Sampel = bagian yang dipilih dari populasi untuk dianalisis. Syarat penting: sampel harus representatif agar hasil dapat digeneralisasi.
2. Pertanyaan. Manakah dari berikut yang merupakan variabel nominal?
A. Tinggi badan (cm).
B. Tingkat pendidikan (SD, SMP, SMA).
C. Warna favorit (merah, biru, hijau).
D. Pendapatan (rupiah).
Kunci: C
Pembahasan: Variabel nominal mengelompokkan kategori yang tidak memiliki urutan. Warna favorit adalah contoh nominal. Tingkat pendidikan adalah ordinal (ada urutan). Tinggi dan pendapatan berskala numerik (interval/rasio).
3. Pertanyaan. Diberikan data: 12, 15, 12, 18, 20. Berapakah mean, median, dan mode?
A. Mean=15.4; Median=15; Mode=12.
B. Mean=15; Median=15.4; Mode=12.
C. Mean=15.4; Median=12; Mode=15.
D. Mean=15; Median=15; Mode=18.
Kunci: A
Pembahasan:
-
Mean = (12+15+12+18+20)/5 = 77/5 = 15,4.
-
Median (nilai tengah setelah diurutkan 12,12,15,18,20) = 15.
-
Mode = nilai yang paling sering muncul = 12.
4. Pertanyaan. Untuk data pada soal 3, berapakah simpangan baku (standar deviasi) populasi (σ)? (pilih yang paling mendekati)
A. 2,0
B. 3,2
C. 4,0
D. 3,58
Kunci: B
Pembahasan: Varian populasi = 10,24 → σ = √10,24 = 3,2 (pembulatan 2 desimal). (Catatan: simpangan baku sampel sedikit lebih besar ≈3,58.)
5. Pertanyaan. Koefisien variasi (coefficient of variation, CV) didefinisikan sebagai (σ / mean) × 100%. Untuk data soal 3, berapakah CV populasi (paling mendekati)?
A. 20,8%
B. 15,4%
C. 3,2%
D. 208%
Kunci: A
Pembahasan: CV = (σ / mean) × 100% = (3,2 / 15,4) × 100% ≈ 20,8%. CV menunjukkan variasi relatif terhadap rata-rata.
6. Pertanyaan. Jika P(A) = 0,3 dan P(B) = 0,4 serta A dan B adalah saling lepas (mutually exclusive), maka P(A ∪ B) = …
A. 0,12
B. 0,7
C. 0,1
D. 0,4
Kunci: B
Pembahasan: Jika saling lepas, P(A ∪ B) = P(A) + P(B) = 0,3 + 0,4 = 0,7.
7. Pertanyaan. Diketahui P(A∩B) = 0,12 dan P(B) = 0,4. Berapakah P(A|B) (probabilitas A terjadi jika B terjadi)?
A. 0,03
B. 0,48
C. 0,30
D. 3,33
Kunci: C
Pembahasan: P(A|B) = P(A∩B) / P(B) = 0,12 / 0,4 = 0,30.
8. Pertanyaan. Dua kejadian A dan B dikatakan independen jika…
A. P(A|B) = P(A)
B. P(A∩B) = 0
C. P(A) + P(B) = 1
D. P(A|B) = 0
Kunci: A
Pembahasan: Independen → kejadian B tidak mengubah probabilitas A: P(A|B) = P(A). Setara juga dengan P(A∩B) = P(A)P(B).
9. Pertanyaan. X ~ Binomial(n=5, p=0,4). Berapa P(X = 2) (paling mendekati)?
A. 0,3456
B. 0,2000
C. 0,5000
D. 0,1024
Kunci: A
Pembahasan (perhitungan): P(X=2) = C(5,2)(0,4)^2(0,6)^3 = 10 * 0,16 * 0,216 = 0,3456.
10. Pertanyaan. X ~ Poisson(λ = 3). Berapa P(X = 2) (paling mendekati)?
A. 0,2240
B. 0,1500
C. 0,3000
D. 0,0500
Kunci: A
Pembahasan: P(X=2) = e^(−3) * 3^2 / 2! ≈ 0,2240.
11. Pertanyaan. Nilai z untuk observasi x = 75 dengan mean μ = 70 dan σ = 5 adalah …
A. 1,0
B. −1,0
C. 0,5
D. 1,5
Kunci: A
Pembahasan: z = (x − μ)/σ = (75 − 70)/5 = 1,0.
12. Pertanyaan. Central Limit Theorem menyatakan bahwa:
A. Rata-rata sampel akan sama dengan median sampel.
B. Distribusi jumlah atau rata-rata sampel cenderung mendekati distribusi normal ketika ukuran sampel besar, terlepas dari distribusi populasi.
C. Variansi populasi selalu sama dengan variansi sampel.
D. Semakin besar populasi, semakin besar simpangan baku.
Kunci: B
Pembahasan: CLT: untuk n besar, distribusi rata-rata sampel ≈ normal, penting untuk inferensi (CI & uji hipotesis).
13. Pertanyaan. Diketahui sampel n = 36, mean sampel = 50, σ (populasi) = 10. Hitung interval kepercayaan 95% untuk μ (paling mendekati).
A. (47,0 ; 53,0)
B. (46,73 ; 53,27)
C. (45,0 ; 55,0)
D. (49,0 ; 51,0)
Kunci: B
Pembahasan (perhitungan): SE = σ/√n = 10/6 ≈ 1,6667. CI 95% = 50 ± 1,96·1,6667 = 50 ± 3,2667 → (46,73 ; 53,27).
14. Pertanyaan. Bila σ populasi tidak diketahui dan n kecil (mis. n < 30), interval kepercayaan untuk rata-rata harus menggunakan…
A. Distribusi normal (Z).
B. Distribusi t (Student).
C. Distribusi chi-square.
D. Distribusi Poisson.
Kunci: B
Pembahasan: Untuk σ tidak diketahui & n kecil, gunakan distribusi t (lebih lebar karena ketidakpastian σ).
15. Pertanyaan. Uji hipotesis dua arah: H0: μ = 100. Sampel n = 36, x̄ = 104, σ = 12. Pada α = 0,05, apakah menolak H0? (Gunakan Z)
A. Menolak H0 (karena z ≈ 2,0 > 1,96).
B. Tidak menolak H0 (karena z < 2,5).
C. Menolak H0 (karena z < −1,96).
D. Tidak menolak H0 (karena p > 0,05).
Kunci: A
Pembahasan (perhitungan): z = (104 − 100)/(12/√36) = 4/(12/6) = 4/2 = 2,0. Untuk α=0,05 dua arah, z_crit ±1,96. Karena 2,0>1,96 → tolak H0.
16. Pertanyaan. Tipe I error adalah …
A. Menolak H0 padahal H0 benar.
B. Tidak menolak H0 padahal H0 salah.
C. Kejadian acak yang tidak terdeteksi.
D. Membuat kesalahan pengukuran.
Kunci: A
Pembahasan: Tipe I (α) = kesalahan menyatakan ada efek padahal sebenarnya tidak (false positive).
17. Pertanyaan. Konsep power dari uji statistik adalah:
A. Probabilitas melakukan Type I error.
B. Probabilitas menolak H0 ketika H1 benar.
C. Probabilitas menerima H0 ketika H1 benar.
D. Probabilitas α = 0,05.
Kunci: B
Pembahasan: Power = 1 − β; semakin besar power, semakin besar kemungkinan mendeteksi efek bila memang ada.
18. Pertanyaan. Koefisien korelasi Pearson r = −0,85 menunjukkan:
A. Hubungan linier kuat positif.
B. Hubungan linier kuat negatif.
C. Tidak ada hubungan.
D. Hubungan non-linier.
Kunci: B
Pembahasan: Nilai r mendekati −1 → korelasi linier negatif kuat; artinya saat satu variabel naik, variabel lain cenderung turun.
19. Pertanyaan. Dalam regresi linear sederhana y = a + b x, interpretasi b adalah:
A. Titik potong pada sumbu y.
B. Rata-rata nilai y.
C. Perubahan rata-rata y untuk setiap kenaikan 1 satuan x.
D. Koefisien korelasi.
Kunci: C
Pembahasan: b = slope; menunjukkan seberapa besar perubahan terduga pada y jika x bertambah satu unit.
20. Pertanyaan. Diberikan pasangan data (x,y): (1,2), (2,3), (3,5). Hitung slope (b) regresi linear sederhana y pada x (paling mendekati).
A. 1,0
B. 1,5
C. 0,5
D. 2,0
Kunci: B
Pembahasan (perhitungan): Slope b = Σ(x−x̄)(y−ȳ) / Σ(x−x̄)^2 = 1,5. Intercept ≈ 0,333 (opsional).
21. Pertanyaan. Apa arti R² (koefisien determinasi) pada regresi?
A. Proporsi variansi y yang dijelaskan oleh x dalam model.
B. Nilai p dari uji F.
C. Rata-rata residual.
D. Kemiringan garis regresi.
Kunci: A
Pembahasan: R² = proporsi var(y) yang dapat dijelaskan oleh variabel independen; berkisar 0–1.
22. Pertanyaan. Multikolinearitas pada regresi terjadi ketika:
A. Error memiliki variansi konstan.
B. Predictor (variabel bebas) saling berkorelasi tinggi.
C. Data time series memiliki musiman.
D. Terdapat outlier.
Kunci: B
Pembahasan: Multikolinearitas: korelasi tinggi antar-predictor → estimasi koefisien tidak stabil & standard error membesar.
23. Pertanyaan. Heteroskedastisitas berarti:
A. Error berdistribusi normal.
B. Varians residual tidak konstan sepanjang nilai prediktor.
C. Varians residual konstan (homoskedastis).
D. Autokorelasi bernilai 0.
Kunci: B
Pembahasan: Heteroskedastisitas terjadi bila error memiliki varians yang berubah-ubah → membuat uji t & interval menjadi tidak efisien jika tidak diatasi.
24. Pertanyaan. Durbin-Watson (DW) digunakan untuk mendeteksi:
A. Heteroskedastisitas.
B. Autokorelasi (serial correlation) pada residual.
C. Multikolinearitas.
D. Normalitas residual.
Kunci: B
Pembahasan: DW sekitar 2 → tidak ada autokorelasi; <2 menunjukkan autocorrelation positif, >2 negatif.
25. Pertanyaan. Uji chi-square (χ²) goodness-of-fit digunakan untuk:
A. Menguji rata-rata populasi.
B. Menguji apakah distribusi frekuensi observasi cocok dengan distribusi teoretis.
C. Menguji korelasi linear.
D. Mengukur variansi.
Kunci: B
Pembahasan: χ² membandingkan frekuensi observasi vs frekuensi harapan berdasarkan model teoretis.
26. Pertanyaan. Pada ANOVA satu arah, apa hipotesis nol (H0) umumnya?
A. Semua rata-rata kelompok sama.
B. Ada perbedaan setidaknya dua rata-rata kelompok.
C. Varians setiap kelompok berbeda.
D. Data tidak normal.
Kunci: A
Pembahasan: H0: μ1 = μ2 = ... = μk (tidak ada perbedaan antar-kelompok). Jika F hitung > F kritis → tolak H0.
27. Pertanyaan. Komponen utama deret waktu (time series) meliputi:
A. Kuantum, konstanta, derivatif.
B. Trend, musiman (seasonality), siklus (cycle), dan irregular (noise).
C. Mean, median, mode.
D. Probabilitas, variabilitas, bias.
Kunci: B
Pembahasan: Analisis deret waktu biasanya memisahkan trend (arah umum), seasonality (pola periodik), cycle (siklus bisnis), dan noise.
28. Pertanyaan. Perbedaan utama antara indeks Laspeyres dan Paasche adalah:
A. Laspeyres menggunakan harga tahun dasar; Paasche menggunakan kuantitas tahun dasar.
B. Laspeyres menghitung inflasi; Paasche menghitung depresiasi.
C. Laspeyres menggunakan kuantitas periode dasar; Paasche menggunakan kuantitas periode berjalan.
D. Keduanya sama.
Kunci: C
Pembahasan: Laspeyres memakai bobot kuantitas periode dasar (cenderung melebihkan inflasi), Paasche memakai bobot periode berjalan.
29. Pertanyaan. Hitung moving average 3-periode untuk deret 10, 12, 14, 16, 18. Nilai MA yang terbentuk (urut) adalah:
A. 11, 13, 15
B. 12, 14, 16
C. 10, 12, 14
D. 14, 16, 18
Kunci: B
Pembahasan (perhitungan):
MA at t=3 = (10+12+14)/3 = 12; t=4 = (12+14+16)/3 = 14; t=5 = (14+16+18)/3 = 16 → 12, 14, 16.
30. Pertanyaan. Indeks musiman (seasonal index) digunakan untuk:
A. Membuat data cross-sectional.
B. Mengeliminasi tren.
C. Menyesuaikan data terhadap efek musiman sehingga pola musiman dapat dianalisis.
D. Menghitung probabilitas.
Kunci: C
Pembahasan: Indeks musiman menunjukkan faktor yang merepresentasikan pengaruh musiman tiap periode (mis. bulan).
31. Pertanyaan. Untuk estimasi proporsi dengan margin of error ±0,05 dan keyakinan 95% (z=1,96), serta asumsi p ≈ 0,5, berapa ukuran sampel minimal (pembulatan ke atas)?
A. 385
B. 100
C. 250
D. 1500
Kunci: A
Pembahasan (perhitungan): n = (z^2·p(1−p))/E^2 = (1,96^2·0,25)/0,05^2 ≈ 384,16 → pembulatan 385.
32. Pertanyaan. Estimator dikatakan tak bias (unbiased) jika:
A. MSE = 0.
B. Nilai harap (expected value) estimator sama dengan parameter populasi.
C. Varians estimator = 0.
D. Estimator selalu lebih kecil dari parameter.
Kunci: B
Pembahasan: Unbiased → E(θ̂) = θ. Artinya rata-rata sampling estimator menarget parameter sebenarnya.
33. Pertanyaan. Metode Maximum Likelihood (ML) berbeda dari Least Squares (LS) karena:
A. ML mencari parameter yang memaksimalkan peluang observasi; LS meminimalkan jumlah kuadrat residual.
B. ML hanya untuk regresi linier; LS untuk semua model.
C. Keduanya identik selalu.
D. ML tidak memerlukan asumsi distribusi.
Kunci: A
Pembahasan: ML = optimasi fungsi likelihood; LS = minimisasi Σ(residual^2). Dalam beberapa kasus (mis. normal errors) keduanya memberi hasil sama.
34. Pertanyaan. Uji nonparametrik (mis. Mann-Whitney) sering digunakan ketika:
A. Data mengikuti distribusi normal.
B. Data tidak memenuhi asumsi normalitas atau skala pengukuran ordinal.
C. Sampel sangat besar.
D. Varians populasi diketahui.
Kunci: B
Pembahasan: Uji nonparametrik berguna bila asumsi parametrik tidak terpenuhi (mis. data ordinal atau tidak-normal).
35. Pertanyaan. Resampling bootstrap berguna untuk:
A. Mengestimasi distribusi sampling estimator tanpa asumsi distribusi teoretis.
B. Membersihkan outlier.
C. Mengganti uji t.
D. Membuat model deterministic.
Kunci: A
Pembahasan: Bootstrap mengambil banyak sampel ulang (dengan penggantian) untuk membangun distribusi sampling empiris dan menghitung CI, bias, dsb.
36. Pertanyaan. Penyakit dengan prevalensi 1% (prior = 0,01). Tes memiliki sensitivitas 95% dan spesifisitas 98%. Jika seseorang dites positif, probabilitas sebenarnya sakit ≈ ? (paling mendekati).
A. 0,32
B. 0,95
C. 0,50
D. 0,01
Kunci: A
Pembahasan (Bayes):
P(D|+) = sens·prior / [sens·prior + (1−spec)·(1−prior)] = 0,95·0,01 / (0,95·0,01 + 0,02·0,99) ≈ 0,324 (≈32,4%). Artinya walau tes sensitif, karena prevalensi rendah PPV rendah.
37. Pertanyaan. Untuk distribusi diskret dengan X = {0,1,2} dan p = {0,2; 0,5; 0,3}, berapakah E(X) dan Var(X) (paling mendekati)?
A. E=1,1; Var=0,49
B. E=1,0; Var=0,25
C. E=0,9; Var=0,5
D. E=1,5; Var=1,0
Kunci: A
Pembahasan (perhitungan): E(X) = 0·0,2 + 1·0,5 + 2·0,3 = 1,1. E(X^2) = 0·0,2 + 1·0,5 + 4·0,3 = 1,589999... → Var = E(X^2) − E(X)^2 ≈ 0,49.
38. Pertanyaan. Contoh metode sampling stratified adalah:
A. Memilih setiap elemen ke-10 dari daftar (systematic).
B. Membagi populasi berdasarkan strata (mis. umur), lalu mengambil sampel acak dari setiap strata.
C. Memilih kelompok-kelompok area secara acak (cluster).
D. Mengambil sampel yang mudah dijangkau (convenience).
Kunci: B
Pembahasan: Stratified sampling meningkatkan representativitas dengan memastikan setiap strata terwakili.
39. Pertanyaan. Jika ditemukan outlier pada data, langkah yang benar secara metodologis adalah:
A. Selalu menghapusnya tanpa penjelasan.
B. Periksa apakah outlier berasal dari kesalahan pengukuran; jika bukan, laporan analisis dengan & tanpa outlier serta justifikasi keputusan.
C. Mengganti semua nilai lain agar sesuai outlier.
D. Menggandakan outlier untuk menyeimbangkan.
Kunci: B
Pembahasan: Outlier perlu investigasi: kesalahan data? fenomena nyata? Keputusan harus transparan (laporkan dampak jika dihapus).
40. Pertanyaan. Etika dalam penelitian statistik mengharuskan:
A. Memalsukan data jika hasilnya lebih "menarik".
B. Menyembunyikan informasi metode agar tidak ditiru.
C. Menyediakan dokumentasi metode, menghormati privasi responden, dan menghindari manipulasi data.
D. Hanya mempublikasikan hasil yang signifikan.
Kunci: C
Pembahasan: Etika mensyaratkan transparansi, validitas, perlindungan subjek, dan menghindari fabrikasi/manipulasi data.
No comments:
Post a Comment