Materi: Statistika vs Statistik

Memahami Statistika & Statistik

Panduan Lengkap: Materi, Contoh Soal, dan Latihan

1. Materi: Apa Bedanya?

Seringkali kita menganggap keduanya sama, padahal “Statistika” dan “Statistik” itu seperti “Biologi” dan “Hewan”. Satunya adalah ilmunya, satunya adalah objeknya.

Statistika (Statistics)

Adalah ilmu atau metode yang mempelajari cara merencanakan, mengumpulkan, mengolah, menganalisis, menginterpretasi, dan mempresentasikan data. Statistika adalah “mesin” yang kita gunakan untuk memproses informasi.

Statistik (Statistic)

Adalah hasil data atau kumpulan angka yang disajikan dalam bentuk tabel, grafik, atau ringkasan. Secara teknis, statistik juga merujuk pada ukuran-ukuran yang dihitung dari sebuah sampel (seperti rata-rata sampel atau persentase sampel).

Singkatnya: Statistika adalah prosesnya, Statistik adalah datanya.

2. Contoh Soal & Pembahasan

Level: Mudah

Mudah #1

Manakah yang merupakan definisi dari Statistika?

Jawaban: Statistika adalah ilmu yang mempelajari cara pengumpulan dan analisis data.
Mudah #2

Jika kamu melihat tabel klasemen liga sepak bola, tabel tersebut disebut sebagai…

Jawaban: Statistik (karena merupakan kumpulan data yang sudah jadi).
Mudah #3

Sebutkan salah satu kegiatan dalam metode statistika!

Jawaban: Pengumpulan data (atau pengolahan, analisis, penyajian data).
Mudah #4

Apakah rata-rata tinggi badan siswa dalam satu kelas yang ditulis dalam angka termasuk Statistik atau Statistika?

Jawaban: Statistik (karena berupa angka ringkasan data).
Mudah #5

Siapa yang menggunakan statistika untuk menarik kesimpulan: Peneliti atau datanya sendiri?

Jawaban: Peneliti (Peneliti menggunakan statistika sebagai alat/metode).

Level: Sedang

Sedang #1

Seorang peneliti menggunakan rumus Slovin untuk menentukan jumlah sampel. Langkah ini termasuk dalam bagian…

Jawaban: Statistika (Ini adalah bagian dari metode/prosedur penelitian).
Sedang #2

Apa perbedaan utama antara Statistik dan Parameter?

Jawaban: Statistik adalah ukuran yang mendeskripsikan sampel, sedangkan Parameter adalah ukuran yang mendeskripsikan populasi.
Sedang #3

Dalam sebuah berita disebutkan “Inflasi bulan ini mencapai 3%”. Pernyataan ini merupakan contoh dari…

Jawaban: Statistik (karena menyajikan fakta berupa angka hasil olahan data ekonomi).
Sedang #4

Statistika dibagi menjadi dua kategori besar. Sebutkan!

Jawaban: Statistika Deskriptif (menggambarkan data) dan Statistika Inferensial (menarik kesimpulan umum).
Sedang #5

Mengapa dalam Statistika kita membutuhkan sampel?

Jawaban: Karena mengukur seluruh populasi seringkali tidak mungkin dilakukan karena keterbatasan waktu, biaya, dan tenaga.

Level: Sulit

Sulit #1

Jelaskan mengapa statistik (data) yang buruk bisa dihasilkan oleh statistika (metode) yang benar!

Jawaban: Meskipun metode analisisnya benar, jika data awal yang dikumpulkan bias (pengambilan sampel salah), maka hasil statistiknya akan tidak akurat. “Garbage in, garbage out”.
Sulit #2

Sebuah perusahaan mengklaim produknya 99% efektif berdasarkan uji laboratorium. Apakah angka 99% ini sebuah statistik deskriptif atau inferensial?

Jawaban: Inferensial. Karena angka tersebut didapat dari sampel uji coba untuk digeneralisasikan ke seluruh produk yang akan dijual (populasi).
Sulit #3

Apa peran teori peluang (probabilitas) dalam Statistika?

Jawaban: Peluang digunakan sebagai jembatan untuk melakukan inferensi; untuk mengukur sejauh mana kita bisa percaya bahwa hasil dari sampel mencerminkan populasi sebenarnya.
Sulit #4

Diberikan data nilai: 70, 80, 90. Jika kita menyebut “Rata-ratanya adalah 80”, apakah kita sedang melakukan kegiatan statistika atau menyajikan statistik?

Jawaban: Kita melakukan statistika deskriptif (proses menghitung) dan angka 80 adalah statistiknya (hasilnya).
Sulit #5

Dalam penelitian ilmiah, manakah yang lebih dahulu ada: Statistika atau Statistik?

Jawaban: Statistika sebagai rancangan metode harus ada sebelum penelitian dimulai, namun Statistik (sebagai hasil data) baru muncul setelah proses statistika dijalankan.

3. Latihan Soal (Kerjakan Mandiri)

Level: Mudah

  1. Ilmu yang mempelajari cara mengolah data disebut…
  2. Kumpulan angka dalam bentuk grafik batang disebut…
  3. Statistika berasal dari bahasa Latin “Status” yang berarti…
  4. Sebutkan satu contoh penyajian data dalam kehidupan sehari-hari!
  5. Jika Anda menghitung jumlah uang saku teman-teman Anda, Anda sedang mengumpulkan…

Level: Sedang

  1. Apa perbedaan antara Statistika Deskriptif dan Statistika Inferensial?
  2. Berikan contoh penggunaan Statistik di bidang kedokteran!
  3. Apakah “Sensus Penduduk” menggunakan prinsip sampel dalam Statistika? Jelaskan singkat.
  4. Sebutkan 3 tahapan utama dalam Statistika!
  5. Mana yang lebih luas cakupannya: Populasi atau Sampel?

Level: Sulit

  1. Jelaskan kaitan antara Statistik, Sampel, dan Parameter!
  2. Mengapa hasil dari statistika inferensial tidak pernah 100% pasti benar?
  3. Dalam sebuah eksperimen, jika metode statistika yang digunakan tidak sesuai dengan jenis datanya, apa konsekuensinya terhadap statistik yang dihasilkan?
  4. Uraikan peran statistika dalam pengambilan keputusan pemerintah!
  5. Dapatkah kita memperoleh statistik tanpa melalui proses statistika? Berikan argumenmu.

© 2026 Materi Pembelajaran Mandiri – Semangat Belajar!

Materi Populasi dan Sampel

Populasi dan Sampel

Memahami konsep dasar pengambilan data dalam penelitian

1. Pengertian Materi

Populasi: Adalah keseluruhan objek penelitian yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya. Populasi bukan hanya orang, tetapi juga obyek dan benda-benda alam lainnya.

Sampel: Adalah bagian dari jumlah dan karakteristik yang dimiliki oleh populasi tersebut. Sampel diambil karena peneliti memiliki keterbatasan waktu, tenaga, dan biaya untuk meneliti seluruh populasi.

Syarat sampel yang baik adalah Representatif, artinya sampel harus benar-benar mewakili karakteristik populasinya.

2. Contoh Soal & Pembahasan

A. Tingkat Mudah (Identifikasi Dasar)

Mudah – 1

Soal: Seorang guru ingin mengetahui rata-rata nilai matematika siswa kelas 9 di sebuah sekolah yang terdiri dari 5 kelas. Guru tersebut hanya mengambil data dari kelas 9A. Tentukan populasi dan sampelnya!

Pembahasan:
Populasi: Seluruh siswa kelas 9 di sekolah tersebut.
Sampel: Siswa kelas 9A.
Mudah – 2

Soal: Penjual duku mencicipi satu buah duku dari satu keranjang untuk mengetahui rasanya. Mana yang merupakan sampel?

Pembahasan: Sampel adalah satu buah duku yang dicicipi tersebut.
Mudah – 3

Soal: Seorang dokter ingin memeriksa golongan darah seorang pasien. Dokter mengambil 2cc darah pasien tersebut. Tentukan populasinya!

Pembahasan: Populasi adalah seluruh darah yang ada di dalam tubuh pasien tersebut.
Mudah – 4

Soal: Peneliti ingin mengetahui tingkat kepuasan pelanggan TransJakarta. Peneliti mewawancarai 100 orang yang sedang menunggu di halte Harmoni. Sebutkan sampelnya!

Pembahasan: Sampelnya adalah 100 orang yang diwawancarai di halte Harmoni.
Mudah – 5

Soal: Sebutkan satu alasan mengapa peneliti menggunakan sampel daripada populasi!

Pembahasan: Untuk menghemat waktu, biaya, dan tenaga jika jumlah populasi terlalu besar.

B. Tingkat Sedang (Analisis Konteks)

Sedang – 1

Soal: Sebuah pabrik memproduksi 5.000 botol minuman setiap hari. Bagian QC mengambil 50 botol secara acak setiap jam untuk diperiksa kadar gulanya. Tentukan populasi penelitian tersebut!

Pembahasan: Populasi adalah seluruh botol minuman (5.000 botol) yang diproduksi pabrik tersebut dalam satu hari.
Sedang – 2

Soal: Mengapa mengambil sampel dari satu kelas saja tidak cukup untuk menggambarkan rata-rata nilai satu sekolah? Jelaskan!

Pembahasan: Karena sampel tersebut belum tentu representatif. Setiap kelas mungkin memiliki tingkat kecerdasan atau metode pengajaran guru yang berbeda, sehingga tidak mewakili karakteristik seluruh sekolah.
Sedang – 3

Soal: Jika seorang peneliti ingin meneliti pengaruh pupuk terhadap tanaman padi di satu kabupaten, manakah yang lebih tepat dijadikan populasi: seluruh lahan pertanian atau seluruh tanaman padi di kabupaten tersebut?

Pembahasan: Seluruh tanaman padi di kabupaten tersebut, karena objek yang diteliti pengaruhnya adalah tanaman padinya, bukan lahannya secara umum.
Sedang – 4

Soal: Apa risiko yang terjadi jika sampel yang diambil terlalu sedikit dari populasi yang sangat beragam?

Pembahasan: Terjadi kesalahan generalisasi (bias), di mana hasil penelitian tidak akurat dan tidak mencerminkan keadaan populasi yang sebenarnya.
Sedang – 5

Soal: Dalam penelitian tentang efektivitas vaksin baru pada penduduk Indonesia, peneliti mengambil sampel 1.000 orang dari Jakarta saja. Apakah sampel ini baik? Berikan alasannya.

Pembahasan: Kurang baik, karena Jakarta tidak mewakili keragaman geografis, genetik, dan gaya hidup seluruh penduduk Indonesia dari Sabang sampai Merauke.

C. Tingkat Sulit (Metodologi & Generalisasi)

Sulit – 1

Soal: Jelaskan perbedaan antara Probability Sampling dan Non-probability Sampling dalam kaitannya dengan pemilihan sampel!

Pembahasan: Probability Sampling memberikan peluang yang sama bagi setiap anggota populasi untuk dipilih (acak), sehingga hasilnya bisa digeneralisasi ke populasi. Non-probability tidak memberikan peluang yang sama, biasanya berdasarkan pertimbangan tertentu (tidak acak).
Sulit – 2

Soal: Sebuah riset ingin mengetahui opini publik tentang kebijakan baru pemerintah. Mereka menyebarkan polling di media sosial X (Twitter). Mengapa hasil ini bisa dianggap bias?

Pembahasan: Karena populasi pengguna media sosial X tidak mewakili seluruh populasi penduduk (ada kesenjangan akses internet, usia, dan preferensi platform), sehingga sampelnya bersifat self-selection bias.
Sulit – 3

Soal: Kapan seorang peneliti diperbolehkan menggunakan total sampling (meneliti seluruh populasi)?

Pembahasan: Ketika jumlah populasi relatif kecil (misal kurang dari 100 orang) atau penelitian memerlukan tingkat akurasi 100% tanpa ada kesalahan sampling (Sensus).
Sulit – 4

Soal: Jika populasi penelitian bersifat heterogen (bermacam-macam), teknik sampling apa yang paling tepat digunakan agar sampel representatif?

Pembahasan: Stratified Random Sampling (Sampling Acak Berstrata), di mana populasi dibagi ke dalam kelompok-kelompok (strata) terlebih dahulu sebelum diambil sampel acak dari tiap kelompok.
Sulit – 5

Soal: Seorang peneliti ingin meneliti perilaku pengguna narkoba di suatu kota. Mengapa teknik Snowball Sampling sering digunakan untuk kasus ini? Sebutkan populasi dan sampelnya!

Pembahasan: Karena populasi tersebut sulit ditemukan (tertutup). Populasi: Seluruh pengguna narkoba di kota tersebut. Sampel: Beberapa pengguna yang berhasil ditemui awal dan orang-orang yang direkomendasikan setelahnya.

3. Latihan Soal

Kerjakan soal-soal di bawah ini untuk menguji pemahamanmu!

A. Latihan Mudah

  1. Sebutkan populasi dari seorang ibu yang mencicipi sedikit kuah sayur di sendok!
  2. Jika peneliti mengambil 10 sekolah dari 100 sekolah di suatu provinsi, mana yang disebut populasi?
  3. Apakah sampel boleh diambil secara sembarangan tanpa kriteria? Jelaskan singkat.
  4. Tentukan sampel dari riset mengenai perilaku kucing liar di Jakarta yang hanya meneliti kucing di area Jakarta Selatan.
  5. Apa istilah bagi seluruh anggota kelompok yang ingin kita teliti?

B. Latihan Sedang

  1. Berikan contoh penelitian yang mengharuskan penggunaan sampel karena jika menggunakan populasi akan merusak objek penelitiannya!
  2. Seorang peneliti ingin mengetahui rata-rata tinggi badan pria dewasa di Indonesia. Ia mengambil sampel di sebuah klub basket. Apakah ini representatif? Mengapa?
  3. Apa perbedaan utama antara hasil penelitian pada sampel dibandingkan dengan hasil penelitian pada populasi (sensus)?
  4. Sebutkan 3 faktor yang menentukan jumlah sampel yang harus diambil!
  5. Jika populasinya adalah 1.000.000 orang, apakah sampel 10 orang sudah cukup? Jelaskan.

C. Latihan Sulit

  1. Jelaskan konsep Sampling Error dan bagaimana cara memperkecil nilai tersebut!
  2. Apa yang dimaksud dengan Cluster Sampling dan berikan contoh penerapannya dalam skala nasional!
  3. Mengapa dalam penelitian eksperimen laboratorium, jumlah sampel yang digunakan biasanya lebih sedikit dibandingkan penelitian survei sosial?
  4. Analisislah: “Semakin homogen suatu populasi, maka semakin sedikit jumlah sampel yang dibutuhkan.” Benar atau salah? Berikan argumentasi Anda.
  5. Bagaimana cara menentukan sampel jika populasi yang akan diteliti tidak diketahui secara pasti jumlahnya (Populasi Infinit)?

© 2024 Modul Pembelajaran Statistika – Populasi & Sampel

Materi Statistika: Datum dan Data

Pengertian Datum dan Data

A. Materi Pembelajaran

Dalam ilmu statistika, istilah datum dan data sering digunakan saat kita melakukan pengumpulan informasi. Meskipun sering dianggap sama dalam bahasa sehari-hari, keduanya memiliki perbedaan makna yang mendasar.

1. Pengertian Datum

Datum adalah keterangan atau informasi tunggal yang diperoleh dari suatu pengamatan atau pengukuran. Datum bisa berupa angka, lambang, sifat, atau keadaan suatu objek.

Contoh Datum:

  • Tinggi badan Andi adalah 165 cm. (Angka “165 cm” adalah sebuah datum).
  • Warna mobil Budi adalah merah. (“Merah” adalah sebuah datum).

2. Pengertian Data

Data adalah bentuk jamak (plural) dari datum. Data merupakan kumpulan dari datum-datum atau kumpulan informasi/keterangan yang diperoleh dari suatu pengamatan terhadap objek.

Contoh Data:

  • Catatan tinggi badan 5 siswa: 165 cm, 160 cm, 172 cm, 158 cm, 168 cm. Kumpulan angka-angka ini disebut data.
  • Daftar golongan darah siswa kelas 7A.

3. Kesimpulan Perbedaan

Jika Datum adalah fakta tunggal (satu buah informasi saja), maka Data adalah keseluruhan fakta (kumpulan dari datum) yang akan diolah dalam statistika.

B. Contoh Soal dan Pembahasan

Tingkat Mudah

1. Apakah yang dimaksud dengan datum?
Pembahasan: Datum adalah keterangan atau informasi tunggal (satu fakta saja) yang diperoleh dari suatu pengamatan atau pengukuran.
2. Apakah yang dimaksud dengan data?
Pembahasan: Data adalah bentuk jamak dari datum, yaitu kumpulan informasi atau fakta-fakta yang diperoleh dari suatu pengamatan.
3. Diketahui tinggi badan Siti adalah 150 cm. Apakah 150 cm tersebut termasuk datum atau data?
Pembahasan: 150 cm termasuk datum, karena hanya berupa satu keterangan atau fakta tunggal tentang tinggi badan satu orang.
4. Kumpulan nilai ulangan Matematika dari 10 siswa disebut sebagai…
Pembahasan: Disebut sebagai data, karena terdiri dari banyak nilai (kumpulan datum).
5. “Budi memiliki berat badan 45 kg”. Dari kalimat tersebut, manakah yang merupakan datum?
Pembahasan: Datum dari kalimat tersebut adalah 45 kg (informasi ukuran berat badan Budi).

Tingkat Sedang

6. Diberikan catatan nilai ujian IPA Budi selama satu semester: 80, 85, 90, 75, 88. Sebutkan datum ketiga dari daftar tersebut!
Pembahasan: Urutan nilainya adalah 80 (datum ke-1), 85 (datum ke-2), 90 (datum ke-3), 75 (datum ke-4), dan 88 (datum ke-5). Jadi, datum ketiganya adalah 90.
7. Dalam sebuah survei hobi, tercatat: Membaca, Berenang, Melukis, Berenang. Berapakah banyak datum dalam kumpulan data tersebut?
Pembahasan: Terdapat 4 informasi tunggal yang dikumpulkan (Membaca, Berenang, Melukis, Berenang). Maka banyak datum adalah 4.
8. Jelaskan mengapa angka “35°C” bisa disebut datum sekaligus bisa menjadi bagian dari sebuah data!
Pembahasan: “35°C” disebut datum jika ia berdiri sendiri sebagai satu hasil ukur (misal: suhu hari ini 35°C). Namun, ia menjadi bagian dari sebuah data jika digabungkan dengan suhu hari-hari lainnya (misal: suhu minggu ini 32°C, 33°C, 35°C, 34°C).
9. Tentukan jenis datum (kualitatif atau kuantitatif) dari pernyataan berikut: “Rasa buah jeruk itu manis”.
Pembahasan: “Manis” adalah datum kualitatif, karena berupa sifat atau keadaan (kualitas) dan bukan berupa angka yang diukur.
10. Andi menghitung jumlah kelereng di dalam tiga botol. Botol A ada 10, Botol B ada 15, Botol C ada 12. Sebutkan data dari pengamatan Andi!
Pembahasan: Data pengamatan Andi adalah 10, 15, 12 (kumpulan dari ketiga datum jumlah kelereng).

Tingkat Sulit

11. Sebuah rata-rata (mean) dari ujian Biologi 5 siswa adalah 82. Apakah angka 82 tersebut murni sebuah datum dari pengamatan awal? Jelaskan!
Pembahasan: Angka 82 bukanlah datum dari pengamatan awal. Angka 82 adalah hasil olahan atau statistik yang diturunkan dari kumpulan datum. Datum awal adalah nilai masing-masing dari ke-5 siswa tersebut sebelum dihitung rata-ratanya.
12. Diberikan sekumpulan data: {x, 14, 15, 16, 20}. Jika diketahui jumlah dari seluruh datum tersebut adalah 80, berapakah nilai datum pertama (x)?
Pembahasan:
Jumlah total = x + 14 + 15 + 16 + 20
80 = x + 65
x = 80 – 65
x = 15
Jadi, nilai datum pertama adalah 15.
13. Suatu perusahaan mencatat jumlah produksi harian selama 4 hari sebagai berikut: 100 unit, 120 unit, 115 unit, dan y unit. Jika perusahaan tersebut ingin datanya menunjukkan rata-rata produksi 115 unit per hari, tentukan datum keempat (y)!
Pembahasan:
Rata-rata = (Jumlah seluruh datum) / (Banyak datum)
115 = (100 + 120 + 115 + y) / 4
115 × 4 = 335 + y
460 = 335 + y
y = 460 – 335 = 125
Jadi, datum keempat harus bernilai 125 unit.
14. Dalam statistika dikenal istilah “Outlier” atau pencilan. Jika diberikan data berat badan: 45 kg, 47 kg, 46 kg, 48 kg, dan 90 kg. Identifikasilah datum manakah yang merupakan pencilan dan berikan alasan matematis yang logis terkait definisi datum!
Pembahasan: Datum yang merupakan pencilan adalah 90 kg. Alasannya, datum tunggal ini nilainya sangat menyimpang atau jauh berbeda (ekstrem) dibandingkan dengan kelompok datum lainnya dalam data tersebut yang berkisar di angka 45-48 kg.
15. “Seorang peneliti mengambil 100 sampel darah responden. Hasil pemeriksaan sampel ke-50 menunjukkan golongan darah AB.” Bedah kalimat tersebut, tentukan populasi (jika tersirat), sampel (data), dan datum-nya secara spesifik!
Pembahasan:
Datum: “Golongan darah AB” (keterangan tunggal dari sampel ke-50).
Data (Sampel): Kumpulan hasil pemeriksaan golongan darah dari ke-100 responden yang diambil.
Populasi tersirat: Seluruh orang/individu yang menjadi target penelitian tersebut sebelum dipilih 100 orang sebagai sampel.

C. Latihan Soal

Kerjakan soal-soal di bawah ini untuk menguji pemahamanmu tentang Datum dan Data!

Tingkat Mudah

  1. Tuliskan definisi dari datum menggunakan bahasamu sendiri!
  2. Tuliskan definisi dari data menggunakan bahasamu sendiri!
  3. Di antara kata “Datum” dan “Data”, manakah yang merupakan bentuk tunggal (singular)?
  4. Ibu membeli buah apel seberat 2 kg. Apakah “2 kg” disebut data atau datum?
  5. Berikan 2 contoh datum kuantitatif (berupa angka)!

Tingkat Sedang

  1. Pak guru mendata warna sepatu 5 muridnya: Hitam, Putih, Hitam, Biru, Hitam. Tuliskan himpunan data dari hasil pendataan Pak guru tersebut!
  2. Dari kumpulan data suhu ruangan: 28°C, 29°C, 30°C, 27°C. Berapakah nilai datum terendahnya?
  3. Sebutkan perbedaan mendasar antara datum kualitatif dan datum kuantitatif beserta satu contohnya!
  4. Diketahui nilai ulangan Doni: 70, 75, 80. Jika ditambahkan satu datum lagi bernilai 90, tuliskan kumpulan datanya yang baru!
  5. Mengapa dalam melakukan penelitian statistik, kita tidak bisa hanya mengandalkan satu datum saja?

Tingkat Sulit

  1. Dalam sebuah data kelompok umur warga RT 01, rata-rata umur dari 10 warga adalah 30 tahun. Jika ada satu warga berusia 40 tahun pindah (datum dihilangkan), berapakah total jumlah dari datum-datum yang tersisa?
  2. Diberikan kumpulan datum berat paket (dalam kg): {2, 4, x, 6, 8}. Jika jangkauan (selisih datum terbesar dan terkecil) dari data tersebut adalah 7, dan x adalah datum terbesar, tentukan nilai x!
  3. Buatlah satu skenario penelitian sederhana. Dari skenario tersebut, tunjukkan dengan jelas langkah mendapatkan datum hingga terbentuk menjadi sebuah data!
  4. Apakah kumpulan datum selalu berbentuk angka? Analisis dan berikan contoh kasus pendataan demografi penduduk untuk mendukung argumenmu!
  5. Diberikan dua set data. Set A = {5, 5, 5, 5} dan Set B = {2, 4, 6, 8}. Meskipun jumlah total datum keduanya sama (20), jelaskan perbedaan karakteristik sebaran datum pada kedua set data tersebut secara konsep statistik dasar!
Materi Statistika: Data Cacahan & Data Ukuran

Mengenal Jenis Data

Materi, Contoh Soal, dan Latihan Mandiri

1. Data Cacahan (Data Diskret)

Definisi: Data cacahan adalah data yang diperoleh dengan cara membilang atau menghitung. Nilai datanya selalu berupa bilangan bulat (asli) dan tidak mungkin dalam bentuk pecahan atau desimal dalam konteks satuannya.
Contoh: Jumlah siswa, jumlah mobil di parkiran, jumlah gol dalam pertandingan.

A. Contoh Soal & Pembahasan (Data Cacahan)

Mudah – 1

Sebutkan apakah “Jumlah kursi di kelas” termasuk data cacahan atau ukuran!

Pembahasan: Data cacahan. Karena kursi dihitung satu per satu (1, 2, 3…) dan tidak ada “1,5 kursi”.
Sedang – 1

Dalam sebuah kantong terdapat bola merah dan biru. Jika peluang terambil bola merah adalah 0,4 dari total 20 bola, berapa jumlah bola merah?

Pembahasan: Jumlah bola = $0,4 \times 20 = 8$ bola. Data ini cacahan karena menyatakan jumlah benda hasil hitungan.
Sulit – 1

Sebuah variabel acak $X$ menyatakan banyak anak laki-laki dalam keluarga dengan 3 anak. Tentukan distribusi probabilitasnya!

Pembahasan: $X \in \{0, 1, 2, 3\}$. Ini data cacahan karena jumlah anak dihitung secara diskret. Probabilitasnya mengikuti distribusi binomial.

B. Latihan Soal (Data Cacahan)

  1. (Mudah) Berapa banyak motor yang lewat di depan rumahmu dalam 5 menit? (Identifikasi jenis datanya)
  2. (Mudah) Sebutkan 3 contoh data cacahan di lingkungan dapur!
  3. (Sedang) Jika rata-rata jumlah buku yang dibawa 5 siswa adalah 4, berikan satu kemungkinan kombinasi jumlah buku mereka!
  4. (Hard) Mengapa jumlah penduduk suatu negara dikategorikan data cacahan meskipun angkanya jutaan?

2. Data Ukuran (Data Kontinu)

Definisi: Data ukuran adalah data yang diperoleh dengan cara mengukur menggunakan alat ukur. Nilai datanya bisa berupa bilangan real (bisa desimal/pecahan) dan berada dalam rentang tertentu.
Contoh: Tinggi badan (cm), Berat badan (kg), Suhu udara (°C), Waktu lari (detik).

A. Contoh Soal & Pembahasan (Data Ukuran)

Mudah – 1

Manakah yang termasuk data ukuran: Jumlah pensil atau Panjang pensil?

Pembahasan: Panjang pensil. Karena diperoleh dengan penggaris (alat ukur) dan hasilnya bisa 12,5 cm.
Sedang – 1

Hasil pengukuran berat badan 3 bayi adalah 3,2 kg, 3,45 kg, dan 3,6 kg. Hitung rata-ratanya!

Pembahasan: $(3,2 + 3,45 + 3,6) / 3 = 10,25 / 3 = 3,416$ kg. Angka desimal menunjukkan fleksibilitas data ukuran.
Sulit – 1

Sebuah data tinggi badan disajikan dalam tabel distribusi frekuensi kelompok (misal: 150-155 cm). Mengapa data ini tetap disebut data ukuran meskipun ditulis dalam rentang bulat?

Pembahasan: Karena sifat aslinya kontinu. Angka 150-155 sebenarnya mencakup semua nilai real seperti 150,23 cm yang hanya mungkin didapat dari proses pengukuran.

B. Latihan Soal (Data Ukuran)

  1. (Mudah) Sebutkan alat ukur untuk mendapatkan data suhu badan!
  2. (Mudah) Apakah waktu tempuh lari 100m termasuk data ukuran? Jelaskan!
  3. (Sedang) Konversikan data ukuran 1,5 jam ke dalam satuan menit. Apakah tetap menjadi data ukuran?
  4. (Hard) Dalam penelitian laboratorium, massa zat diukur hingga 4 angka di belakang koma. Apa dampaknya jika data ini dipaksa menjadi data cacahan?

© 2026 Modul Statistika Mandiri – Dibuat untuk Tujuan Pembelajaran

Materi Data Ukuran dan Data Cacahan

Materi Statistik: Data Cacahan dan Data Ukuran

1. DATA CACAHAN (DATA DISKRIT)

Materi Data Cacahan

Data Cacahan (atau sering disebut data diskrit) adalah data yang diperoleh dari hasil mencacah atau menghitung. Karakteristik utama dari data ini adalah nilainya selalu berupa bilangan bulat positif atau cacah (0, 1, 2, 3, dst), dan tidak pernah berupa bilangan desimal atau pecahan.

Ciri-ciri:

  • Diperoleh melalui proses menghitung (bukan mengukur).
  • Nilainya terputus-putus (diskrit) / berupa bilangan bulat.
  • Bersifat eksak (pasti), jika dihitung dengan benar tidak ada galat/error pengukuran.

Contoh: Jumlah anggota keluarga, banyaknya siswa di kelas, jumlah mobil di tempat parkir, dan jumlah buku di perpustakaan.

Contoh Soal Data Cacahan & Pembahasan

Level Mudah (5 Soal)

1. Di antara data berikut, manakah yang termasuk data cacahan: A. Tinggi gedung, B. Berat badan, C. Jumlah kursi di kelas?
Pembahasan: Jawaban yang benar adalah C. Jumlah kursi diperoleh dengan cara dihitung satu per satu (mencacah) dan hasilnya pasti bilangan bulat. Tinggi gedung dan berat badan diperoleh dengan cara mengukur.
2. Apakah data “jumlah pengunjung mall dalam satu hari” termasuk data cacahan? Mengapa?
Pembahasan: Ya, karena pengunjung dihitung satu per satu menggunakan alat hitung (tally counter) atau sistem tiket. Tidak ada pengunjung bernilai pecahan (misal 1,5 orang).
3. Nilai dari data cacahan selalu berupa bilangan…
Pembahasan: Bilangan cacah / bilangan bulat tak negatif (0, 1, 2, 3, dst).
4. Manakah yang benar: Data cacahan diperoleh dengan penggaris atau dengan dihitung?
Pembahasan: Data cacahan diperoleh dengan dihitung (mencacah). Penggaris adalah alat ukur yang menghasilkan data ukuran.
5. Sebutkan dua contoh data cacahan yang bisa ditemukan di meja belajar!
Pembahasan: Contoh: Jumlah pensil di kotak pensil dan jumlah buku tulis. Keduanya diperoleh dengan menghitung.

Level Sedang (5 Soal)

6. Pak Budi mendata barang di tokonya: 1) Volume minyak goreng, 2) Jumlah telur (butir), 3) Berat beras (kg), 4) Banyaknya dus mi instan. Mana yang merupakan data cacahan?
Pembahasan: Nomor 2 dan 4. Telur dan dus mi instan dihitung satuannya (1 butir, 2 butir; 1 dus, 2 dus). Sedangkan volume dan berat diukur (bisa pecahan).
7. Mengapa angka “0” bisa menjadi nilai dalam data cacahan? Berikan contohnya!
Pembahasan: Karena menghitung bisa menghasilkan ketiadaan objek. Contoh: “Jumlah siswa yang tidak hadir hari ini adalah 0”. Artinya semua siswa hadir, 0 adalah bilangan cacah yang valid.
8. Seorang peternak sapi mencatat “produksi susu (liter)” dan “jumlah sapi yang diperah”. Apa perbedaan kedua jenis data tersebut?
Pembahasan: “Produksi susu” adalah data ukuran karena diukur dalam liter dan bisa koma/desimal. Sedangkan “jumlah sapi” adalah data cacahan karena dihitung ekorannya (bilangan bulat).
9. Apakah ada kemungkinan data cacahan memiliki galat (error) layaknya data dari alat ukur?
Pembahasan: Secara teoritis tidak ada galat instrumen karena sifatnya eksak (pasti). Kesalahan hanya terjadi karena *human error* (salah hitung), bukan karena batas ketelitian alat seperti pada penggaris atau timbangan.
10. Data cacahan sering disajikan dalam bentuk diagram batang. Mengapa diagram garis kurang tepat untuk data murni cacahan?
Pembahasan: Diagram garis mengasumsikan adanya nilai-nilai di antara dua titik (kontinuitas). Pada data cacahan (misal jumlah mobil: 1, 2, 3), tidak ada nilai antara 1 dan 2 (tidak ada 1,5 mobil), sehingga diagram batang/balok lebih merepresentasikan nilai diskritnya yang terpisah.

Level Sulit (5 Soal)

11. Jika rata-rata jumlah anak dalam 10 keluarga adalah 2,4 anak. Apakah jumlah anak sudah berubah menjadi data ukuran (kontinu)?
Pembahasan: Tidak. Variabel aslinya (“jumlah anak”) tetaplah data cacahan/diskrit. Angka 2,4 hanyalah hasil perhitungan statistik (rata-rata/mean) dari sekumpulan data diskrit. Data individunya tetap bilangan bulat.
12. Jelaskan perbedaan ruang sampel pada distribusi probabilitas data cacahan dibandingkan data ukuran!
Pembahasan: Ruang sampel pada data cacahan bersifat terhitung (countable), artinya kita bisa mendaftar nilai-nilainya (misal x = {0, 1, 2, …}). Sedangkan ruang sampel data ukuran bersifat tak terhitung (uncountable), berupa interval (misal 0 ≤ x ≤ 10).
13. Sebuah pabrik mendata “jumlah produk cacat dalam setiap pengiriman 1000 unit”. Jenis distribusi probabilitas apa yang paling tepat memodelkan data cacahan ini?
Pembahasan: Karena datanya cacahan (diskrit) dan berupa kejadian “sukses/gagal” dalam sampel yang besar dengan peluang kecil, model yang tepat adalah Distribusi Binomial atau Distribusi Poisson.
14. “Skor tes pilihan ganda (0 – 100 dengan kelipatan 10)”. Secara statistik, apakah ini data ukuran atau cacahan? Jelaskan!
Pembahasan: Ini tergolong data cacahan (diskrit). Meskipun rentangnya 0-100 seperti persentase, nilainya terbatas pada {0, 10, 20, 30…} karena didapat dari *menghitung* jumlah jawaban benar dikali bobot tertentu, bukan dari mengukur kompetensi dengan kontinuum tak terbatas.
15. Dalam suatu eksperimen, jika variabel terikatnya berupa data cacahan bervariansi sangat besar, transformasi data apa yang umumnya dilakukan sebelum analisis ANOVA?
Pembahasan: Untuk data cacahan (yang umumnya mengikuti distribusi Poisson dan variansinya sebanding dengan rata-rata), transformasi yang biasa digunakan agar distribusi mendekati normal dan variansi stabil adalah Transformasi Akar Kuadrat (Square Root Transformation).
Latihan Soal Data Cacahan

Soal Latihan Mudah

  1. Jelaskan dengan bahasamu sendiri apa arti dari data cacahan!
  2. Sebutkan kegiatan/cara utama untuk mengumpulkan data cacahan!
  3. Apakah jumlah daun di satu ranting pohon termasuk data cacahan?
  4. Manakah yang merupakan data cacahan: “Panjang meja” atau “Jumlah kaki meja”?
  5. Mengapa jumlah siswa di dalam kelas tidak mungkin bernilai 32,5?

Soal Latihan Sedang

  1. Pisahkan sekumpulan data ini menjadi data cacahan dan data ukuran: Banyak guru, Tinggi tiang bendera, Luas lapangan, Banyak jendela.
  2. Di perpustakaan, sebutkan 3 contoh data yang termasuk kategori data cacahan!
  3. Apakah bulu pada seekor kucing bisa disebut data cacahan meskipun sangat sulit dihitung? Berikan alasanmu!
  4. Sebuah dealer mobil terjual 15 unit minggu ini. Apakah angka 15 tersebut pasti (tidak memiliki margin of error alat)? Jelaskan!
  5. Mengapa mata uang/jumlah uang kertas di dompet dikategorikan sebagai data diskrit/cacahan?

Soal Latihan Sulit

  1. Jelaskan hubungan antara batasan alat hitung (seperti limit digit kalkulator) dengan konsep murni dari data cacahan!
  2. Jika bakteri dalam cawan petri dihitung dengan grid mikroskop dan diperkirakan berjumlah 1.500.000, apakah data ini menjadi ukuran karena hasil “perkiraan”, atau tetap cacahan?
  3. Mengapa variabel diskrit/cacahan jarang dianalisis menggunakan Distribusi Normal baku secara langsung tanpa faktor koreksi kontinuitas?
  4. Data jumlah gol dalam sepakbola adalah data diskrit. Namun, mengapa kita bisa memprediksi “rata-rata gol per pertandingan adalah 1,8” dalam bursa taruhan atau analisis statistik? Jelaskan makna angka 1,8 tersebut!
  5. Jelaskan kapan sebuah data cacahan yang sangat besar (misalnya populasi penduduk suatu negara > 200 juta) boleh diperlakukan (diaproksimasi) sebagai data ukuran/kontinu dalam pemodelan matematis!

2. DATA UKURAN (DATA KONTINU)

Materi Data Ukuran

Data Ukuran (atau data kontinu) adalah data yang diperoleh dari hasil pengukuran menggunakan alat ukur tertentu. Karakteristik utama dari data ukuran adalah nilainya dapat berupa bilangan bulat, bilangan desimal, maupun pecahan, dan memiliki nilai tak hingga di dalam rentang/interval tertentu.

Ciri-ciri:

  • Diperoleh melalui proses mengukur (menggunakan alat ukur seperti penggaris, timbangan, termometer).
  • Nilainya bersambung (kontinu) dan bisa berupa pecahan atau desimal.
  • Selalu memiliki nilai batas ketelitian, toleransi, atau galat (error) sesuai alat ukur yang digunakan.

Contoh: Tinggi badan (165,5 cm), berat badan (50,2 kg), suhu ruangan (24,3 °C), dan waktu tempuh (12,45 detik).

Contoh Soal Data Ukuran & Pembahasan

Level Mudah (5 Soal)

1. Data yang diperoleh menggunakan meteran atau timbangan disebut data…
Pembahasan: Data Ukuran (Kontinu). Meteran dan timbangan adalah alat ukur.
2. Apakah suhu air mendidih 100°C termasuk data ukuran?
Pembahasan: Ya, karena 100°C diperoleh dari hasil pengukuran menggunakan termometer, bukan dari menghitung.
3. Di antara dua nilai data ukuran, selalu dapat disisipkan nilai yang baru (bisa desimal). Sifat ini menunjukkan bahwa data ukuran bersifat…
Pembahasan: Kontinu (bersambung). Contoh: antara 5 cm dan 6 cm, ada 5,5 cm, 5,6 cm, dst.
4. Manakah yang merupakan data ukuran: A. Banyaknya roda sepeda, B. Kecepatan sepeda.
Pembahasan: Jawaban yang benar adalah B. Kecepatan sepeda. Kecepatan diukur menggunakan speedometer.
5. Sebutkan 2 contoh data ukuran yang ada pada dirimu sendiri!
Pembahasan: Contoh: Tinggi badan (misal 160 cm) dan Berat badan (misal 55 kg).

Level Sedang (5 Soal)

6. Kelompokkan data berikut: “Waktu berlari”, “Jumlah medali”, “Jarak lemparan”. Mana saja yang termasuk data ukuran?
Pembahasan: Yang termasuk data ukuran adalah Waktu berlari (diukur dengan stopwatch) dan Jarak lemparan (diukur dengan pita ukur). Jumlah medali adalah data cacahan.
7. Mengapa luas kebun (misalnya 150,5 meter persegi) diklasifikasikan sebagai data ukuran, padahal tidak diukur langsung melainkan dihitung?
Pembahasan: Karena luas didapatkan dari turunan pengukuran (Panjang × Lebar). Karena variabel penyusunnya (panjang dan lebar) adalah data kontinu yang diukur, maka hasil operasinya (luas) tetap diklasifikasikan sebagai data ukuran/kontinu.
8. Seorang perawat mencatat: Suhu badan, Tekanan darah, dan Jumlah tetesan infus per menit. Mana yang data ukuran?
Pembahasan: Suhu badan (termometer) dan Tekanan darah (tensimeter) adalah data ukuran. “Jumlah tetesan infus per menit” adalah data cacahan karena dihitung frekuensi tetesannya.
9. Apa yang dimaksud dengan “nilai tak hingga banyaknya” dalam interval data ukuran?
Pembahasan: Artinya, jika kita mengambil batas 1 kg sampai 2 kg, secara teoritis ada nilai tak terhingga di antaranya (misal: 1,1 kg; 1,11 kg; 1,111 kg, dst) tergantung seberapa teliti timbangan yang digunakan.
10. Berat emas dibaca “2 gram” oleh timbangan digital biasa, tapi “2,0015 gram” di laboratorium. Konsep apa pada data ukuran yang tergambar dari kejadian ini?
Pembahasan: Konsep ketelitian (presisi) instrumen pengukuran. Data ukuran selalu bergantung pada resolusi atau batas ketelitian alat ukur, sehingga nilai aslinya selalu memiliki galat (batas error).

Level Sulit (5 Soal)

11. Pada lari sprint 100m, timer digital hanya menampilkan angka diskrit seperti 10.58 detik. Mengapa waktu tetap diakui sebagai variabel kontinu, bukan diskrit?
Pembahasan: Karena hakikat dari waktu itu mengalir tanpa terputus (kontinu). Tampilan digital 10.58 hanyalah bentuk pembulatan atau resolusi layar. Waktu aslinya di alam nyata adalah nilai dalam rentang kontinuum.
12. Mengapa data ukuran (kontinu) menggunakan probabilitas luasan di bawah kurva (Probability Density Function) dan peluang titik tepat tunggalnya, P(X=a), bernilai nol?
Pembahasan: Karena ruang sampel kontinu tak hingga besarnya. Peluang mengambil SATU nilai pasti tak terhingga eksaknya (misal x = tepat 10,0000000…) dari kemungkinan tak hingga adalah limit mendekati 0. Probabilitas hanya dapat dihitung dalam suatu rentang atau interval (Integral dari a ke b).
13. Dalam survei, data “Pendapatan Per Bulan” sering ditanyakan menggunakan rentang, misalnya “Rp 1 juta – 3 juta” dan “Rp 3 juta – 5 juta”. Perubahan wujud data apa yang terjadi di sini?
Pembahasan: Data asli “Pendapatan” adalah data rasio (ukuran fisis keuangan). Ketika diubah menjadi rentang/kategori, data ukuran tersebut telah diturunkan derajatnya menjadi Data Ordinal (kategorikal berskala).
14. Kecepatan cahaya di ruang hampa bernilai persis 299.792.458 m/s tanpa koma berdasarkan definisi SI terbaru. Apakah ini bermakna kecepatan telah menjadi data cacahan?
Pembahasan: Tidak. Kecepatan tetap variabel kontinu alam. Angka tersebut menjadi bilangan bulat eksak bukan karena “dihitung kepingannya”, melainkan karena manusia menetapkan (mendefinisikan) panjang 1 meter berdasarkan pecahan waktu dari laju cahaya kontinu.
15. Kurva Distribusi Normal sangat ideal untuk menggambarkan data ukuran. Sebutkan syarat empiris yang harus dipenuhi agar distribusi tinggi badan sekelompok populasi membentuk lonceng sempurna!
Pembahasan: Syaratnya adalah sampel ditarik secara acak (Random Sampling) dengan jumlah yang sangat besar (n mendekati tak hingga), tidak terdapat data pencilan (outliers) yang ekstrem, dan variabelnya dipengaruhi oleh banyak faktor independen berskala kecil yang terakumulasi secara aditif (Teorema Limit Pusat).
Latihan Soal Data Ukuran

Soal Latihan Mudah

  1. Jelaskan apa yang dimaksud dengan data ukuran!
  2. Sebutkan 3 macam alat yang digunakan untuk menghasilkan data ukuran!
  3. Manakah yang tergolong data ukuran: “Panjang pita” atau “Banyak warna pita”?
  4. Apakah jarak tempuh dari rumah ke sekolah termasuk data ukuran?
  5. Bolehkah sebuah nilai data ukuran ditulis dalam bentuk desimal/berkoma? Berikan satu contoh!

Soal Latihan Sedang

  1. Berikan 3 contoh penerapan pencarian data ukuran dalam proyek pembangunan rumah!
  2. Mengapa volume bensin 1 liter di SPBU disebut data ukuran/kontinu, padahal di mesin terlihat angkanya melompat-lompat?
  3. Apakah diameter koin merupakan data ukuran? Bagaimana cara mendapatkannya?
  4. Jelaskan mengapa berat seseorang sering dicatat 50 kg bulat, padahal nilai ilmiah aslinya tidak pernah tepat 50,000… kg!
  5. Dari variabel motor berikut, pilih yang mana saja yang merupakan data ukuran: kapasitas tangki bensin, jumlah spion, jarak tempuh (odometer), diameter velg roda.

Soal Latihan Sulit

  1. “Setiap data ukuran selalu mengandung elemen ketidakpastian (uncertainty)”. Jelaskan makna filosofis dari pernyataan statistik tersebut!
  2. Mengapa himpunan nilai yang mungkin dari variabel kontinu (data ukuran) disebut sebagai himpunan *uncountable* (tak terhitung)?
  3. Jam pasir mengukur waktu berjatuhannya butiran pasir. Apakah data waktu yang dihasilkan dari jam pasir merupakan data ukuran (kontinu) atau kumpulan data diskrit dari butir pasir? Analisis hal ini!
  4. Beri satu contoh nyata dimana data ukuran terpaksa dikonversi menjadi data kategorik agar lebih mudah dipahami oleh masyarakat umum!
  5. Apa yang membedakan skala interval dan skala rasio dalam hirarki analisis terhadap Data Ukuran?
Pembelajaran: Data Kualitatif dan Data Kuantitatif

Data Kualitatif & Data Kuantitatif

BAGIAN 1: DATA KUALITATIF

Materi: Apa itu Data Kualitatif?

Data Kualitatif adalah data yang tidak berbentuk angka, melainkan berbentuk deskripsi, kategori, kata-kata, atau karakteristik. Data ini digunakan untuk menjelaskan kualitas, sifat, atau atribut dari suatu objek penelitian.

Jenis Data Kualitatif:

  • Nominal: Data kategori yang tidak memiliki tingkatan atau urutan. Contoh: Agama, Jenis Kelamin, Warna Favorit.
  • Ordinal: Data kategori yang memiliki tingkatan atau urutan tertentu. Contoh: Tingkat pendidikan (SD, SMP, SMA), Tingkat kepuasan (Sangat Tidak Puas, Puas, Sangat Puas).

Contoh Soal Data Kualitatif (Disertai Pembahasan)

Tingkat Mudah

1. Di antara pilihan berikut, manakah yang merupakan contoh data kualitatif? (a) Tinggi badan 160 cm, (b) Berat badan 50 kg, (c) Warna rambut hitam.
Pembahasan: (c) Warna rambut hitam. Data kualitatif menjelaskan karakteristik atau sifat yang tidak diukur dengan angka, seperti warna.
2. Golongan darah (A, B, AB, O) termasuk dalam jenis data kualitatif apa?
Pembahasan: Nominal. Golongan darah adalah kategori yang setara dan tidak memiliki tingkatan yang satu lebih tinggi dari yang lain.
3. Apakah “merk mobil” termasuk data kualitatif? Mengapa?
Pembahasan: Ya, termasuk data kualitatif karena merk mobil (Honda, Toyota, BMW) menunjukkan kategori atau nama, bukan sebuah nilai numerik/angka.
4. Mengapa jenis kelamin diklasifikasikan sebagai data kualitatif?
Pembahasan: Karena jenis kelamin (Laki-laki/Perempuan) mendeskripsikan atribut atau kategori dari subjek, tidak melibatkan besaran atau hitungan angka.
5. “Budi merasa sangat puas dengan pelayanan restoran tersebut.” Kalimat ini mengandung jenis data kualitatif apa?
Pembahasan: Ordinal. “Sangat puas” menunjukkan kategori yang memiliki urutan atau tingkatan (tidak puas, biasa saja, puas, sangat puas).

Tingkat Sedang

1. Jelaskan perbedaan mendasar antara data kualitatif nominal dan ordinal berikan contohnya!
Pembahasan: Nominal tidak memiliki urutan (contoh: Suku bangsa), sedangkan ordinal memiliki urutan atau hierarki yang bermakna (contoh: Pangkat militer).
2. Dalam sebuah survei, responden diminta mengisi nomor kode pos (misal: 10110). Apakah kode pos ini data kualitatif atau kuantitatif? Jelaskan!
Pembahasan: Data kualitatif (nominal). Meskipun berbentuk angka, angka pada kode pos hanya berfungsi sebagai label/kategori suatu wilayah geografis, tidak bisa dioperasikan secara matematika (tidak bisa dijumlah atau dikurang).
3. Data hasil wawancara berupa transkrip percakapan termasuk ke dalam kelompok data apa?
Pembahasan: Data kualitatif. Transkrip berisi teks, kata-kata, dan narasi yang mendeskripsikan makna dan pengalaman, bukan angka numerik.
4. Sebuah penelitian membagi kelas sosial menjadi Menengah Bawah, Menengah, dan Menengah Atas. Termasuk data apakah ini?
Pembahasan: Kualitatif Ordinal. Merupakan kategori deskriptif yang memiliki tingkatan strata sosial yang jelas.
5. Mengapa plat nomor kendaraan bermotor dikategorikan sebagai data kualitatif?
Pembahasan: Karena plat nomor berfungsi sebagai identitas atau simbol (label) unik untuk setiap kendaraan, bukan menunjukkan jumlah atau nilai ukur.

Tingkat Sulit

1. Jika Anda mengubah data ordinal “Tingkat Kepuasan” menjadi angka (1=Buruk, 2=Cukup, 3=Baik), apakah data tersebut otomatis menjadi data kuantitatif? Jelaskan!
Pembahasan: Tidak otomatis menjadi kuantitatif murni. Angka tersebut hanyalah “coding” (label) yang mewakili kategori. Jarak antara 1 dan 2 belum tentu sama dengan 2 dan 3, sehingga secara hakikat tetap berskala kualitatif ordinal.
2. Bagaimana cara mengubah data kualitatif teks bebas (open-ended question) menjadi data yang dapat dianalisis frekuensinya?
Pembahasan: Melalui proses “Coding”. Peneliti harus melakukan analisis tematik, mencari kata kunci atau tema yang berulang, lalu mengelompokkan teks tersebut ke dalam kategori-kategori nominal/ordinal untuk kemudian dihitung frekuensi kemunculannya.
3. Dalam pengamatan kualitas udara, indikatornya adalah warna langit (Biru Cerah, Abu-abu tipis, Kuning pekat). Berikan argumen mengapa pengamatan ini bisa bersifat sangat subjektif sebagai data kualitatif!
Pembahasan: Data kualitatif yang berdasarkan persepsi visual seringkali subjektif karena tidak ada standar ukuran alat yang eksak. “Abu-abu tipis” bagi pengamat A bisa jadi dianggap “Biru memudar” bagi pengamat B.
4. Apa kelemahan utama menggunakan data kualitatif ordinal dalam perbandingan jarak antar tingkatan?
Pembahasan: Kelemahannya adalah interval (jarak) antar kategori tidak diketahui atau tidak sama ukurannya secara pasti. Kita tahu “Sangat Setuju” lebih tinggi dari “Setuju”, tapi kita tidak bisa mengukur secara matematis seberapa besar jarak perbedaan tingkat persetujuan tersebut.
5. Mengapa IP address (contoh: 192.168.1.1) merupakan contoh pengolahan logika data kualitatif di ilmu komputer?
Pembahasan: IP Address direpresentasikan dengan deretan angka, namun angka tersebut berfungsi identitas unik perangkat di jaringan (seperti nama alamat), tidak melambangkan jumlah, kuantitas, atau hasil pengukuran objek.

Latihan Soal Data Kualitatif (Tanpa Pembahasan)

Tingkat Mudah

  1. Sebutkan 3 contoh data kualitatif nominal yang sering Anda temui di kehidupan sehari-hari!
  2. Apakah warna cat tembok sebuah rumah termasuk data kualitatif?
  3. Tentukan jenis datanya: Nama-nama provinsi di Indonesia.
  4. Pilih yang merupakan data kualitatif: (a) Suhu 30°C, (b) Merk sepatu Nike, (c) Jarak 5 km.
  5. Apakah profesi (dokter, guru, insinyur) memiliki tingkatan secara data kualitatif?

Tingkat Sedang

  1. Tentukan jenis data kualitatif dari: Ukuran baju (S, M, L, XL). Berikan alasanmu!
  2. Mengapa NIK (Nomor Induk Kependudukan) dikategorikan sebagai data kualitatif?
  3. Berikan contoh pengumpulan data kualitatif dengan metode observasi lapangan!
  4. Jelaskan apakah “stadium penyakit” (Stadium I, II, III, IV) termasuk data nominal atau ordinal!
  5. Apa perbedaan utama dalam mengolah data kualitatif berupa wawancara dengan data kuesioner tertutup?

Tingkat Sulit

  1. Analisislah mengapa nomor punggung pemain sepak bola adalah data nominal, bukan data ordinal!
  2. Bagaimana proses pengkodean (coding) dilakukan dalam analisis naratif kualitatif?
  3. Sebuah ulasan film di internet berisi teks panjang tentang kualitas akting aktornya. Rancanglah 3 kategori ordinal yang bisa digunakan untuk mengklasifikasikan ulasan-ulasan tersebut!
  4. Jelaskan fenomena “bias pengamat” dalam pengumpulan data kualitatif!
  5. Dalam skala likert 1 sampai 5, mengapa para ahli statistik berdebat apakah itu data ordinal (kualitatif) atau data interval (kuantitatif)?

BAGIAN 2: DATA KUANTITATIF

Materi: Apa itu Data Kuantitatif?

Data Kuantitatif adalah data yang berbentuk angka pasti (numerik) yang diperoleh melalui proses pengukuran atau penghitungan. Data ini dapat dikenai operasi matematika seperti penjumlahan, pengurangan, perkalian, atau pembagian.

Jenis Data Kuantitatif berdasarkan pengumpulannya:

  • Data Diskrit: Data yang diperoleh dari hasil menghitung (bilangan bulat). Contoh: Jumlah mobil, jumlah siswa.
  • Data Kontinu: Data yang diperoleh dari hasil pengukuran, bisa berupa bilangan desimal. Contoh: Berat badan (65,5 kg), jarak tempuh.

Berdasarkan Skala Pengukurannya:

  • Interval: Angka yang memiliki selisih (jarak) yang konsisten, namun tidak memiliki nilai nol mutlak (nol tidak berarti kosong/ketiadaan). Contoh: Suhu (0 derajat Celcius bukan berarti tidak ada suhu).
  • Rasio: Angka yang memiliki selisih yang konsisten dan memiliki nilai nol mutlak. Contoh: Berat badan, tinggi badan, pendapatan (Pendapatan 0 berarti benar-benar tidak ada pendapatan).

Contoh Soal Data Kuantitatif (Disertai Pembahasan)

Tingkat Mudah

1. Manakah yang merupakan data kuantitatif? (a) Status pernikahan, (b) Jumlah anak dalam keluarga, (c) Jenis rumah.
Pembahasan: (b) Jumlah anak dalam keluarga. Data ini berupa angka dan didapatkan dari hasil menghitung.
2. “Berat badan Anton adalah 70,5 kg.” Ini merupakan contoh data diskrit atau kontinu?
Pembahasan: Data Kontinu. Berat badan diukur menggunakan alat ukur dan dapat memiliki nilai desimal/pecahan di antara dua titik yang berurutan.
3. Apakah “kecepatan mobil 80 km/jam” termasuk data kuantitatif? Mengapa?
Pembahasan: Ya, karena kecepatan dinyatakan dalam bentuk numerik yang menunjukkan besaran ukur.
4. Jumlah pengunjung kebun binatang pada hari Minggu adalah 1.500 orang. Data diskrit atau kontinu?
Pembahasan: Data Diskrit. Jumlah orang didapatkan dari proses menghitung (1, 2, 3…) dan tidak mungkin ada angka pecahan seperti 1,5 orang.
5. Mengapa umur seseorang (misal: 25 tahun) diklasifikasikan sebagai data kuantitatif?
Pembahasan: Karena umur menyatakan durasi waktu yang diukur dengan angka matematis dan dapat dilakukan perhitungan matematika atasnya.

Tingkat Sedang

1. Jelaskan perbedaan antara skala interval dan rasio dalam data kuantitatif!
Pembahasan: Skala interval tidak memiliki titik nol mutlak (0 bukan berarti ketiadaan), seperti suhu Celcius. Skala rasio memiliki nol mutlak (0 berarti sama sekali tidak ada), seperti jumlah uang atau berat.
2. Suhu ruangan kelas adalah 25°C dan suhu di luar adalah 0°C. Apakah suhu 0°C berarti “tidak ada panas/suhu” sama sekali? Skala apakah ini?
Pembahasan: Tidak, suhu 0°C bukan berarti tidak ada suhu (nol mutlak), karena masih bisa turun lagi ke minus derajat. Karena tidak memiliki nol mutlak, ini adalah skala Interval.
3. Harga sebuah buku adalah Rp50.000. Harga tersebut termasuk skala interval atau rasio? Mengapa?
Pembahasan: Skala Rasio. Karena harga memiliki nilai nol mutlak (Rp 0 berarti gratis / tidak ada uang sama sekali), dan kelipatannya bermakna (Rp 100.000 adalah 2 kali lipat Rp 50.000).
4. Mengapa “tahun lahir” (misal: tahun 2000, 2021) dikategorikan sebagai data skala interval, bukan rasio?
Pembahasan: Karena tahun tidak memiliki nilai awal (nol mutlak) yang berarti ‘awal terciptanya waktu’. Tahun 0 hanyalah kesepakatan penanggalan, dan waktu sudah berjalan jauh sebelum tahun Masehi disepakati.
5. Jika Anda menghitung jumlah buku cacat dari sebuah pabrik percetakan, data apakah yang Anda kumpulkan? (Diskrit/Kontinu & Interval/Rasio)
Pembahasan: Data Diskrit (karena barang dihitung bulat, tidak bisa pecahan) dan skala Rasio (karena 0 buku cacat berarti memang tidak ada yang cacat).

Tingkat Sulit

1. Buktikan mengapa secara logis kita bisa mengatakan “A beratnya 2 kali lipat B” pada skala rasio (berat badan), tetapi kita tidak bisa mengatakan “Hari ini 2 kali lipat lebih panas dari kemarin” jika menggunakan suhu Celcius (skala interval)!
Pembahasan: Rasio bekerja pada skala perbandingan mutlak. Berat 40kg adalah mutlak 2x berat 20kg karena dihitung dari 0 absolut. Pada Celcius, 40°C bukanlah 2 kali panas 20°C, karena titik 0°C hanyalah konvensi titik beku air, bukan titik “ketiadaan energi panas”. Konversi suhu tersebut ke Kelvin (skala rasio) akan menunjukkan rasionya bukan 1:2.
2. Uang di rekening bank tercatat Rp 10.500,75. Apakah data uang dalam sistem perbankan masuk dalam data diskrit atau kontinu?
Pembahasan: Uang sering diperdebatkan. Secara teori dasar, uang adalah diskrit karena koin/sen tidak bisa dipecah lagi secara fisik tak terhingga. Namun dalam ilmu ekonomi tingkat lanjut atau komputasi perbankan, uang sering diperlakukan sebagai data kontinu karena perhitungannya (seperti suku bunga) bisa menghasilkan desimal yang sangat detail.
3. Data elevasi / ketinggian daratan (misal Gunung Rinjani 3.726 mdpl, dan palung kedalaman -1.000 mdpl). Termasuk data rasio atau interval? Analisis alasannya!
Pembahasan: Data Interval. Ketinggian diukur dari “permukaan laut” yang ditetapkan sebagai 0. Namun 0 di sini hanya referensi buatan (karena ada daratan di bawah laut). Oleh karena tidak berawal dari 0 mutlak (dasar bumi), ia adalah skala interval.
4. Mengapa regresi linier sederhana membutuhkan data variabel dependen yang bersifat kontinu kuantitatif?
Pembahasan: Karena model regresi linier berasumsi bahwa ada gradien atau perubahan konstan dan nilai error didistribusikan secara normal di sepanjang garis variabel yang menyebar tak terbatas. Jika data diskrit atau kategori, algoritma regresi linier biasa akan gagal memprediksi nilai desimal yang bermakna (sebaiknya menggunakan regresi logistik).
5. Bagaimana menangani outlier (pencilan) pada data kuantitatif dan mengapa ini lebih penting pada data rasio dibandingkan data nominal?
Pembahasan: Outlier ditangani dengan membuangnya, transformasi (misal logaritma), atau pengelompokan. Ini sangat penting pada data kuantitatif rasio/interval karena outlier ekstrem akan merusak nilai Rata-rata (Mean) matematis, sesuatu yang tidak ada pada data nominal (yang hanya bergantung pada frekuensi/modus).

Latihan Soal Data Kuantitatif (Tanpa Pembahasan)

Tingkat Mudah

  1. Sebutkan 3 contoh data kontinu yang ada di sekitar rumahmu!
  2. Tentukan apakah ini data diskrit atau kontinu: Jumlah kursi dalam satu ruang kelas.
  3. Identifikasi jenis datanya: Volume bensin dalam liter.
  4. Pilih data kuantitatif dari daftar ini: Golongan darah, Tingkat Pendidikan, Luas wilayah provinsi.
  5. Apakah jumlah kalori pada sebuah kemasan makanan merupakan data kuantitatif?

Tingkat Sedang

  1. Jelaskan mengapa durasi waktu lari 100 meter (misalnya 10,54 detik) merupakan skala rasio!
  2. Identifikasilah data skala interval dan data skala rasio dalam cuaca: Suhu udara rata-rata harian dan Curah hujan harian (mm).
  3. Tentukan apakah saldo rekening bank minus (utang) mengubah sifat skala uang dari rasio menjadi interval! Berikan analisismu.
  4. Mengapa jumlah populasi penduduk desa dikategorikan sebagai data diskrit?
  5. Diberikan data nilai ujian matematika (0-100). Tentukan skala pengukurannya dan jelaskan alasanmu!

Tingkat Sulit

  1. Suhu tubuh normal manusia adalah 36,5°C – 37,2°C. Jelaskan mengapa kita tidak dapat memanipulasi data interval suhu ini untuk mencari kelipatan suhu tubuh dengan pembagian biasa!
  2. Dalam pengumpulan data GPS, koordinat lintang dan bujur disajikan dalam bentuk derajat desimal. Apakah ini data interval atau rasio? Uraikan alasannya.
  3. Bagaimana cara melakukan diskritisasi (binning) pada data umur kuantitatif agar menjadi data kualitatif ordinal? Berikan contoh konkritnya!
  4. Jelaskan fenomena pengukuran kuantum dimana suatu data (seperti tingkat energi elektron) yang secara alamiah diskrit dipelajari layaknya probabilitas kontinu.
  5. Hitung dan jelaskan syarat batas dimana sebuah rentang data diskrit (misalnya uang jutaan rupiah) mulai dianggap dan diperlakukan sebagai data kontinu dalam model statistik!
Materi Data: Primer, Sekunder, dan Mentah

Data Primer, Sekunder, dan Mentah

1. Data Primer

Materi: Data Primer

Data Primer adalah data yang dikumpulkan secara langsung oleh peneliti dari sumber pertamanya untuk tujuan penelitian tertentu. Data ini bersifat orisinil dan belum pernah diolah oleh pihak lain.

  • Cara Pengumpulan: Wawancara langsung, kuesioner/survei, observasi (pengamatan), dan eksperimen lapangan.
  • Kelebihan: Sangat relevan dengan tujuan penelitian, tingkat keakuratan bisa dikontrol oleh peneliti, dan data bersifat baru (up-to-date).
  • Kekurangan: Membutuhkan waktu, tenaga, dan biaya yang relatif besar untuk mengumpulkannya.

Contoh Soal Data Primer

Tingkat Mudah

1. Apa yang dimaksud dengan data primer?
Pembahasan: Data primer adalah data yang dikumpulkan langsung oleh peneliti dari sumber aslinya (tangan pertama) tanpa melalui perantara.
2. Sebutkan tiga metode pengumpulan data primer!
Pembahasan: Tiga metode utama adalah wawancara, penyebaran kuesioner (angket), dan observasi langsung.
3. Siapakah yang biasanya mengumpulkan data primer?
Pembahasan: Data primer dikumpulkan langsung oleh individu, kelompok, atau instansi yang sedang melakukan penelitian tersebut.
4. Apakah data hasil pengisian kuesioner online oleh responden termasuk data primer?
Pembahasan: Ya, karena data tersebut didapatkan langsung dari responden (sumber pertama) untuk kebutuhan penelitian pembuat kuesioner.
5. Sebutkan satu kelebihan utama dari data primer!
Pembahasan: Kelebihan utamanya adalah data sangat relevan dan spesifik sesuai dengan tujuan penelitian yang sedang dilakukan.

Tingkat Sedang

1. Mengapa pengumpulan data primer seringkali dianggap lebih mahal dibandingkan data sekunder?
Pembahasan: Karena peneliti harus terjun ke lapangan, mencetak kuesioner, membayar enumerator (petugas survei), atau memberikan insentif kepada responden, yang semuanya membutuhkan biaya.
2. Jelaskan perbedaan observasi partisipatif dan non-partisipatif dalam pengumpulan data primer!
Pembahasan: Observasi partisipatif berarti peneliti ikut serta dalam kegiatan subjek yang diteliti. Non-partisipatif berarti peneliti hanya mengamati dari luar tanpa ikut campur.
3. Seorang mahasiswa melakukan eksperimen pertumbuhan tanaman dengan berbagai jenis pupuk. Apakah data tingginya tanaman termasuk data primer? Jelaskan!
Pembahasan: Ya, termasuk data primer. Alasannya karena mahasiswa tersebut mengukur dan mencatat sendiri hasil pertumbuhannya secara langsung dari eksperimen yang ia buat.
4. Apa kelemahan penggunaan kuesioner terbuka dalam mencari data primer?
Pembahasan: Kelemahannya adalah responden mungkin memberikan jawaban yang terlalu beragam, sehingga peneliti kesulitan dalam mengkategorikan dan menganalisis data tersebut.
5. Bagaimana cara memastikan responden memberikan data primer yang jujur saat wawancara?
Pembahasan: Dengan membangun *rapport* (hubungan baik/kepercayaan), menjamin kerahasiaan identitas, dan menanyakan pertanyaan dengan kalimat yang netral dan tidak menghakimi.

Tingkat Sulit

1. Dalam metode pengumpulan data primer, apa yang dimaksud dengan “Interviewer Bias” dan bagaimana cara meminimalisirnya?
Pembahasan: Interviewer bias adalah penyimpangan jawaban responden yang dipengaruhi oleh nada bicara, ekspresi, atau karakteristik pewawancara. Cara meminimalisirnya adalah dengan melakukan pelatihan pewawancara (standarisasi) dan menggunakan pedoman wawancara terstruktur.
2. Analisislah kondisi di mana pengumpulan data primer menjadi tidak etis untuk dilakukan!
Pembahasan: Pengumpulan menjadi tidak etis jika melanggar privasi, melibatkan subjek rentan (seperti anak-anak) tanpa izin wali, membahayakan fisik/psikologis responden, atau tidak ada *informed consent* (persetujuan sadar).
3. Sebuah perusahaan rintisan ingin mengetahui tingkat kepuasan pelanggan namun memiliki budget yang sangat ketat. Strategi pengumpulan data primer apa yang paling optimal?
Pembahasan: Menggunakan survei online yang disisipkan setelah pelanggan melakukan transaksi di aplikasi (in-app survey) atau melalui email *blast*. Ini memangkas biaya kertas dan petugas, namun tetap menyasar target pengguna langsung.
4. Jelaskan pentingnya “Uji Validitas dan Reliabilitas” pada instrumen pengumpulan data primer (seperti kuesioner)!
Pembahasan: Uji validitas memastikan kuesioner benar-benar mengukur apa yang ingin diukur. Uji reliabilitas memastikan kuesioner memberikan hasil yang konsisten meski diulang-ulang. Tanpa ini, data primer yang dihasilkan dianggap cacat secara ilmiah.
5. Bagaimana peneliti mengatasi masalah “Low Response Rate” saat mengumpulkan data primer melalui survei surat/email?
Pembahasan: Dapat diatasi dengan memberikan pesan pengingat (follow-up), menyederhanakan desain kuesioner agar cepat diisi, memberikan insentif/undian berhadiah, dan menjelaskan manfaat penelitian tersebut bagi responden.

Latihan Soal Data Primer

Tingkat Mudah

1. Jelaskan secara singkat definisi dari data primer!
2. Sebutkan 2 contoh kegiatan yang menghasilkan data primer!
3. Alat ukur apa saja yang biasa digunakan untuk memperoleh data primer?
4. Apakah data dari wawancara narasumber di TV dapat disebut data primer bagi stasiun TV tersebut?
5. Sebutkan satu kekurangan dari pencarian data primer!

Tingkat Sedang

1. Bandingkan efektivitas antara wawancara tatap muka dengan survei online dalam hal kedalaman data!
2. Apa yang harus disiapkan peneliti sebelum turun ke lapangan mencari data primer?
3. Jika Anda meneliti tentang kepuasan fasilitas sekolah, siapakah yang menjadi sumber data primer Anda?
4. Mengapa data primer sering disebut sebagai data “first-hand”?
5. Berikan contoh kasus di mana metode observasi lebih baik daripada metode wawancara untuk mendapat data primer!

Tingkat Sulit

1. Rancanglah kerangka kuesioner singkat (3 pertanyaan) untuk mendapatkan data primer mengenai kebiasaan menabung mahasiswa!
2. Evaluasilah dampak pemilihan sampel yang salah terhadap kualitas data primer!
3. Bagaimana cara Anda melakukan triangulasi sumber ketika mengambil data primer melalui wawancara?
4. Mengapa pada penelitian medis yang melibatkan obat baru, data primer harus dikumpulkan melalui eksperimen ketat *Double-Blind*?
5. Jelaskan tantangan terbesar dalam mengumpulkan data primer pada kelompok masyarakat terasing!

2. Data Sekunder

Materi: Data Sekunder

Data Sekunder adalah data yang diperoleh atau dikumpulkan oleh peneliti dari sumber-sumber yang telah ada sebelumnya. Data ini merupakan data primer yang telah diolah lebih lanjut dan disajikan oleh pihak lain.

  • Sumber Data: Badan Pusat Statistik (BPS), jurnal ilmiah, buku, laporan keuangan perusahaan, artikel berita, dan dokumen pemerintah.
  • Kelebihan: Hemat waktu, hemat biaya, mudah diakses, dan seringkali mencakup rentang waktu yang panjang (data historis).
  • Kekurangan: Peneliti tidak memiliki kendali atas kualitas data, format data mungkin tidak 100% sesuai dengan kebutuhan peneliti, dan terkadang data sudah usang (outdated).

Contoh Soal Data Sekunder

Tingkat Mudah

1. Apa pengertian dari data sekunder?
Pembahasan: Data sekunder adalah data pendukung yang didapat tidak secara langsung dari subjek penelitian, melainkan melalui pihak lain atau dokumen yang sudah ada.
2. Sebutkan tiga contoh sumber data sekunder!
Pembahasan: Buku referensi, laporan tahunan perusahaan, dan publikasi Badan Pusat Statistik (BPS).
3. Apakah buku teks sejarah termasuk sumber data sekunder?
Pembahasan: Ya, buku teks sejarah merangkum peristiwa masa lalu dari berbagai sumber dan penulisnya tidak mengalami peristiwa itu secara langsung.
4. Apa keunggulan utama menggunakan data sekunder?
Pembahasan: Sangat menghemat waktu dan biaya karena peneliti tinggal mengunduh atau mencari data yang sudah dikumpulkan orang lain.
5. Berikan satu contoh data sekunder yang digunakan di bidang ekonomi!
Pembahasan: Data tingkat inflasi tahunan yang diterbitkan oleh Bank Indonesia.

Tingkat Sedang

1. Mengapa data sekunder terkadang dianggap kurang valid dibandingkan data primer?
Pembahasan: Karena peneliti tidak tahu secara pasti bagaimana metodologi pengumpulan data awalnya, apakah ada kesalahan atau manipulasi yang dilakukan oleh pihak pengumpul pertama.
2. Andi ingin meneliti jumlah penduduk miskin di kotanya. Ia mengunduh data dari situs pemda. Termasuk jenis data apakah ini dan mengapa?
Pembahasan: Data sekunder. Karena Andi tidak mendata satu per satu penduduk tersebut (tidak ke lapangan), melainkan menggunakan data rekapitulasi yang sudah dibuat oleh pemerintah daerah.
3. Apa yang harus diperhatikan saat memilih sumber data sekunder dari internet?
Pembahasan: Kredibilitas sumber (apakah dari institusi resmi/jurnal terakreditasi), tahun publikasi (kebaruan data), dan kejelasan metodologi pembuatannya.
4. Jelaskan bagaimana data sekunder dapat membantu penyusunan kuesioner untuk data primer!
Pembahasan: Data sekunder dari literatur sebelumnya dapat memberikan gambaran tentang variabel-variabel apa saja yang penting ditanyakan, sehingga penyusunan kuesioner menjadi lebih terarah.
5. Apakah laporan keuangan suatu perusahaan di Bursa Efek termasuk data sekunder bagi seorang mahasiswa akuntansi?
Pembahasan: Ya, karena laporan tersebut disusun oleh perusahaan (akuntan internal) dan dipublikasikan. Mahasiswa tersebut bertindak sebagai pengguna data yang sudah jadi.

Tingkat Sulit

1. Analisis bagaimana perbedaan kerangka konseptual antara pembuat data sekunder dengan peneliti dapat menjadi masalah!
Pembahasan: Pembuat data awal mungkin mendefinisikan variabel secara berbeda. Misalnya, BPS mendefinisikan “pengangguran” secara spesifik, namun peneliti memiliki definisi “pengangguran” yang lebih luas. Jika peneliti memaksakan data BPS, hasilnya tidak akan akurat menjawab rumusan masalahnya.
2. Dalam sebuah penelitian gabungan (Mixed Methods), bagaimana data sekunder diintegrasikan dengan data primer?
Pembahasan: Data sekunder biasanya digunakan untuk memetakan fenomena secara makro (contoh: data kemiskinan provinsi). Kemudian data primer digunakan untuk mendalami alasan mikronya (contoh: wawancara mendalam dengan beberapa keluarga miskin) untuk menjelaskan *mengapa* angka tersebut tinggi.
3. Apa yang dimaksud dengan “Data Mining” dalam konteks penggunaan data sekunder di era digital?
Pembahasan: Data mining adalah proses mengekstraksi pola dari kumpulan data sekunder yang sangat besar (big data), seperti rekam jejak transaksi jutaan pelanggan, untuk menemukan informasi baru yang berharga bagi strategi bisnis.
4. Bagaimana cara menguji keandalan (reliability) suatu data sekunder yang berupa dokumen sejarah?
Pembahasan: Melalui “Kritik Eksternal” (menguji keaslian fisik dokumen) dan “Kritik Internal” (menguji kredibilitas isi, membandingkan dengan catatan sejarah lain di era yang sama, dan melihat motif penulisnya).
5. Sebuah penelitian menemukan data penjualan (sekunder) yang anomali/berbeda drastis di satu bulan tertentu. Apa yang seharusnya dilakukan peneliti?
Pembahasan: Peneliti harus melakukan *cross-checking* (pengecekan silang) dengan sumber lain atau dokumen internal lainnya untuk mengetahui apakah itu murni tren pasar (misal efek pandemi) atau ada kesalahan pencatatan (*clerical error*) oleh pihak pertama.

Latihan Soal Data Sekunder

Tingkat Mudah

1. Apa perbedaan mendasar antara data primer dan sekunder berdasarkan sumbernya?
2. Sebutkan satu institusi pemerintah yang sering menjadi rujukan pencarian data sekunder di Indonesia!
3. Berikan contoh data sekunder berupa dokumen visual!
4. Apakah artikel dari jurnal ilmiah internasional merupakan data sekunder?
5. Mengapa data sekunder disebut menghemat waktu?

Tingkat Sedang

1. Sebutkan 3 kriteria memilih data sekunder yang baik!
2. Jika Anda membuat makalah tentang Pemanasan Global, sebutkan sumber data sekunder yang tepat!
3. Apa risiko menggunakan data sekunder dari blog pribadi?
4. Mengapa peneliti sering mengawali penelitiannya dengan mencari data sekunder terlebih dahulu?
5. Jelaskan perbedaan antara data sekunder internal dan eksternal pada sebuah perusahaan!

Tingkat Sulit

1. Rancanglah sebuah mini-riset yang 100% hanya menggunakan data sekunder. Jelaskan topik dan sumber datanya!
2. Lakukan evaluasi mengenai kelemahan data sekunder ketika variabel yang diukur sangat bersifat emosional/psikologis!
3. Jika dua sumber data sekunder resmi (misal Kementerian A dan B) mengeluarkan angka yang berbeda untuk hal yang sama, bagaimana peneliti harus menyikapinya?
4. Jelaskan peran *Literature Review* dalam pengumpulan data sekunder!
5. Bagaimana cara menyitasi (mengutip) data sekunder agar terhindar dari plagiarisme?

3. Data Mentah

Materi: Data Mentah

Data Mentah (Raw Data) adalah data yang baru saja dikumpulkan dan belum mengalami proses pengolahan, pembersihan (cleaning), atau analisis apa pun. Data ini belum siap untuk disajikan menjadi sebuah informasi.

  • Karakteristik: Berupa tumpukan angka, catatan lapangan acak, rekaman audio yang belum ditranskrip, atau lembar kuesioner yang baru diisi.
  • Contoh: Daftar nilai ulangan siswa yang belum diurutkan, log server komputer (kode acak), atau kumpulan titik koordinat GPS.
  • Langkah Selanjutnya: Data mentah harus melalui proses data processing (seperti editing, coding, tabulating) untuk mengubahnya menjadi informasi yang bermakna.

Contoh Soal Data Mentah

Tingkat Mudah

1. Apa yang dimaksud dengan data mentah?
Pembahasan: Data mentah adalah data asli yang baru saja dikumpulkan dari lapangan dan belum diubah, disortir, atau diolah sama sekali.
2. Berikan contoh data mentah di sekolah!
Pembahasan: Kertas ujian siswa yang baru saja dikumpulkan dan belum dinilai atau direkap oleh guru.
3. Apakah rata-rata nilai kelas termasuk data mentah?
Pembahasan: Tidak. Rata-rata nilai sudah merupakan hasil pengolahan perhitungan matematika, sehingga disebut informasi/data olahan.
4. Mengapa data mentah tidak bisa langsung digunakan untuk membuat kesimpulan?
Pembahasan: Karena datanya masih acak, mungkin mengandung kesalahan (error), dan belum membentuk pola yang dapat dibaca.
5. Apa sebutan lain untuk data mentah dalam bahasa Inggris?
Pembahasan: Sebutan lainnya adalah Raw Data.

Tingkat Sedang

1. Apa langkah pertama yang harus dilakukan setelah peneliti mendapatkan data mentah dari survei?
Pembahasan: Melakukan Data Editing (pemeriksaan kelengkapan, kejelasan, dan konsistensi jawaban dari kuesioner sebelum diinput ke komputer).
2. Dalam penelitian kualitatif, contoh data mentahnya adalah rekaman audio wawancara. Bagaimana cara mengolahnya?
Pembahasan: Dengan melakukan transkripsi, yaitu mengetik ulang semua percakapan dalam audio tersebut ke dalam bentuk teks untuk kemudian dianalisis temanya.
3. Jelaskan pentingnya tahapan “Data Cleaning” pada kumpulan data mentah!
Pembahasan: Untuk membuang data yang rusak, *missing values* (kosong), atau salah ketik (*typo*). Jika data mentah yang cacat ini tidak dibersihkan, hasil akhir analisis akan salah (prinsip *Garbage in, Garbage out*).
4. Apa yang dimaksud dengan proses “Coding” terhadap data mentah?
Pembahasan: Pemberian kode atau simbol berupa angka/huruf pada data mentah agar mudah dikelompokkan. Misalnya jawaban “Pria” diberi kode 1, dan “Wanita” diberi kode 2.
5. Budi mengukur suhu udara setiap jam. Data yang terkumpul adalah: 25, 26, 25, 27, 28. Termasuk apakah deret angka tersebut?
Pembahasan: Termasuk data mentah karena itu adalah catatan langsung dari alat ukur yang belum diringkas ke dalam bentuk tabel frekuensi atau grafik.

Tingkat Sulit

1. Dalam konteks Ilmu Komputer, jelaskan masalah pengolahan data mentah pada “Unstructured Data”!
Pembahasan: *Unstructured data* mentah (seperti teks di media sosial, video, atau gambar) tidak memiliki format baris dan kolom yang rapi. Masalahnya adalah komputer tidak bisa langsung membacanya dengan algoritma standar, sehingga memerlukan teknologi *Natural Language Processing* (NLP) atau *Computer Vision* untuk mengekstraksi fiturnya.
2. Bagaimana keberadaan pencilan (outliers) dalam data mentah mempengaruhi analisis statistik, dan bagaimana menyikapinya?
Pembahasan: Outliers adalah data ekstrem yang jauh berbeda dari mayoritas data. Keberadaannya dapat merusak perhitungan rata-rata (mean). Peneliti harus mengidentifikasi outlier saat eksplorasi data mentah dan memutuskan apakah menyeledikinya, mempertahankannya (jika itu fenomena nyata), atau menghapusnya (jika itu *error* input).
3. Apa bedanya transformasi data mentah dengan manipulasi data?
Pembahasan: Transformasi data adalah mengubah skala/bentuk matematis data mentah (misal ke bentuk logaritma) agar memenuhi asumsi statistik secara etis. Manipulasi data adalah tindakan tidak etis mengubah, memalsukan, atau menghapus angka dengan sengaja agar hasil penelitian sesuai dengan keinginan peneliti.
4. Pada sistem sensor *Internet of Things* (IoT), data mentah dihasilkan setiap detik. Mengapa menyimpan semua data mentah tersebut terkadang bukan pilihan yang baik?
Pembahasan: Karena menghasilkan volume data yang sangat masif (Big Data), memakan biaya *storage* (penyimpanan) server yang besar, dan banyak di antaranya berulang (redundan). Solusinya adalah melakukan pemrosesan di pinggir (*Edge Computing*) dan hanya menyimpan data agregasinya saja.
5. Jelaskan proses enkripsi pada data mentah di bidang keamanan siber dan mengapa itu krusial?
Pembahasan: Enkripsi adalah proses mengacak data mentah (misal: password atau kartu kredit dalam teks biasa) menjadi teks rahasia (*ciphertext*) menggunakan algoritma matematis. Sangat krusial agar jika ada peretas yang mencuri *database*, mereka hanya melihat kode acak yang tidak bermakna tanpa kunci dekripsi.

Latihan Soal Data Mentah

Tingkat Mudah

1. Apa sifat paling utama dari data mentah?
2. Sebutkan satu contoh data mentah di lingkungan rumah sakit!
3. Mengapa melihat data mentah berjumlah ribuan baris sangat membingungkan manusia?
4. Apa bentuk akhir setelah data mentah selesai diolah?
5. Benar atau Salah: Kumpulan resep masakan yang dibukukan disebut data mentah. (Jelaskan alasanmu)

Tingkat Sedang

1. Sebutkan urutan siklus secara umum dari: Informasi, Pengolahan, dan Data Mentah!
2. Apa perbedaan data mentah kualitatif dan kuantitatif?
3. Sebutkan *software* (perangkat lunak) yang umum digunakan untuk menginput dan menyortir data mentah berupa angka!
4. Apa akibatnya jika kita salah memasukkan data mentah ke dalam program analisis?
5. Jelaskan arti “Missing Value” dalam sekumpulan data mentah!

Tingkat Sulit

1. Buatlah satu studi kasus mulai dari munculnya data mentah hingga menjadi visualisasi data yang siap dipresentasikan!
2. Dalam Machine Learning, mengapa data mentah harus dibagi menjadi “Training Data” dan “Testing Data”?
3. Analisis hukum privasi perlindungan data. Apakah data mentah berupa nama dan NIK boleh disebarluaskan?
4. Jelaskan perbedaan *Data Tabulation* dan *Data Classification* saat menangani data mentah!
5. Diskusikan solusi efektif untuk mengubah puluhan ribu lembar kertas kuesioner fisik (data mentah) menjadi database digital secara cepat tanpa mengetik manual!
Materi Data: Pengumpulan, Pembulatan, dan Pemeriksaan

Pengumpulan, Pembulatan, dan Pemeriksaan Data

1. Pengumpulan Data

Ringkasan Materi

Pengumpulan data adalah proses mencari, mencatat, dan mengumpulkan informasi untuk dianalisis. Berdasarkan jenisnya, data dibagi menjadi data kualitatif (deskriptif) dan kuantitatif (angka). Berdasarkan sumbernya, ada data primer (diambil langsung) dan data sekunder (dari pihak lain). Metode yang umum digunakan meliputi: Wawancara (tanya jawab langsung), Observasi (pengamatan), dan Kuesioner/Angket (daftar pertanyaan tertulis).

Contoh Soal & Pembahasan

Tingkat: Mudah

  1. Soal: Apa yang dimaksud dengan data kuantitatif?
    Pembahasan: Data kuantitatif adalah data yang dinyatakan dalam bentuk angka atau bilangan yang dapat dihitung dan diukur secara pasti.
  2. Soal: Sebutkan tiga metode pengumpulan data yang paling umum!
    Pembahasan: Tiga metode tersebut adalah Wawancara, Kuesioner (angket), dan Observasi (pengamatan langsung).
  3. Soal: Data warna kesukaan siswa kelas 5 SD termasuk ke dalam jenis data apa?
    Pembahasan: Data kualitatif, karena berupa kategori atau sifat (merah, biru, dll) bukan berupa angka ukur.
  4. Soal: Apa nama alat yang berisi daftar pertanyaan untuk diisi oleh responden?
    Pembahasan: Kuesioner atau Angket.
  5. Soal: Mengambil data dari laporan Badan Pusat Statistik (BPS) termasuk pengumpulan data apa?
    Pembahasan: Data sekunder, karena peneliti tidak mencari data langsung ke lapangan melainkan menggunakan data yang sudah dikumpulkan instansi lain.

Tingkat: Sedang

  1. Soal: Budi ingin meneliti pengaruh kebisingan terhadap konsentrasi belajar teman-temannya. Ia mengamati tingkah laku temannya saat ada suara keras. Metode apa yang digunakan Budi?
    Pembahasan: Metode Observasi (pengamatan). Budi mengamati dan mencatat perilaku subjek penelitian secara langsung di lokasi.
  2. Soal: Jelaskan kelebihan pengumpulan data menggunakan kuesioner online (misal: Google Form)!
    Pembahasan: Lebih hemat biaya, hemat waktu, jangkauan responden sangat luas (bisa beda kota/negara), dan data langsung terekap secara otomatis oleh sistem.
  3. Soal: Kapan seorang peneliti sebaiknya menggunakan metode wawancara dibandingkan kuesioner?
    Pembahasan: Ketika peneliti membutuhkan jawaban yang mendalam, kompleks, serta butuh melihat ekspresi/reaksi responden yang tidak bisa diwakili oleh pilihan ganda di kertas.
  4. Soal: Apa perbedaan utama antara sensus dan *sampling*?
    Pembahasan: Sensus mengambil data dari seluruh populasi secara keseluruhan, sedangkan sampling hanya mengambil sebagian kecil (sampel) yang dianggap mewakili populasi tersebut.
  5. Soal: Sebutkan satu kelemahan dari metode observasi!
    Pembahasan: Butuh waktu yang relatif lama dan terkadang subjek yang diamati akan mengubah perilakunya (bertindak tidak natural) ketika tahu sedang diamati.

Tingkat: Sulit

  1. Soal: Bagaimana cara mencegah terjadinya *bias responden* saat merancang kuesioner?
    Pembahasan: Gunakan bahasa yang netral dan tidak menggiring opini, pastikan responden paham bahwa identitas mereka anonim agar menjawab jujur, dan hindari pertanyaan ganda dalam satu kalimat (*double-barreled questions*).
  2. Soal: Sebuah perusahaan ingin mengetahui respons emosional pelanggan terhadap perubahan rasa produk mereka. Mengapa kuesioner skala 1-5 tidak cukup, dan metode apa yang lebih tepat?
    Pembahasan: Skala 1-5 hanya memberi tahu tingkat kesukaan (angka), namun gagal menangkap *alasan emosional* spesifik. Metode yang lebih tepat adalah *Focus Group Discussion* (FGD) atau wawancara mendalam (In-depth Interview).
  3. Soal: Jelaskan perbedaan antara *Stratified Random Sampling* dan *Simple Random Sampling*!
    Pembahasan: *Simple Random Sampling* mengambil sampel secara acak murni dari populasi. *Stratified Random Sampling* mengelompokkan populasi ke dalam tingkatan/strata terlebih dahulu (misal: kelas bawah, menengah, atas), baru mengambil sampel acak dari masing-masing strata tersebut agar representatif.
  4. Soal: Apa dampak sistemik jika data sekunder yang digunakan dalam penelitian kebijakan publik sudah kedaluwarsa (outdated)?
    Pembahasan: Kesimpulan analisis menjadi tidak relevan dengan realitas saat ini, sehingga kebijakan yang diambil bisa salah sasaran, merugikan anggaran negara, dan tidak menyelesaikan masalah riil di masyarakat.
  5. Soal: Jika *response rate* (tingkat pengembalian) dari kuesioner yang disebar sangat rendah, apa intervensi yang bisa dilakukan peneliti tanpa mengubah topik penelitian?
    Pembahasan: Melakukan *follow-up* (pengingat), memberikan insentif kecil bagi yang mengisi, menyederhanakan desain kuesioner agar lebih cepat diisi, atau beralih ke metode campuran (mendatangi sebagian target untuk diwawancara langsung).

Latihan Soal (Pengumpulan Data)

Mudah

  1. Apa pengertian dari data sekunder?
  2. Berikan dua contoh data kualitatif!
  3. Apa fungsi utama dari kuesioner?
  4. Mengukur berat badan siswa di kelas menggunakan timbangan termasuk metode apa?
  5. Sebutkan sumber data yang digunakan jika kita membaca jurnal penelitian orang lain!

Sedang

  1. Mengapa sensus penduduk di Indonesia tidak dilakukan setiap tahun?
  2. Apa saja syarat pertanyaan yang baik dalam sebuah angket?
  3. Berikan contoh situasi di mana metode wawancara tidak efektif digunakan!
  4. Apa bedanya data diskrit dan data kontinu dalam ranah kuantitatif?
  5. Bagaimana cara memperoleh data primer dalam penelitian biologi?

Sulit

  1. Rancanglah 3 contoh pertanyaan kuesioner tertutup yang mengukur kepuasan pelanggan pelayanan rumah sakit tanpa unsur bias!
  2. Analisis risiko kebocoran privasi (*privacy breach*) dalam pengumpulan data berbasis aplikasi digital!
  3. Bagaimana cara memverifikasi keabsahan (validitas) data yang didapat murni dari wawancara narasumber tunggal?
  4. Apa yang terjadi pada kesimpulan penelitian jika teknik *sampling* yang dipilih salah sasaran? Berikan contohnya!
  5. Bandingkan efektivitas metode pengumpulan data *longitudinal* (jangka panjang) dibandingkan *cross-sectional* (satu waktu) pada penelitian kesehatan!

2. Pembulatan Data

Ringkasan Materi

Pembulatan dilakukan untuk menyederhanakan angka agar lebih mudah dipahami atau sesuai dengan batas toleransi pengukuran. Aturan umum: Jika angka yang akan dihilangkan kurang dari 5 (0,1,2,3,4), maka angka di depannya tetap (pembulatan ke bawah). Jika 5 atau lebih (5,6,7,8,9), angka di depannya ditambah 1 (pembulatan ke atas). Pembulatan bisa dilakukan ke satuan, puluhan, ratusan terdekat, maupun jumlah tempat desimal tertentu.

Contoh Soal & Pembahasan

Tingkat: Mudah

  1. Soal: Bulatkan angka 7,3 ke satuan terdekat!
    Pembahasan: Angka di belakang koma adalah 3 (kurang dari 5). Maka dibulatkan ke bawah menjadi 7.
  2. Soal: Bulatkan angka 15,8 ke satuan terdekat!
    Pembahasan: Angka di belakang koma adalah 8 (lebih dari 5). Maka dibulatkan ke atas menjadi 16.
  3. Soal: Bulatkan 42 ke puluhan terdekat!
    Pembahasan: Angka satuannya 2. Dibulatkan ke bawah menjadi 40.
  4. Soal: Bulatkan 187 ke ratusan terdekat!
    Pembahasan: Angka puluhannya adalah 8. Karena lebih besar dari 5, ratusan naik satu. Menjadi 200.
  5. Soal: Bulatkan 3,14 ke satu tempat desimal!
    Pembahasan: Angka desimal kedua adalah 4. Maka angka pertama tetap. Hasil: 3,1.

Tingkat: Sedang

  1. Soal: Bulatkan 9.999 ke puluhan terdekat!
    Pembahasan: Angka satuannya 9 (naik). Puluhan 9+1=10, nyimpan 1 ke ratusan, dan seterusnya. Hasilnya adalah 10.000.
  2. Soal: Sebuah barang harganya Rp 14.550. Bulatkan ke ribuan terdekat!
    Pembahasan: Angka ratusannya adalah 5 (bulat ke atas). Ribuan (4) ditambah 1. Menjadi Rp 15.000.
  3. Soal: Hitung 5,23 + 2,1 lalu bulatkan hasilnya ke satu tempat desimal!
    Pembahasan: 5,23 + 2,1 = 7,33. Angka desimal kedua adalah 3 (bulat ke bawah). Hasilnya 7,3.
  4. Soal: Bulatkan 0,0856 ke dua tempat desimal!
    Pembahasan: Angka desimal ketiga adalah 5. Bulat ke atas. Angka desimal kedua (8) ditambah 1. Menjadi 0,09.
  5. Soal: Panjang tali 12,45 meter. Bulatkan ke persepuluhan terdekat!
    Pembahasan: Persepuluhan berarti satu angka di belakang koma. Angka setelahnya adalah 5. Dibulatkan ke atas menjadi 12,5 meter.

Tingkat: Sulit

  1. Soal: Diketahui x = 4,2 (merupakan hasil pembulatan ke 1 tempat desimal). Tentukan batas minimum dan batas maksimum dari nilai x yang sebenarnya!
    Pembahasan: Nilai asli x sebelum dibulatkan berada pada interval: 4,15 ≤ x < 4,25.
  2. Soal: Hitung luas persegi panjang dengan panjang 12,3 cm dan lebar 4,5 cm menggunakan aturan angka penting!
    Pembahasan: Luas = 12,3 (3 Angka Penting) × 4,5 (2 Angka Penting) = 55,35. Hasil perkalian harus memiliki angka penting paling sedikit, yaitu 2 AP. Maka 55,35 dibulatkan menjadi 55 cm².
  3. Soal: Terapkan aturan Banker’s Rounding (pembulatan genap terdekat) untuk membulatkan 2,45 dan 2,55 ke satu tempat desimal!
    Pembahasan: Jika berakhiran tepat 5, bulatkan ke angka genap terdekat. 2,45 genap terdekatnya adalah 2,4. 2,55 genap terdekatnya adalah 2,6.
  4. Soal: Sebuah perusahaan mencetak keuntungan Rp 1.234.500.000. Laporan harus disajikan dalam satuan “Miliar Rupiah” dengan 1 tempat desimal. Berapa angka yang dilaporkan dan berapakah persentase galat (*error*) pembulatannya?
    Pembahasan: Angka: 1,2 Miliar. Selisih (galat): 1.234.500.000 – 1.200.000.000 = 34.500.000. Persentase galat = (34.500.000 / 1.234.500.000) × 100% ≈ 2,79%.
  5. Soal: Suatu populasi tercatat sebanyak 2,5 juta jiwa yang merupakan hasil pembulatan ke ratusan ribu terdekat. Berapa selisih maksimal antara populasi asli dengan populasi yang dilaporkan?
    Pembahasan: Pembulatan ke 100.000 terdekat berarti rentang aslinya adalah ± 50.000 (yaitu dari 2.450.000 hingga kurang dari 2.550.000). Maka selisih maksimalnya mendekati 50.000 jiwa.

Latihan Soal (Pembulatan Data)

Mudah

  1. Bulatkan 8,4 ke satuan terdekat!
  2. Bulatkan 17,9 ke satuan terdekat!
  3. Bulatkan 56 ke puluhan terdekat!
  4. Bulatkan 340 ke ratusan terdekat!
  5. Bulatkan 4,56 ke satu tempat desimal!

Sedang

  1. Bulatkan angka 45.890 ke ribuan terdekat!
  2. Hitung 8,88 + 1,11 dan bulatkan ke satu tempat desimal!
  3. Bulatkan 0,995 ke dua tempat desimal!
  4. Jika harga diskon adalah Rp 89.950, bulatkan ke ratusan terdekat!
  5. Bulatkan 15,45 kg ke persepuluhan terdekat!

Sulit

  1. Tentukan batas interval sebenarnya dari sebuah tiang yang tingginya dilaporkan 15 meter (dibulatkan ke satuan terdekat)!
  2. Hitung volume kubus yang panjang sisinya 3,2 cm menggunakan aturan angka penting!
  3. Jelaskan mengapa metode Banker’s Rounding dianggap lebih baik untuk memproses jutaan baris data keuangan dibandingkan pembulatan sekolah biasa!
  4. Hitung persentase galat relatif jika angka 949 dibulatkan ke ratusan terdekat!
  5. Jumlahkan 12,4 ; 5,55; dan 1,001 kemudian tuliskan hasilnya menggunakan aturan penjumlahan angka penting!

3. Pemeriksaan Terhadap Data

Ringkasan Materi

Pemeriksaan data (Data Cleaning/Validation) adalah langkah penting sebelum menganalisis data untuk memastikan akurasi dan kualitasnya. Langkah ini meliputi: mengecek kesalahan ketik (typo), mendeteksi nilai ekstrim/pencilan (outliers), menangani data yang kosong (missing values), menghapus data ganda (duplicates), dan memastikan format data konsisten (misalnya penulisan tanggal).

Contoh Soal & Pembahasan

Tingkat: Mudah

  1. Soal: Apa tujuan utama dari pemeriksaan data?
    Pembahasan: Untuk memastikan data akurat, konsisten, dan bebas dari error sebelum dilakukan analisis, sehingga kesimpulan yang ditarik menjadi valid.
  2. Soal: Pada kolom “Usia Karyawan”, ditemukan angka 180. Kesalahan apa ini?
    Pembahasan: Ini adalah kesalahan input/typo (nilai tidak masuk akal), karena usia manusia normal tidak mencapai 180 tahun. Kemungkinan salah ketik dari angka 18 atau 80.
  3. Soal: Mengapa data yang terduplikasi (ganda) harus dihapus?
    Pembahasan: Data ganda akan membuat hasil analisis menjadi bias (berlebihan), misalnya rata-rata atau jumlah total menjadi tidak akurat.
  4. Soal: Apa istilah untuk sel/baris yang datanya tidak terisi oleh responden dalam sebuah tabel?
    Pembahasan: Data kosong atau Missing Value.
  5. Soal: Sebutkan satu cara paling sederhana untuk memeriksa kesalahan input pada data jumlah kecil!
    Pembahasan: Melakukan pengecekan ulang secara visual dengan membandingkan data di komputer dan data di lembar sumber (kuesioner fisik).

Tingkat: Sedang

  1. Soal: Apa itu Outlier (pencilan) dalam sekumpulan data?
    Pembahasan: Pencilan adalah titik data yang nilainya terpaut sangat jauh (terlalu tinggi atau terlalu rendah) dibandingkan dengan sebagian besar data lainnya dalam kelompok tersebut.
  2. Soal: Ditemukan 5 baris data kosong pada kolom “Penghasilan” dari 100 responden. Tindakan apa yang bisa dilakukan?
    Pembahasan: Bisa menghapus 5 baris tersebut jika dianggap tidak signifikan, atau melakukan imputasi dengan mengisi nilai rata-rata (mean) atau median dari penghasilan 95 responden lainnya.
  3. Soal: Kolom “Jenis Kelamin” didefinisikan dengan kode 1=Laki-laki dan 2=Perempuan. Saat diperiksa, ada yang berisi angka 5. Disebut error apakah ini?
    Pembahasan: Kesalahan Validasi (*Range/Domain error*), di mana data yang dimasukkan berada di luar opsi batas yang diizinkan.
  4. Soal: Mengapa penyeragaman format seperti penulisan tanggal (DD/MM/YYYY) sangat penting?
    Pembahasan: Agar sistem komputer atau software statistik tidak salah menginterpretasikan bulan sebagai tanggal, yang dapat merusak pengurutan data kronologis.
  5. Soal: Bagaimana cara mendeteksi typo pada kolom teks (misalnya kolom Kota)?
    Pembahasan: Dengan menggunakan fitur filter atau Unique Values di Excel/sistem. Misalnya, akan terlihat ada “Jakarta”, “Jkrta”, dan “Jakrta” yang merujuk pada kota yang sama.

Tingkat: Sulit

  1. Soal: Jelaskan perbedaan antara Missing Completely at Random (MCAR) dan Missing Not at Random (MNAR) serta dampaknya!
    Pembahasan: MCAR berarti data hilang secara acak murni (misal: kertas kuesioner hilang ditiup angin); tidak membuat hasil bias. MNAR berarti hilangnya data memiliki pola tersembunyi (misal: orang berpenghasilan rendah malu mengisi kolom gaji); ini akan membuat hasil analisis sangat bias ke atas.
  2. Soal: Diberikan dataset: 10, 12, 11, 14, 15, 80. Secara statistik deskriptif, metode apa yang objektif untuk menetapkan angka 80 sebagai pencilan (outlier)?
    Pembahasan: Menggunakan metode Jangkauan Antarkuartil (IQR). Hitung Q1 dan Q3. IQR = Q3 – Q1. Batas atas pencilan adalah Q3 + (1,5 × IQR). Angka 80 akan jatuh jauh di atas batas ini, sehingga sah disebut pencilan.
  3. Soal: Bagaimana strategi untuk memeriksa dan memvalidasi dataset raksasa (Big Data) jutaan baris yang tidak mungkin dicek manual?
    Pembahasan: Menggunakan skrip pemrograman (seperti Python/SQL) untuk membangun aturan validasi otomatis (*rule-based validation*), memeriksa anomali lewat statistik deskriptif agregat (min, max, standar deviasi), dan menggunakan visualisasi data seperti *box-plot* atau *scatter plot* untuk melihat pola aneh sekilas.
  4. Soal: Jika menggabungkan dua sumber data (misal Data Bank A dan Data Pajak), lalu ada konflik beda alamat untuk satu NIK yang sama, bagaimana cara melakukan resolusinya?
    Pembahasan: Tentukan Single Source of Truth (sumber data utama yang paling dipercaya), cek *timestamp* untuk mengambil data yang paling baru diperbarui (terkini), atau lakukan konfirmasi silang ke instansi master (Dukcapil).
  5. Soal: Apa risiko melakukan imputasi nilai kosong dengan “Nilai Rata-rata” (Mean) pada dataset yang grafiknya sangat menceng (skewed)?
    Pembahasan: Rata-rata pada data menceng sangat dipengaruhi oleh nilai ekstrim, sehingga nilai rata-rata tersebut tidak merepresentasikan kondisi mayoritas. Mengisi kekosongan dengan nilai ini akan merusak varians data asli. Lebih baik menggunakan nilai Median atau model prediksi (K-NN).

Latihan Soal (Pemeriksaan Data)

Mudah

  1. Apa yang dimaksud dengan validasi data?
  2. Sebutkan dampak jika data salah digunakan dalam pengambilan keputusan!
  3. Berikan contoh kesalahan ketik (typo) pada pengisian berat badan bayi!
  4. Apa istilah asing untuk “data yang tidak memiliki nilai/kosong”?
  5. Mengapa kolom “Email” seringkali diperiksa dengan tanda “@”?

Sedang

  1. Bagaimana cara termudah mendeteksi data duplikat di spreadsheet seperti Excel?
  2. Apa yang harus dilakukan peneliti jika mendapati kuesioner kertas yang tulisan tangannya tidak terbaca?
  3. Sebutkan dua cara menangani data kosong (*missing values*) pada sebuah tabel!
  4. Berikan dua alasan mengapa nilai *outlier* (pencilan) bisa muncul di sekumpulan data!
  5. Berikan contoh inkonsistensi format penulisan nomor telepon seluler!

Sulit

  1. Rancanglah 3 aturan logika komputer (*logic rules*) sederhana untuk menolak input Tanggal Lahir palsu pada formulir asuransi jiwa!
  2. Dalam skenario analitik apa sebuah *outlier* dilarang keras untuk dihapus dan justru menjadi fokus utama penelitian? Berikan alasanmu!
  3. Dataset: 5, 6, 7, 7, 8, 9, 30. Hitung batas atas pencilan (Outlier) menggunakan rumus IQR dan pastikan apakah 30 adalah pencilan!
  4. Evaluasi kerugian statistik dari menghapus 20% baris keseluruhan (Listwise Deletion) hanya karena baris tersebut mengandung satu sel kosong pada survei pemilu!
  5. Jelaskan apa yang dimaksud dengan pemeriksaan menggunakan algoritma *Checksum* pada integritas perpindahan data digital!
Materi Statistika: Mencatat Data dengan Tally (Turus)

Mencatat Data dengan Tally (Turus)

A. Materi Pembelajaran

Turus atau Tally adalah salah satu cara untuk mencatat atau mengumpulkan data dalam statistika dasar. Metode ini sangat berguna untuk menghitung jumlah (frekuensi) dari suatu kejadian atau benda secara cepat tanpa takut ada yang terlewat.

Aturan Menulis Turus:

  • Setiap satu hitungan ditandai dengan satu garis lurus vertikal (|).
  • Hitungan kedua ditandai dengan garis kedua (||), hitungan ketiga (|||), dan keempat (||||).
  • Pada hitungan kelima, kita mencoret keempat garis sebelumnya secara diagonal atau menyilang. Dalam materi ini kita menuliskannya seperti ini: ||||.
  • Tujuan pengelompokan setiap 5 hitungan ini adalah agar data lebih mudah dan cepat dihitung saat direkapitulasi.

Contoh Penulisan Angka ke Turus:

  • Angka 3 ditulis: |||
  • Angka 5 ditulis: ||||
  • Angka 7 ditulis: |||| ||
  • Angka 12 ditulis: |||| |||| ||

B. Contoh Soal dan Pembahasan

Tingkat: Mudah

1. Berapakah nilai angka dari turus ||| ?
Pembahasan: Terdapat 3 garis tegak, maka nilai turusnya adalah 3.
2. Bagaimana cara menuliskan angka 4 dalam bentuk turus?
Pembahasan: Angka 4 ditulis dengan empat garis tegak berjejer, yaitu ||||.
3. Berapakah nilai dari turus yang dicoret |||| ?
Pembahasan: Garis yang berjumlah empat dan dicoret melambangkan 1 kelompok yang bernilai 5.
4. Andi melihat 2 ekor kucing di jalan. Tuliskan jumlah kucing tersebut dalam turus!
Pembahasan: Jumlah kucing ada 2, maka turusnya adalah ||.
5. Berapakah nilai dari turus |||| | ?
Pembahasan: Ada satu kelompok lima bernilai 5, dan satu garis bernilai 1. Jadi, 5 + 1 = 6.

Tingkat: Sedang

6. Ubahlah angka 14 ke dalam bentuk turus!
Pembahasan: Angka 14 terdiri dari 5 + 5 + 4.
Turusnya adalah dua kelompok lima dan empat garis tegak: |||| |||| ||||.
7. Dalam sebuah kotak terdapat bola merah yang jika dihitung dengan turus hasilnya |||| |||| |||. Berapa jumlah bola merah tersebut?
Pembahasan: Terdapat 2 kelompok lima (2 x 5 = 10) dan 3 garis satuan. Total = 10 + 3 = 13 bola merah.
8. Data makanan kesukaan: Nasi Goreng disukai 8 orang. Tuliskan turus untuk Nasi Goreng!
Pembahasan: Angka 8 adalah 5 + 3. Maka turusnya adalah |||| |||.
9. Sebuah dadu dilempar berkali-kali. Angka 5 muncul sebanyak |||| ||||. Berapa kali angka 5 tersebut muncul?
Pembahasan: Terdapat dua kelompok lima secara utuh. Maka 5 + 5 = 10 kali.
10. Budi mengumpulkan 17 daun kering. Buatlah pencatatan turus dari daun Budi!
Pembahasan: Angka 17 didapat dari 5 + 5 + 5 + 2.
Penulisan turusnya adalah |||| |||| |||| ||.

Tingkat: Sulit

11. Perhatikan data nilai Matematika siswa berikut: 7, 8, 7, 9, 8, 8, 7, 8, 9. Buatlah turus khusus untuk siswa yang mendapat nilai 8!
Pembahasan: Pertama, cari angka 8 pada data. Terdapat 4 buah angka 8.
Maka, turus untuk siswa yang mendapat nilai 8 adalah ||||.
12. Di kelas VI ada 32 siswa. Diketahui 15 siswa menyukai olahraga sepak bola, 10 siswa menyukai basket, dan sisanya menyukai renang. Buatlah bentuk turus untuk siswa yang menyukai renang!
Pembahasan:
Siswa yang suka renang = Total siswa – (Suka sepak bola + Suka basket)
Siswa suka renang = 32 – (15 + 10) = 32 – 25 = 7 siswa.
Angka 7 dalam turus ditulis |||| ||.
13. Selisih pengunjung perpustakaan pada hari Senin (turus: |||| |||| |||) dan hari Selasa (turus: |||| ||) adalah…
Pembahasan:
Pengunjung Senin = 13 orang.
Pengunjung Selasa = 7 orang.
Selisih = 13 – 7 = 6 orang.
14. Pak Tani memanen tomat sebanyak |||| |||| |||| |||| |||. Ternyata setelah diperiksa, 6 tomat busuk. Tuliskan sisa tomat yang bagus dalam bentuk turus!
Pembahasan:
Total panen tomat = 23 buah (4 kelompok lima + 3).
Tomat busuk = 6 buah.
Tomat bagus = 23 – 6 = 17 buah.
Turus untuk angka 17 adalah |||| |||| |||| ||.
15. Dalam survei 25 orang dewasa, turus kelompok pria yang didata adalah |||| |||| |||| |. Berapa jumlah responden wanita dan bagaimana penulisan turusnya?
Pembahasan:
Jumlah pria (dari turus) = 16 orang.
Jumlah wanita = Total orang – Pria = 25 – 16 = 9 orang.
Penulisan turus untuk wanita (9) adalah |||| ||||.

C. Latihan Soal (Uji Pemahaman)

Kerjakan soal-soal di bawah ini dengan teliti!

Latihan Tingkat Mudah

  1. Tuliskan angka 2 dalam bentuk turus!
  2. Berapa nilai dari |||| ?
  3. Jika ada 5 buah apel, bagaimana bentuk turus keseluruhannya?
  4. Ubah |||| || menjadi angka!
  5. Dita membeli 3 pensil. Buatkan turus dari jumlah pensil Dita!

Latihan Tingkat Sedang

  1. Ubahlah angka 11 ke dalam penulisan turus!
  2. Hitung jumlah dari turus berikut: |||| |||| ||||
  3. Di sebuah peternakan, sapi berjumlah 9 ekor. Tuliskan bentuk turusnya!
  4. Sebuah survei warna motor melewati gerbang: Hitam (|||| |), Putih (|||| |||). Warna apa yang paling banyak lewat dan berapa jumlah pastinya?
  5. Gabungkan turus |||| dan |||, lalu sebutkan nilai totalnya!

Latihan Tingkat Sulit

  1. Diketahui data hobi 20 anak kelas IV: 8 anak hobi melukis, 5 anak hobi menari, dan sisanya hobi bernyanyi. Buatlah turus untuk anak yang hobi bernyanyi!
  2. Tentukan total gabungan dari Kelompok A (turus: |||| |||| ||) dan Kelompok B (turus: |||| |||| ||||)! Tuliskan hasilnya dengan angka dan turus.
  3. Diberikan deretan data berat badan (dalam kg): 30, 31, 30, 32, 30, 31, 30, 33, 30, 30. Hitunglah berapa kali muncul berat badan 30 kg dan buatkan turusnya!
  4. Seorang pedagang sepatu mendata stoknya. Sepatu ukuran 40 ada |||| |||| |||| ||||. Hari itu terjual 7 pasang. Berapakah sisa sepatu ukuran 40? Gambarkan turus untuk sisa tersebut!
  5. Jumlah kursi di ruangan adalah 40 buah. Jika kursi yang terisi didata dengan turus |||| |||| |||| |||| |||| |||| ||, berapa jumlah kursi yang masih kosong? Buat bentuk turus kursi yang kosong!

By admin

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

You cannot copy content of this page