Data Primer, Data Sekunder & Data Mentah
dalam Statistika
π A. Data Primer
1. Pengertian Data Primer
Data primer adalah data yang diperoleh langsung dari sumber pertama (asli) oleh peneliti atau pengumpul data, tanpa melalui perantara.
Data ini dikumpulkan secara langsung dari objek yang diteliti, sehingga tingkat akurasi dan relevansinya sangat tinggi.
π Kegiatan Mengamati
Perhatikan situasi berikut: Seorang guru ingin mengetahui tinggi badan seluruh siswa kelas X. Guru tersebut langsung mengukur tinggi badan setiap siswa menggunakan alat ukur. Data tinggi badan yang diperoleh disebut data primer, karena guru memperoleh data tersebut secara langsung.
2. Ciri-Ciri Data Primer
- Dikumpulkan langsung oleh peneliti
- Belum pernah diolah atau dipublikasikan sebelumnya
- Bersifat orisinal dan aktual
- Memerlukan waktu, tenaga, dan biaya lebih besar untuk mengumpulkannya
- Tingkat keakuratan lebih tinggi karena sesuai kebutuhan penelitian
3. Metode Pengumpulan Data Primer
| No. | Metode | Penjelasan | Contoh |
|---|---|---|---|
| 1 | Wawancara | Tanya jawab langsung dengan responden | Mewawancarai petani tentang hasil panen |
| 2 | Kuesioner/Angket | Daftar pertanyaan tertulis yang dibagikan kepada responden | Menyebar angket kepuasan pelanggan |
| 3 | Observasi | Pengamatan langsung terhadap objek penelitian | Mengamati perilaku siswa saat belajar |
| 4 | Eksperimen | Percobaan untuk mendapatkan data | Uji coba pupuk terhadap pertumbuhan tanaman |
| 5 | Pengukuran | Menggunakan alat ukur untuk memperoleh data | Menimbang berat badan siswa |
β Kegiatan Menanya
Pertanyaan untuk direnungkan:
- Mengapa data primer dianggap lebih akurat dibandingkan data sekunder?
- Dalam situasi apa saja kita perlu menggunakan data primer?
- Apa kelemahan dari pengumpulan data primer?
4. Kelebihan dan Kekurangan Data Primer
| Kelebihan | Kekurangan |
|---|---|
| Data sesuai kebutuhan penelitian | Memerlukan biaya yang lebih besar |
| Lebih akurat dan dapat dipercaya | Memerlukan waktu yang lebih lama |
| Data bersifat aktual/terkini | Memerlukan tenaga lebih banyak |
| Peneliti mengetahui kualitas data | Cakupan bisa terbatas |
π§ Kegiatan Menalar
Seorang peneliti ingin mengetahui rata-rata uang saku siswa SMP Harapan. Ia menyebarkan angket kepada 30 siswa dan memperoleh data berikut (dalam ribuan rupiah):
10, 15, 10, 20, 15, 10, 25, 20, 15, 10, 20, 15, 25, 30, 10, 15, 20, 10, 15, 20, 25, 10, 15, 20, 30, 15, 10, 20, 15, 25
Data di atas merupakan data primer karena diperoleh langsung dari siswa melalui angket.
5. Contoh Data Primer dalam Kehidupan Sehari-hari
- Hasil pengukuran suhu tubuh pasien oleh perawat
- Data nilai ulangan yang dicatat langsung oleh guru
- Hasil survei kepuasan pelanggan di sebuah restoran
- Data penjualan harian yang dicatat oleh kasir
- Hasil pengamatan cuaca oleh stasiun meteorologi
π§ͺ Kegiatan Mencoba
Lakukan kegiatan berikut:
- Tanyakan kepada 10 teman sekelasmu: “Berapa jam kamu belajar di rumah setiap hari?”
- Catat jawaban mereka dalam tabel
- Data yang kamu peroleh adalah data primer
| No. | Nama | Jam Belajar |
|---|---|---|
| 1 | β¦ | β¦ |
| 2 | β¦ | β¦ |
| 3 | β¦ | β¦ |
| dst. hingga 10 | ||
π’ Kegiatan Mengkomunikasikan
Setelah mengumpulkan data jam belajar teman-temanmu, presentasikan hasilnya di depan kelas. Jelaskan:
- Metode pengumpulan data yang kamu gunakan
- Mengapa data tersebut termasuk data primer
- Kesimpulan sederhana dari data yang diperoleh
π Contoh Soal Data Primer
Tingkat Mudah (1β5)
Soal 1. Seorang guru mengukur tinggi badan 5 siswa dan memperoleh data: 150 cm, 155 cm, 160 cm, 148 cm, 162 cm. Termasuk jenis data apakah data tersebut? Jelaskan!
Soal 2. Andi menghitung jumlah kendaraan yang melewati jalan di depan sekolahnya selama 1 jam. Ia mencatat: 45 motor, 20 mobil, dan 5 truk. Apakah data yang dikumpulkan Andi termasuk data primer? Jelaskan!
Soal 3. Sebutkan 3 metode pengumpulan data primer!
1. Wawancara β tanya jawab langsung dengan narasumber
2. Kuesioner/Angket β daftar pertanyaan tertulis untuk responden
3. Observasi β pengamatan langsung terhadap objek penelitian
Soal 4. Ibu Sari menimbang berat badan 5 balita di posyandu dan memperoleh: 8 kg, 10 kg, 9 kg, 11 kg, 8,5 kg. Tentukan rata-rata berat badan balita tersebut dan jelaskan jenis datanya!
Rata-rata = (8 + 10 + 9 + 11 + 8,5) Γ· 5 = 46,5 Γ· 5 = 9,3 kg
Data ini termasuk data primer karena Ibu Sari menimbang langsung berat badan balita di posyandu.
Soal 5. Manakah yang termasuk data primer?
a) Data nilai ujian yang dicatat guru langsung dari hasil ujian siswa
b) Data penduduk yang diambil dari website BPS
c) Data cuaca yang dikutip dari koran
Tingkat Sedang (6β10)
Soal 6. Seorang peneliti menyebarkan angket kepada 20 siswa tentang waktu belajar harian (dalam jam). Data yang diperoleh: 2, 3, 1, 4, 2, 3, 2, 1, 3, 4, 2, 3, 1, 2, 3, 4, 2, 3, 2, 1. Buatlah tabel frekuensi dan tentukan modus dari data tersebut!
| Jam Belajar | Frekuensi |
|---|---|
| 1 | 4 |
| 2 | 7 |
| 3 | 6 |
| 4 | 3 |
| Jumlah | 20 |
Data ini merupakan data primer karena diperoleh langsung melalui angket.
Soal 7. Jelaskan perbedaan antara mengumpulkan data primer melalui wawancara dan melalui observasi! Berikan masing-masing 1 contoh!
Wawancara: Peneliti berinteraksi langsung dengan responden melalui tanya jawab. Contoh: mewawancarai pedagang tentang omzet harian.
Observasi: Peneliti hanya mengamati tanpa berinteraksi langsung. Contoh: mengamati jumlah pengunjung perpustakaan setiap jam.
Perbedaan utama: wawancara melibatkan komunikasi dua arah, sedangkan observasi bersifat satu arah (pengamatan saja).
Soal 8. Suhu udara diukur setiap 3 jam selama sehari di suatu kota. Data yang diperoleh (Β°C): 22, 24, 28, 32, 30, 27, 24, 23. Hitunglah rata-rata dan jangkauan (range) suhu tersebut!
Rata-rata = (22+24+28+32+30+27+24+23) Γ· 8 = 210 Γ· 8 = 26,25Β°C
Jangkauan = Nilai maks β Nilai min = 32 β 22 = 10Β°C
Data ini data primer karena diukur langsung oleh pengamat.
Soal 9. Dalam sebuah survei, 30 orang ditanya tentang merek smartphone yang digunakan. Hasilnya: Samsung (12), iPhone (8), Xiaomi (6), Oppo (4). Tentukan persentase pengguna masing-masing merek!
Samsung = (12/30) Γ 100% = 40%
iPhone = (8/30) Γ 100% = 26,67%
Xiaomi = (6/30) Γ 100% = 20%
Oppo = (4/30) Γ 100% = 13,33%
Jumlah = 100%. Data ini data primer karena dikumpulkan langsung melalui survei.
Soal 10. Seorang siswa melakukan eksperimen untuk mengukur waktu tempuh bola jatuh bebas dari ketinggian 5 meter. Ia melakukan 5 percobaan: 1,01 s; 1,00 s; 1,02 s; 0,99 s; 1,01 s. Hitunglah rata-rata dan jelaskan mengapa ini data primer!
Rata-rata = (1,01+1,00+1,02+0,99+1,01) Γ· 5 = 5,03 Γ· 5 = 1,006 s
Data ini termasuk data primer karena diperoleh langsung melalui eksperimen/percobaan yang dilakukan sendiri oleh siswa. Metode pengumpulannya adalah eksperimen.
Tingkat Sulit (11β15)
Soal 11. Seorang peneliti ingin mengetahui hubungan antara jam belajar dan nilai ujian. Ia mengumpulkan data berikut dari 8 siswa:
| Siswa | Jam Belajar (x) | Nilai Ujian (y) |
|---|---|---|
| A | 2 | 60 |
| B | 3 | 65 |
| C | 4 | 75 |
| D | 5 | 80 |
| E | 1 | 50 |
| F | 6 | 85 |
| G | 3 | 70 |
| H | 4 | 72 |
Hitunglah rata-rata jam belajar dan rata-rata nilai ujian. Jelaskan mengapa data ini termasuk data primer dan metode apa yang digunakan!
Rata-rata jam belajar (xΜ) = (2+3+4+5+1+6+3+4) Γ· 8 = 28 Γ· 8 = 3,5 jam
Rata-rata nilai ujian (Θ³) = (60+65+75+80+50+85+70+72) Γ· 8 = 557 Γ· 8 = 69,625
Data ini termasuk data primer karena peneliti mengumpulkan langsung dari siswa. Metode yang digunakan bisa berupa wawancara (menanyakan jam belajar) dan pengukuran (mencatat nilai ujian dari hasil ujian langsung).
Soal 12. Sebuah perusahaan melakukan survei kepuasan pelanggan dengan skala 1β5. Data dari 25 responden dikumpulkan langsung melalui wawancara. Hasilnya:
4, 5, 3, 4, 5, 4, 3, 5, 4, 4, 3, 5, 4, 4, 5, 3, 4, 5, 4, 3, 4, 5, 4, 3, 4
a) Buatlah tabel distribusi frekuensi!
b) Hitunglah mean, median, dan modus!
c) Jelaskan mengapa ini data primer!
a) Tabel distribusi frekuensi:
| Skor | Frekuensi |
|---|---|
| 3 | 6 |
| 4 | 12 |
| 5 | 7 |
| Jumlah | 25 |
Mean = (3Γ6 + 4Γ12 + 5Γ7) Γ· 25 = (18+48+35) Γ· 25 = 101 Γ· 25 = 4,04
Median: data ke-13 dari 25 data yang diurutkan. Data ke-13 jatuh pada skor 4
Modus = nilai dengan frekuensi tertinggi = 4 (frekuensi 12)
c) Data ini merupakan data primer karena dikumpulkan langsung melalui wawancara dengan responden (pelanggan). Perusahaan sendiri yang mengumpulkan data tanpa perantara.
Soal 13. Seorang peneliti mengukur kadar gula darah (mg/dL) 10 pasien sebelum dan sesudah mengonsumsi obat herbal:
| Pasien | Sebelum | Sesudah | Selisih |
|---|---|---|---|
| 1 | 180 | 165 | ? |
| 2 | 200 | 185 | ? |
| 3 | 175 | 170 | ? |
| 4 | 210 | 190 | ? |
| 5 | 190 | 180 | ? |
| 6 | 185 | 175 | ? |
| 7 | 195 | 178 | ? |
| 8 | 220 | 200 | ? |
| 9 | 170 | 168 | ? |
| 10 | 205 | 188 | ? |
Hitunglah selisih tiap pasien, rata-rata penurunan, dan jelaskan jenis data serta metode pengumpulannya!
Selisih: 15, 15, 5, 20, 10, 10, 17, 20, 2, 17
Rata-rata penurunan = (15+15+5+20+10+10+17+20+2+17) Γ· 10 = 131 Γ· 10 = 13,1 mg/dL
Jenis data: Data primer karena peneliti melakukan pengukuran langsung terhadap kadar gula darah pasien.
Metode: Eksperimen (memberikan perlakuan berupa obat herbal) dan Pengukuran (mengukur kadar gula darah).
Soal 14. Sebuah sekolah melakukan pendataan terhadap 40 siswa tentang jarak rumah ke sekolah (km). Data dikelompokkan sebagai berikut:
| Jarak (km) | Frekuensi |
|---|---|
| 0 β 2 | 8 |
| 3 β 5 | 14 |
| 6 β 8 | 10 |
| 9 β 11 | 6 |
| 12 β 14 | 2 |
a) Hitunglah rata-rata jarak rumah ke sekolah menggunakan titik tengah kelas!
b) Tentukan kelas modus dan median!
c) Jelaskan metode pengumpulan data yang paling tepat!
a) Titik tengah: 1, 4, 7, 10, 13
Rata-rata = Ξ£(f Γ titik tengah) Γ· Ξ£f = (8Γ1 + 14Γ4 + 10Γ7 + 6Γ10 + 2Γ13) Γ· 40
= (8 + 56 + 70 + 60 + 26) Γ· 40 = 220 Γ· 40 = 5,5 km
b) Kelas modus = 3β5 (frekuensi tertinggi = 14)
Kelas median: data ke-20 dan ke-21. Frekuensi kumulatif: 8, 22, … Data ke-20 ada di kelas 3β5
c) Metode yang paling tepat: kuesioner/angket yang dibagikan langsung kepada siswa, atau wawancara langsung. Data ini merupakan data primer karena sekolah mengumpulkan langsung dari siswa.
Soal 15. Jelaskan secara kritis: dalam situasi apa pengumpulan data primer lebih diutamakan dibandingkan data sekunder? Berikan 3 alasan disertai contoh konkret untuk masing-masing!
Data primer lebih diutamakan ketika:
1. Data yang dibutuhkan belum tersedia
Alasan: Tidak ada data sekunder yang sesuai dengan topik penelitian.
Contoh: Penelitian tentang tingkat stres siswa SMA X belum pernah dilakukan sebelumnya, sehingga peneliti harus mengumpulkan data sendiri melalui kuesioner.
2. Diperlukan data yang sangat spesifik dan akurat
Alasan: Data sekunder mungkin terlalu umum atau tidak sesuai variabel yang diteliti.
Contoh: Dokter memerlukan data tekanan darah pasien pada saat ini (bukan data tahun lalu), sehingga harus mengukur langsung.
3. Keraguan terhadap validitas data sekunder
Alasan: Data sekunder mungkin bias atau sudah kedaluwarsa.
Contoh: Data jumlah UMKM di suatu desa dari 5 tahun lalu sudah tidak akurat, sehingga perlu pendataan ulang secara langsung.
βοΈ Latihan Soal Data Primer
Kerjakan soal-soal berikut secara mandiri tanpa melihat pembahasan!
Tingkat Mudah
Tingkat Sedang
Tingkat Sulit
π B. Data Sekunder
1. Pengertian Data Sekunder
Data sekunder adalah data yang diperoleh tidak langsung dari sumber pertama, melainkan dari sumber yang sudah ada, seperti buku, jurnal, laporan, website, atau lembaga statistik.
Data ini telah dikumpulkan dan diolah oleh pihak lain sebelumnya, kemudian digunakan kembali oleh peneliti untuk tujuan tertentu.
π Kegiatan Mengamati
Perhatikan situasi berikut: Budi ingin mengetahui jumlah penduduk Indonesia dari tahun 2010 hingga 2020. Ia tidak mungkin menghitung sendiri seluruh penduduk. Maka, ia mengambil data dari website Badan Pusat Statistik (BPS). Data yang diperoleh Budi disebut data sekunder.
2. Ciri-Ciri Data Sekunder
- Diperoleh dari sumber yang sudah ada (bukan dikumpulkan sendiri)
- Telah dikumpulkan dan/atau diolah oleh pihak lain
- Mudah dan cepat untuk diperoleh
- Biaya pengumpulan lebih murah
- Perlu diverifikasi keabsahan dan relevansinya
- Mungkin tidak sepenuhnya sesuai kebutuhan penelitian
3. Sumber Data Sekunder
| No. | Sumber | Contoh |
|---|---|---|
| 1 | Lembaga pemerintah | BPS, Kemendikbud, Kemenkes |
| 2 | Publikasi ilmiah | Jurnal, skripsi, tesis, disertasi |
| 3 | Media massa | Koran, majalah, berita online |
| 4 | Buku referensi | Buku teks, ensiklopedia |
| 5 | Laporan organisasi | Laporan keuangan, laporan tahunan perusahaan |
| 6 | Internet | Website resmi, database online |
β Kegiatan Menanya
Pertanyaan untuk direnungkan:
- Mengapa data dari BPS termasuk data sekunder bagi peneliti yang menggunakannya?
- Kapan sebaiknya kita menggunakan data sekunder daripada data primer?
- Bagaimana cara memastikan data sekunder yang kita gunakan valid dan terpercaya?
4. Kelebihan dan Kekurangan Data Sekunder
| Kelebihan | Kekurangan |
|---|---|
| Hemat waktu dan biaya | Mungkin tidak sesuai kebutuhan penelitian |
| Mudah diperoleh | Keakuratan sulit diverifikasi |
| Cakupan data bisa lebih luas | Data mungkin sudah usang/kedaluwarsa |
| Dapat digunakan untuk perbandingan | Definisi variabel mungkin berbeda |
π§ Kegiatan Menalar
Perhatikan tabel berikut yang diambil dari laporan BPS tentang jumlah siswa SMA di Provinsi Jawa Barat:
| Tahun | Jumlah Siswa |
|---|---|
| 2018 | 1.250.000 |
| 2019 | 1.280.000 |
| 2020 | 1.310.000 |
| 2021 | 1.295.000 |
| 2022 | 1.320.000 |
Bagi peneliti yang menggunakan data ini, data tersebut bersifat sekunder karena ia tidak mengumpulkan data sendiri, melainkan mengambil dari publikasi BPS.
π§ͺ Kegiatan Mencoba
Lakukan kegiatan berikut:
- Cari data jumlah penduduk kabupaten/kota tempat tinggalmu dari internet (misalnya website BPS)
- Catat data tersebut beserta sumbernya
- Data yang kamu catat adalah data sekunder karena kamu tidak menghitung sendiri penduduknya
π’ Kegiatan Mengkomunikasikan
Tulislah paragraf singkat (5β8 kalimat) yang menjelaskan perbedaan antara data primer dan data sekunder. Gunakan contoh nyata dari kehidupan sehari-hari!
5. Alur Penggunaan Data Sekunder
π Contoh Soal Data Sekunder
Tingkat Mudah (1β5)
Soal 1. Apa yang dimaksud dengan data sekunder? Berikan 1 contoh!
Soal 2. Rina mengambil data curah hujan kota Bandung dari buku tahunan BMKG. Termasuk data primer atau sekunder? Jelaskan!
Soal 3. Sebutkan 3 sumber data sekunder!
Soal 4. Guru memberikan data jumlah siswa se-Indonesia dari tahun 2018β2022 yang diambil dari Kemendikbud. Termasuk jenis data apa bagi guru tersebut?
Soal 5. Sebutkan 2 kelebihan dan 2 kekurangan data sekunder!
Kelebihan: (1) Hemat waktu dan biaya, (2) Mudah diperoleh.
Kekurangan: (1) Mungkin tidak sesuai kebutuhan penelitian, (2) Data mungkin sudah kedaluwarsa/usang.
Tingkat Sedang (6β10)
Soal 6. Data produksi padi di Indonesia (dalam juta ton) dari BPS:
| Tahun | Produksi |
|---|---|
| 2018 | 59,2 |
| 2019 | 54,6 |
| 2020 | 54,7 |
| 2021 | 54,4 |
| 2022 | 55,0 |
Hitunglah rata-rata produksi dan jelaskan jenis datanya!
Rata-rata = (59,2+54,6+54,7+54,4+55,0) Γ· 5 = 277,9 Γ· 5 = 55,58 juta ton
Ini merupakan data sekunder karena diambil dari publikasi BPS, bukan hasil pengumpulan langsung oleh pengguna data.
Soal 7. Jelaskan mengapa data yang sama bisa menjadi data primer bagi satu pihak dan data sekunder bagi pihak lain! Berikan contoh!
Soal 8. Data IPM (Indeks Pembangunan Manusia) 5 provinsi dari laporan UNDP: Jawa Barat (72,5), Jawa Tengah (71,8), Jawa Timur (72,0), DKI Jakarta (81,1), Bali (75,7). Tentukan rata-rata, nilai tertinggi, terendah, dan jangkauan!
Rata-rata = (72,5+71,8+72,0+81,1+75,7) Γ· 5 = 373,1 Γ· 5 = 74,62
Tertinggi = 81,1 (DKI Jakarta)
Terendah = 71,8 (Jawa Tengah)
Jangkauan = 81,1 β 71,8 = 9,3
Ini data sekunder karena diambil dari laporan UNDP.
Soal 9. Apa yang harus diperhatikan ketika menggunakan data sekunder agar hasil penelitian tetap valid? Sebutkan minimal 4 hal!
1. Kredibilitas sumber β apakah sumber terpercaya dan resmi?
2. Aktualitas β apakah data masih relevan dan tidak kedaluwarsa?
3. Kesesuaian variabel β apakah definisi dan pengukuran variabel sama dengan yang dibutuhkan?
4. Metode pengumpulan asal β apakah metode pengumpulan data aslinya sudah benar dan ilmiah?
Soal 10. Seorang mahasiswa mengambil data nilai rata-rata UN SMP dari Kemendikbud untuk 6 tahun: 58,5; 61,3; 55,2; 63,1; 57,8; 60,4. Tentukan median dan rata-ratanya!
Diurutkan: 55,2; 57,8; 58,5; 60,4; 61,3; 63,1
Median = (58,5 + 60,4) Γ· 2 = 59,45
Rata-rata = (58,5+61,3+55,2+63,1+57,8+60,4) Γ· 6 = 356,3 Γ· 6 = 59,38
Data ini data sekunder karena diambil dari Kemendikbud.
Tingkat Sulit (11β15)
Soal 11. Data ekspor Indonesia (miliar USD) dari Bank Indonesia: 2018 (180,2), 2019 (167,5), 2020 (163,2), 2021 (231,6), 2022 (291,9). a) Hitunglah rata-rata dan simpangan rata-rata! b) Tentukan tahun dengan nilai ekspor paling menyimpang dari rata-rata!
Rata-rata (xΜ) = (180,2+167,5+163,2+231,6+291,9) Γ· 5 = 1034,4 Γ· 5 = 206,88
Simpangan dari rata-rata:
|180,2 β 206,88| = 26,68
|167,5 β 206,88| = 39,38
|163,2 β 206,88| = 43,68
|231,6 β 206,88| = 24,72
|291,9 β 206,88| = 85,02
Simpangan rata-rata = (26,68+39,38+43,68+24,72+85,02) Γ· 5 = 219,48 Γ· 5 = 43,896
Tahun dengan penyimpangan terbesar: 2022 (simpangan 85,02).
Soal 12. Bandingkan proses pengumpulan data primer dan data sekunder untuk topik “Pengaruh penggunaan gadget terhadap prestasi belajar siswa”. Jelaskan metode, kelebihan, kekurangan, serta mana yang lebih tepat digunakan!
Data Primer: Menyebarkan kuesioner kepada siswa tentang durasi penggunaan gadget, kemudian mengumpulkan nilai rapor langsung. Kelebihan: data spesifik dan akurat. Kekurangan: butuh waktu lama, perlu izin sekolah.
Data Sekunder: Mengambil data dari jurnal penelitian sebelumnya tentang topik serupa. Kelebihan: cepat dan murah. Kekurangan: konteks mungkin berbeda (sekolah berbeda, tahun berbeda).
Kesimpulan: Sebaiknya menggunakan kombinasi keduanya. Data primer untuk kondisi spesifik sekolah yang diteliti, data sekunder untuk mendukung kajian pustaka dan perbandingan.
Soal 13. Data angka harapan hidup (tahun) 6 negara ASEAN dari WHO: Indonesia (71,7), Malaysia (76,2), Thailand (77,7), Filipina (71,2), Vietnam (75,4), Singapura (83,6). Hitunglah rata-rata, median, jangkauan, dan simpangan rata-rata!
Diurutkan: 71,2; 71,7; 75,4; 76,2; 77,7; 83,6
Rata-rata = (71,7+76,2+77,7+71,2+75,4+83,6) Γ· 6 = 455,8 Γ· 6 = 75,97
Median = (75,4+76,2) Γ· 2 = 75,8
Jangkauan = 83,6 β 71,2 = 12,4
Simpangan dari rata-rata: |71,7β75,97|=4,27; |76,2β75,97|=0,23; |77,7β75,97|=1,73; |71,2β75,97|=4,77; |75,4β75,97|=0,57; |83,6β75,97|=7,63
Simpangan rata-rata = (4,27+0,23+1,73+4,77+0,57+7,63) Γ· 6 = 19,2 Γ· 6 = 3,2
Soal 14. Jelaskan langkah-langkah evaluasi kualitas data sekunder sebelum digunakan dalam penelitian! Minimal 5 langkah!
1. Periksa kredibilitas sumber β Apakah sumber resmi dan terpercaya (BPS, WHO, Bank Dunia)?
2. Cek tahun publikasi β Apakah data masih aktual dan relevan?
3. Periksa metodologi pengumpulan β Apakah metode asli ilmiah dan transparan?
4. Bandingkan definisi variabel β Apakah definisi variabel dalam data sekunder sama dengan kebutuhan penelitian?
5. Cross-check dengan sumber lain β Apakah data konsisten dengan sumber terpercaya lainnya?
6. Perhatikan cakupan geografis dan populasi β Apakah cakupan data sesuai dengan wilayah/populasi yang diteliti?
Soal 15. Seorang peneliti mendapatkan data dari 2 sumber sekunder yang berbeda tentang angka kemiskinan suatu daerah. Sumber A menyebutkan 12,5% dan Sumber B menyebutkan 15,8%. Analisis mengapa bisa terjadi perbedaan dan bagaimana peneliti sebaiknya menyikapi hal ini!
Perbedaan bisa disebabkan oleh:
1. Definisi kemiskinan yang berbeda β Sumber A mungkin menggunakan garis kemiskinan nasional, Sumber B menggunakan garis kemiskinan internasional ($1,9/hari).
2. Tahun pengumpulan data berbeda β Data bisa dari tahun yang berbeda.
3. Metodologi berbeda β Metode sampling atau perhitungan yang tidak sama.
4. Cakupan wilayah berbeda β Satu sumber mungkin mencakup area perkotaan saja.
Sikap peneliti: Gunakan data dari sumber yang lebih terpercaya (lembaga resmi), cantumkan kedua data dengan penjelasan perbedaan, dan transparansi dalam memilih data yang digunakan.
βοΈ Latihan Soal Data Sekunder
Kerjakan secara mandiri!
Tingkat Mudah
Tingkat Sedang
Tingkat Sulit
π C. Data Mentah (Raw Data)
1. Pengertian Data Mentah
Data mentah (raw data) adalah data yang baru dikumpulkan dan belum diolah, belum dikelompokkan, belum diurutkan, dan belum dianalisis. Data mentah masih dalam bentuk asli sebagaimana pertama kali dicatat.
Data mentah bisa berupa data primer maupun data sekunder, selama data tersebut belum mengalami proses pengolahan.
π Kegiatan Mengamati
Perhatikan contoh berikut. Guru menuliskan nilai ulangan 10 siswa sesuai urutan absen:
75, 80, 65, 90, 70, 85, 60, 95, 78, 82
Data di atas disebut data mentah karena belum diurutkan, belum dikelompokkan, dan belum dihitung rata-ratanya. Data masih dalam bentuk asli sebagaimana dicatat.
2. Ciri-Ciri Data Mentah
- Belum diurutkan (acak, sesuai urutan pengumpulan)
- Belum dikelompokkan ke dalam kelas interval
- Belum dihitung ukuran statistiknya (mean, median, modus, dll.)
- Belum disajikan dalam bentuk tabel frekuensi atau grafik
- Masih dalam bentuk asli seperti pertama kali dicatat
3. Proses Pengolahan Data Mentah
β Kegiatan Menanya
- Mengapa data mentah perlu diolah sebelum dianalisis?
- Apa perbedaan antara data mentah dan data yang sudah diolah?
- Dapatkah data sekunder berupa data mentah? Berikan contoh!
4. Contoh Pengolahan Data Mentah
Data mentah nilai ulangan 20 siswa:
75, 80, 65, 90, 70, 85, 60, 95, 78, 82, 68, 88, 72, 77, 83, 91, 66, 79, 74, 86
Langkah 1: Mengurutkan data
60, 65, 66, 68, 70, 72, 74, 75, 77, 78, 79, 80, 82, 83, 85, 86, 88, 90, 91, 95
Langkah 2: Membuat tabel distribusi frekuensi
| Kelas Interval | Tally | Frekuensi |
|---|---|---|
| 60 β 66 | |||| | 4 |
| 67 β 73 | ||| | 3 |
| 74 β 80 | |||| | | 6 |
| 81 β 87 | |||| | 4 |
| 88 β 94 | ||| | 3 |
| Jumlah | 20 | |
Langkah 3: Menghitung ukuran statistik
Rata-rata (xΜ) = (60+65+66+…+95) Γ· 20 = 1.564 Γ· 20 = 78,2
Median = (data ke-10 + data ke-11) Γ· 2 = (78+79) Γ· 2 = 78,5
Modus = Tidak ada (setiap nilai hanya muncul 1 kali)
Jangkauan = 95 β 60 = 35
π§ Kegiatan Menalar
Perhatikan data mentah berikut (waktu tempuh siswa ke sekolah dalam menit):
15, 30, 10, 45, 20, 25, 35, 10, 40, 20, 15, 30, 25, 20, 35
Pikirkan: Apakah kamu bisa langsung mengetahui rata-rata, modus, dan median hanya dengan melihat data tersebut? Tentu sulit! Itulah mengapa data mentah perlu diolah terlebih dahulu.
5. Hubungan Data Mentah dengan Data Primer dan Sekunder
Penting untuk dipahami:
- Data mentah β data primer. Data mentah bisa berasal dari data primer ATAU data sekunder.
- Data primer yang baru dikumpulkan dan belum diolah = data mentah primer
- Data sekunder yang masih dalam bentuk asli (belum diolah ulang) = data mentah sekunder
- Setelah data mentah diolah (diurutkan, dikelompokkan, dianalisis), data tersebut menjadi data olahan
π§ͺ Kegiatan Mencoba
- Kumpulkan data mentah jumlah uang saku harian 15 temanmu
- Tuliskan data tersebut sesuai urutan pengumpulan (inilah data mentah)
- Urutkan data dari terkecil ke terbesar
- Buatlah tabel frekuensi sederhana
- Hitunglah rata-rata, median, dan modus
π’ Kegiatan Mengkomunikasikan
Presentasikan hasil pengolahan data mentah uang saku temanmu. Bandingkan data mentah (sebelum diolah) dengan data olahan (setelah diolah). Jelaskan manfaat mengolah data mentah!
π Contoh Soal Data Mentah
Tingkat Mudah (1β5)
Soal 1. Apa yang dimaksud dengan data mentah? Berikan 1 contoh!
Soal 2. Manakah yang merupakan data mentah?
a) 5, 8, 3, 9, 1, 7, 4
b) 1, 3, 4, 5, 7, 8, 9
Soal 3. Sebutkan 3 ciri data mentah!
Soal 4. Data mentah berat badan 5 siswa (kg): 52, 48, 55, 50, 53. Urutkan data tersebut dari terkecil ke terbesar!
Soal 5. Apakah data mentah selalu merupakan data primer? Jelaskan!
Tingkat Sedang (6β10)
Soal 6. Data mentah nilai ulangan 12 siswa: 70, 85, 60, 90, 75, 80, 65, 95, 70, 85, 75, 80. a) Urutkan data! b) Tentukan mean, median, dan modus!
a) Data diurutkan: 60, 65, 70, 70, 75, 75, 80, 80, 85, 85, 90, 95
b) Mean = (60+65+70+70+75+75+80+80+85+85+90+95) Γ· 12 = 930 Γ· 12 = 77,5
Median = (data ke-6 + data ke-7) Γ· 2 = (75+80) Γ· 2 = 77,5
Modus = 70, 75, 80, 85 (masing-masing muncul 2 kali β multimodal)
Soal 7. Jelaskan langkah-langkah mengolah data mentah menjadi tabel distribusi frekuensi!
1. Urutkan data dari terkecil ke terbesar
2. Tentukan jangkauan (R) = data terbesar β data terkecil
3. Tentukan banyak kelas (k) menggunakan aturan Sturges: k = 1 + 3,322 Γ log(n)
4. Tentukan panjang kelas (p) = R Γ· k (dibulatkan ke atas)
5. Tentukan batas kelas bawah dimulai dari data terkecil
6. Hitung frekuensi setiap kelas menggunakan tally
Soal 8. Data mentah tinggi badan 10 siswa (cm): 162, 155, 170, 158, 165, 160, 168, 157, 163, 172. Buatlah tabel frekuensi dengan 3 kelas interval!
Diurutkan: 155, 157, 158, 160, 162, 163, 165, 168, 170, 172
R = 172 β 155 = 17; k = 3; p = 17 Γ· 3 β 6
| Kelas Interval | Frekuensi |
|---|---|
| 155 β 160 | 4 |
| 161 β 166 | 3 |
| 167 β 172 | 3 |
| Jumlah | 10 |
Soal 9. Data mentah jumlah gol dalam 10 pertandingan: 3, 1, 0, 4, 2, 1, 3, 5, 2, 1. Hitunglah rata-rata, median, modus, dan jangkauan!
Diurutkan: 0, 1, 1, 1, 2, 2, 3, 3, 4, 5
Rata-rata = (0+1+1+1+2+2+3+3+4+5) Γ· 10 = 22 Γ· 10 = 2,2
Median = (data ke-5 + data ke-6) Γ· 2 = (2+2) Γ· 2 = 2
Modus = 1 (muncul 3 kali)
Jangkauan = 5 β 0 = 5
Soal 10. Mengapa data mentah sulit untuk langsung dianalisis? Jelaskan dengan contoh!
1. Tidak teratur β sulit melihat pola. Contoh: 78, 45, 92, 67, 83, 55, 71, 89, 63, 76 β sulit mengetahui rata-rata hanya dengan melihat.
2. Sulit dibandingkan β tanpa pengelompokan, sulit mengetahui berapa siswa yang nilainya di atas/bawah rata-rata.
3. Tidak informatif β data mentah tidak memberikan gambaran umum (seperti kecenderungan atau penyebaran data).
Tingkat Sulit (11β15)
Soal 11. Data mentah penghasilan harian 25 pedagang (ribu Rp): 150, 200, 180, 250, 120, 300, 175, 225, 160, 280, 190, 210, 170, 240, 130, 260, 195, 220, 145, 270, 185, 235, 155, 290, 205. Buatlah tabel distribusi frekuensi dengan 5 kelas interval, kemudian hitunglah rata-rata menggunakan titik tengah kelas!
Diurutkan: 120, 130, 145, 150, 155, 160, 170, 175, 180, 185, 190, 195, 200, 205, 210, 220, 225, 235, 240, 250, 260, 270, 280, 290, 300
R = 300 β 120 = 180; k = 5; p = 180 Γ· 5 = 36
| Kelas | f | Titik Tengah (x) | f Γ x |
|---|---|---|---|
| 120 β 155 | 5 | 137,5 | 687,5 |
| 156 β 191 | 6 | 173,5 | 1.041 |
| 192 β 227 | 6 | 209,5 | 1.257 |
| 228 β 263 | 4 | 245,5 | 982 |
| 264 β 300 | 4 | 282 | 1.128 |
| Jumlah | 25 | 5.095,5 |
Soal 12. Data mentah skor tes IQ 15 siswa: 105, 112, 98, 120, 115, 108, 95, 125, 110, 102, 118, 99, 113, 107, 122. Olah data mentah ini menjadi: a) Data terurut, b) Tabel frekuensi (3 kelas), c) Hitunglah mean, median, modus, Q1, dan Q3!
a) Terurut: 95, 98, 99, 102, 105, 107, 108, 110, 112, 113, 115, 118, 120, 122, 125
b) R = 125β95 = 30; k = 3; p = 10
| Kelas | Frekuensi |
|---|---|
| 95 β 104 | 4 |
| 105 β 114 | 6 |
| 115 β 125 | 5 |
Mean = (95+98+…+125) Γ· 15 = 1.649 Γ· 15 = 109,93
Median = data ke-8 = 110
Modus = tidak ada (semua nilai muncul 1 kali)
Q1 = data ke-4 = 102
Q3 = data ke-12 = 118
Soal 13. Jelaskan perbedaan antara data mentah, data terurut, dan data berkelompok! Berikan contoh yang sama untuk ketiga bentuk data tersebut!
Data mentah: Data asli belum diolah. Contoh: 7, 3, 9, 5, 3, 8, 6, 4, 7, 5
Data terurut: Data yang sudah diurutkan. Contoh: 3, 3, 4, 5, 5, 6, 7, 7, 8, 9
Data berkelompok: Data yang dikelompokkan dalam kelas interval.
| Kelas | Frekuensi |
|---|---|
| 3 β 5 | 5 |
| 6 β 8 | 4 |
| 9 β 11 | 1 |
Soal 14. Data mentah waktu penyelesaian soal (menit) oleh 20 siswa: 12, 18, 25, 15, 22, 30, 14, 20, 28, 16, 19, 24, 13, 27, 21, 17, 26, 23, 11, 29. a) Buatlah tabel distribusi frekuensi dengan aturan Sturges! b) Hitunglah rata-rata dari tabel! c) Tentukan kelas modus dan median!
a) n = 20; k = 1 + 3,322 Γ log(20) = 1 + 3,322 Γ 1,301 = 5,32 β 5
R = 30 β 11 = 19; p = 19 Γ· 5 = 3,8 β 4
| Kelas | f | Titik Tengah | f Γ x |
|---|---|---|---|
| 11 β 14 | 4 | 12,5 | 50 |
| 15 β 18 | 4 | 16,5 | 66 |
| 19 β 22 | 4 | 20,5 | 82 |
| 23 β 26 | 4 | 24,5 | 98 |
| 27 β 30 | 4 | 28,5 | 114 |
| Jumlah | 20 | 410 |
c) Frekuensi semua kelas sama (4), sehingga tidak ada kelas modus yang dominan. Kelas median: data ke-10 dan ke-11 β kelas 19β22.
Soal 15. Seorang guru mendapatkan data mentah nilai 30 siswa dari ulangan. Ia ingin menyajikan data tersebut agar mudah dipahami. Jelaskan secara lengkap langkah-langkah yang harus dilakukan guru tersebut, mulai dari data mentah hingga penyajian dalam bentuk grafik! Sertakan rumus yang digunakan!
Langkah 1: Mengurutkan data dari nilai terkecil ke terbesar.
Langkah 2: Menentukan jangkauan (R)
R = xmaks β xmin
Langkah 3: Menentukan banyak kelas (k)
Aturan Sturges: k = 1 + 3,322 Γ log(n)
Untuk n = 30: k = 1 + 3,322 Γ log(30) = 1 + 3,322 Γ 1,477 β 5,9 β 6 kelas
Langkah 4: Menentukan panjang kelas (p)
p = R Γ· k (dibulatkan ke atas)
Langkah 5: Membuat tabel distribusi frekuensi dengan kolom: kelas interval, tally, frekuensi, frekuensi kumulatif, titik tengah.
Langkah 6: Menghitung ukuran statistik
Mean: xΜ = Ξ£(f Γ x) Γ· Ξ£f
Median, Modus, Q1, Q3, Simpangan rata-rata
Langkah 7: Menyajikan dalam grafik
Pilih jenis grafik yang sesuai: histogram untuk data kontinu, diagram batang untuk data diskret, atau ogive untuk frekuensi kumulatif.
βοΈ Latihan Soal Data Mentah
Kerjakan secara mandiri!
Tingkat Mudah
Tingkat Sedang
Tingkat Sulit
π D. Perbandingan Data Primer, Data Sekunder & Data Mentah
| Aspek | Data Primer | Data Sekunder | Data Mentah |
|---|---|---|---|
| Pengertian | Dikumpulkan langsung oleh peneliti | Diperoleh dari sumber yang sudah ada | Data yang belum diolah |
| Sumber | Sumber pertama/asli | Sumber kedua (sudah dipublikasikan) | Bisa dari primer atau sekunder |
| Pengolahan | Belum tentu sudah diolah | Umumnya sudah diolah pihak lain | Pasti belum diolah |
| Biaya | Mahal | Murah | Tergantung sumbernya |
| Waktu | Lama | Cepat | Tergantung sumbernya |
| Akurasi | Tinggi | Perlu diverifikasi | Tergantung sumbernya |
| Contoh | Mengukur tinggi badan siswa langsung | Data BPS, jurnal, laporan | Daftar nilai yang belum diurutkan |
Diagram Hubungan
Dikumpulkan langsung
β¬οΈ
Bisa berupa data mentah
Dari sumber yang sudah ada
β¬οΈ
Bisa berupa data mentah
Belum diolah β Perlu diproses
β¬οΈ
Siap dianalisis & disajikan
Kesimpulan Penting
- Data primer dan data sekunder dibedakan berdasarkan cara memperoleh data.
- Data mentah dibedakan berdasarkan tingkat pengolahan data.
- Data primer yang belum diolah = data mentah primer.
- Data sekunder yang belum diolah ulang = data mentah sekunder.
- Setelah data mentah diolah (diurutkan, ditabelkan, dianalisis), ia menjadi data olahan.