Mengapa perlu teknik validasi data? Sebab, data sendiri adalah ladang dari kesalahan. Baik Anda peneliti baru maupun kawakan validasi tetap diperlukan.
Tidak masalah apakah Anda seorang peneliti dengan satu survei di lapangan, LSM dengan 10 drive pengumpulan data per bulan, atau agen riset pasar dengan puluhan ribu surveyor – setiap survei penuh dengan peluang kesalahan dan itu ada dalam data Anda.
Surveyor yang kurang terlatih teknik validasi data terkadang masih salah memahami respon atau unit pertanyaan. Mereka mungkin salah mengetik jawaban responden atau memasukkan data palsu untuk menghemat waktu.
Demikian halnya dengan responden, mereka mungkin berbohong untuk menyelamatkan muka, atau mereka mungkin menjawab secara acak jika mereka tidak memahami pertanyaan.
Singkatnya, kesalahan tidak bisa dihindari. Jadi bagaimana Anda bisa menghadapinya?
Alat pengumpulan data digital seperti google form memiliki beragam jenis pertanyaan dan trik untuk membantu Anda dengan mudah membuat validasi ke dalam survei dan mengumpulkan data yang minim kesalahan.
Panduan ini agak panjang, jadi tuangkan kopi untuk diri Anda sendiri, duduklah pahami sambil praktikkan teknik validasi data ini.
Apa itu validasi data?
Validasi data adalah pemeriksaan yang dibangun ke dalam survei yang memungkinkan Anda untuk mengontrol data apa yang didapatkan.
Validasi data paling dasar adalah dengan cara mengajukan beberapa jenis pertanyaan yang berbeda.
Ini adalah cara sederhana untuk memastikan bahwa data untuk setiap pertanyaan hanya dapat dikirimkan dalam satu format standar.
Misalnya, pertanyaan dasar yang menanyakan usia seseorang dapat alternatif jawaban “17”, dan “tujuh belas”. Semua mewakili nilai yang sama, tetapi komputer tidak akan mengetahuinya. Pertanyaan numerik membatasi ini menjadi “17”.
Bahkan tipe pertanyaan dasar juga dapat berguna dalam teknik validasi data. Misalnya, pertanyaan email akan secara otomatis memeriksa apakah data yang dimasukkan adalah email yang valid.
Pertanyaan nomor telepon dapat memeriksa apakah nomor telepon tersebut memiliki jumlah digit yang benar, berdasarkan kode negaranya.
Validasi data juga melampaui jenis pertanyaan yang berbeda.
Anda dapat menempatkan batasan dalam pertanyaan, menentukan data apa yang dapat dimasukkan.
Anda dapat membuat pertanyaan hanya untuk mengawasi surveyor. Selain itu, Anda dapat mengontrol pertanyaan mana yang muncul berdasarkan jawaban seseorang sebelumnya.
Sebagai peneliti, Anda bahkan dapat menandai dan mengumpulkan kembali data saat survei Anda masih berlangsung.
Setiap jenis validasi data memiliki kelebihan dan kekurangan. Gunakan validasi data yang tepat pada waktu yang tepat, dan Anda akan kagum dengan peningkatan kualitas data dan penurunan waktu pembersihan data.
Teknik Validasi Data Untuk Survei Online
Buat Pertanyaan Terpenting Anda Menjadi “Pertanyaan Wajib”
Gunakan pertanyaan wajib untuk bidang yang benar-benar Anda perlukan untuk analisis. Pastikan bahwa setiap responden memahami pertanyaannya dan mengetahui jawabannya.
Siapapun yang telah mengisi formulir online akrab dengan validasi data ini – pertanyaan wajib.
Pengguna diharuskan untuk mengisi pertanyaan wajib sebelum mereka dapat mengirimkan survei, tetapi mereka dapat memilih untuk menjawab pertanyaan non-wajib. Berikut contoh validasi data survei:
Pertanyaan wajib sangat membantu karena menjamin bahwa setiap responden mengirimkan data yang paling penting.
Mencoba menganalisis data tanpa ID (seperti ID karyawan) atau menarik kesimpulan tanpa pertanyaan, hanya akan membuang-buang waktu.
Langkah penting dalam desain survei adalah memastikan bahwa setiap unit dalam survei – orang, rumah tangga, program, lokasi, dll. – memiliki ID.
Pertanyaan wajib itu sederhana, tetapi bisa sangat membuat frustasi jika tidak diatur dengan benar.
Bayangkan sebuah survei yang menanyakan orang Indonesia mengenai browser apa yang mereka gunakan untuk mengakses internet.
Tandai pertanyaan sebagai wajib, dan 11% orang Indonesia yang tidak menggunakan internet akan terjebak.
Beberapa akan memasukkan data palsu untuk menyelesaikan survei, yang mengubah analisis data akhir. Orang lain akan meninggalkan survei, yang berarti kehilangan data.
Gunakan Pembatasan Untuk Pertanyaan Pilihan Ganda
Pilihan ganda tampaknya mudah, tetapi rentan terhadap data yang buruk.
Ada beberapa validasi data yang dapat Anda tambahkan untuk meningkatkan kualitas data – batasan dinamis atau statis pada jumlah pilihan yang dapat dipilih seseorang, opsi acak, dan pemeriksaan logis pada opsi khusus seperti “Semua yang di atas”.
Salah satu jenis pertanyaan yang paling umum adalah pertanyaan pilihan ganda (soal pilihan ganda) tampaknya cukup sederhana.
Namun, jenis pertanyaan ini terkadang akan menjebak, bahkan membuat responden tidak memiliki alternatif.
Untuk itu, sebelum menggunakan opsi ini, pastikan lakukan validasi data. Bahkan soal pilihan ganda yang paling dasar pun membutuhkan validasi data.
Tanpa melakukannya, seseorang dapat memilih opsi yang tidak masuk akal, seperti 20 tahun yang memilih 13-18 dan 19-24 sebagai kelompok usia mereka.
Menetapkan jumlah pilihan maksimum dan minimum
Kebanyakan soal ganda memerlukan batasan jumlah pilihan yang dapat dipilih responden.
Batasan membantu mengurangi data yang kontradiktif atau tidak logis, karena surveyor tidak akan dapat mengirimkan data sampai mereka memilih jumlah pilihan yang benar.
Jumlah pilihan minimum bisa jadi nol. (Namun, biasanya lebih baik menyertakan opsi “NA” atau “Tidak satu pun di atas” untuk menutupi kemungkinan ini, daripada membiarkan pertanyaan tidak terisi). Jumlah maksimum tidak boleh lebih dari jumlah opsi.
Terkadang maksimum dan minimum mungkin sama. Meminta seseorang untuk melaporkan total pendapatan tahunan mereka? Batasi responden pada satu kelompok pendapatan.
Gunakan batas dinamis untuk penerapan teknik validasi data
Dinamis, artinya batasan berdasarkan jawaban pertanyaan sebelumnya.
Misalnya, bayangkan Anda menanyakan merek ponsel mana yang telah dibeli seseorang.
Untuk mendapatkan data yang lebih akurat, Anda dapat menyetel jumlah maksimum opsi ke jumlah ponsel yang mereka beli sebelumnya.
Seseorang yang hanya membeli 3 ponsel tidak dapat membeli dari 6 merek ponsel.
Tambahkan logika ke “Tidak satu pun di atas” dan “Semua yang di atas”
“Tidak satu pun di atas” dan “Semua yang di atas” berguna untuk memastikan bahwa adalah soal pilihan ganda (saling eksklusif dan lengkap secara kolektif).
Namun penting untuk memastikan bahwa opsi ini berfungsi dengan benar, atau dapat menyebabkan data yang membingungkan.
Bayangkan Anda sedang mensurvei pemilik rumah, dan satu pertanyaan menanyakan peralatan rumah tangga mana yang mereka miliki.
Opsi khusus ini harus disertakan. “Tidak satu pun di atas” bermanfaat bagi pemilik rumah baru dengan sedikit aset, dan “Semua hal di atas” bermanfaat bagi pemilik rumah kaya dengan rumah yang terisi penuh.
Jika opsi ini berperilaku seperti biasa – dimana pengguna dapat memilih kombinasi opsi apa pun yang mereka inginkan – ini dapat menyebabkan kesalahan.
Bagaimana jika pengguna memilih “Lemari es”, “Semua yang di atas” dan “Tidak satu pun di atas”? Bagaimana analis menginterpretasikan data itu? Mereka kemungkinan besar akan membuangnya.
Kami secara logis tahu bagaimana seharusnya opsi ini berperilaku. Jika seseorang memilih “Semua yang di atas”, mereka seharusnya tidak dapat memilih yang lain. Semuanya sudah tertutup.
Hal yang sama berlaku untuk “Tidak satu pun di atas”. Meskipun ini tampak intuitif, penting untuk memastikan survei Anda menyertakan logika ini.
Opsi acak
Orang hanya dapat menyimpan sedikit informasi kapan saja. Ini membuat kami buruk dalam memilih dari daftar, karena kami kesulitan mengingat semua item dalam daftar.
Orang cenderung memilih salah satu opsi pertama dalam daftar (yang disebut “bias keutamaan“).
Karena orang pada umumnya terburu-buru untuk menyelesaikan survei secepat mungkin, jadi mereka kurang memperhatikan seiring berjalannya daftar opsi.
Atau, orang juga cenderung memilih salah satu opsi terakhir yang mereka dengar (disebut “bias kebaruan“), karena itu ada dalam ingatan jangka pendek mereka.
Cara terbaik untuk mengurangi bias ini adalah dengan mengacak urutan opsi soal pilihan ganda.
Artinya, urutan opsi Anda akan berubah secara acak untuk setiap responden. (“Semua yang di atas” atau “Tidak satu pun di atas” akan selalu muncul sebagai opsi terakhir.)
Urutan acak bagus untuk sebagian besar opsi yang tidak diurutkan, seperti daftar aset yang dimiliki rumah tangga atau daftar buku.
Ini membantu untuk memastikan bahwa surveyor tidak hanya melakukan gerakan saat mereka memilih jawaban. Namun, pengacakan tidak boleh digunakan jika opsi memiliki urutan yang melekat, seperti usia atau tanda kurung pendapatan.
Tetapkan nilai maksimum dan minimum untuk pertanyaan numerik
Jika Anda mengetahui kisaran valid untuk angka dalam survei Anda, buat batas keras atau lunak untuk mencegah angka buruk.
Pertanyaan numerik – yang hanya menerima angka sebagai jawaban – membantu Anda mengontrol angka apa yang dapat dikirimkan.
Ada dua jenis validasi data numerik. Beberapa teknik uji keabsahan data kualitatif dan kuantitatif:
Validasi berbasis nilai memungkinkan Anda menetapkan nilai minimum dan maksimum.
Misalnya, jika Anda mensurvei anak sekolah, Anda dapat memilih 5 sebagai usia minimum dan 18 sebagai usia maksimum yang dapat dimasukkan.
Validasi berbasis nilai lunak (juga disebut “batas lunak”) serupa tetapi lebih fleksibel.
Batas lunak memungkinkan Anda menetapkan nilai minimum dan maksimum.
Jika pengumpul data mencoba mengirimkan data di luar rentang ini, mereka akan mendapat peringatan. Namun, mereka tetap dapat memilih untuk mengirimkan data.
Nilai lunak berguna ketika ada kisaran nilai yang diharapkan, tetapi Anda mengharapkan beberapa pencilan.
Misalnya, beberapa anak mulai sekolah lebih awal atau selesai terlambat, jadi Anda dapat membuat batasan usia mereka sebagai pertanyaan.
Kemudian surveyor dapat mengirimkan data untuk anak-anak yang berada di luar rentang usia yang diharapkan, setelah memeriksa untuk memastikan bahwa usia tersebut benar.
Batasi jumlah digit atau karakter
Gunakan validasi data berbasis digit untuk membatasi jumlah digit yang dapat dimasukkan seseorang ke dalam pertanyaan numerik.
Gunakan validasi data berbasis karakter untuk membatasi jumlah karakter yang dimasukkan dalam pertanyaan teks.
Bayangkan Anda meminta nomor telepon, tetapi alat survey Anda tidak memiliki pertanyaan nomor telepon tertentu.
Bagaimana Anda bisa memastikan bahwa Anda mendapatkan nomor telepon yang valid?
Jika Anda mengetahui nomor telepon negara Anda terdiri dari 10 digit, Anda dapat menentukan nilai minimum 1.000.000.000 dan maksimum 9.999.999.999.
Namun, itu solusi yang cukup kikuk. Ada solusi yang jauh lebih mudah – tetapkan batas jumlah digit.
Validasi berbasis digit membantu Anda meningkatkan kualitas data dengan membatasi jumlah digit dalam pertanyaan numerik.
Demikian pula, validasi berbasis karakter membatasi jumlah karakter dalam pertanyaan teks. Validasi data ini berguna ketika Anda tahu persis berapa digit atau karakter yang harus dimiliki sesuatu – seperti kode ID atau nomor telepon.
Tambahkan pertanyaan validasi data
Foto, lokasi yang diberi geo-tag, audio, atau pertanyaan tanda tangan dapat ditambahkan ke survei apa pun untuk memeriksa apakah surveyor mengikuti protokol survei dan memasukkan data yang akurat.
Menambahkan validasi data ke pertanyaan yang ada sangat membantu.
Namun, itu tidak menghentikan surveyor untuk duduk di rumah dan mengisi formulir Anda sendiri, atau melanggar protokol survei saat mereka berada di lapangan.
Ada banyak jenis pertanyaan yang dapat Anda tambahkan untuk menangkap surveyor nakal ini dan memastikan bahwa data Anda berasal dari responden secara akurat.
Beri Pertanyaan Tentang Lokasi
Pertanyaan lokasi memungkinkan surveyor memberi geotag pada lokasi setiap survei, meskipun mereka tidak memiliki internet.
Ini membantu Anda memastikan bahwa surveyor mengisi formulir dari lokasi yang benar.
Beri Pertanyaan Tentang Foto
Selain menjadi sumber data yang berharga, pertanyaan tentang foto adalah cara yang bagus untuk menjaga dari data yang buruk.
Meminta surveyor untuk mengambil gambar seseorang, lokasi, atau titik data lainnya membuktikan bahwa seorang pengumpul data benar-benar terlibat dengan apa yang seharusnya mereka lakukan.
Ini juga berguna untuk memverifikasi bahwa tanggapan itu unik, jadi tidak akan ada duplikat dalam kumpulan data Anda.
Pertanyaan dengan Geotag
Pertanyaan foto dengan geotag membunuh dua burung dengan satu batu. Foto tersebut menunjukkan bahwa seorang surveyor terlibat dengan apa yang seharusnya mereka lakukan, sedangkan lokasi yang diberi geotag menunjukkan dengan tepat di mana foto itu diambil.
Poin Pertanyaan tentang Audio
Seperti pertanyaan foto, ada dua jenis fitur audio yang bagus untuk memverifikasi data. Pertanyaan audio, yang merekam potongan audio, dapat digunakan untuk memverifikasi bagian data tertentu dan mendengarkannya dengan kata-kata responden sendiri.
Anda juga dapat menggunakan audit audio, yang merekam audio latar belakang secara acak saat survei sedang berlangsung.
Ini memverifikasi bahwa surveyor mengajukan pertanyaan secara akurat dan mencatat apa yang sebenarnya dikatakan responden.
Pertanyaan audio juga berguna untuk mengumpulkan data kualitatif. Pelajari lebih lanjut tentang bagaimana melakukan penelitian kualitatif melalui wawancara, diskusi kelompok terfokus atau observasi.
Poin Pertanyaan tentang Tanda Tangan
Pertanyaan tanda tangan, yang memungkinkan responden untuk mengirimkan tanda tangan mereka, dapat berguna untuk memverifikasi bahwa pengguna benar-benar telah mengirimkan formulir.
Mereka juga dapat digunakan untuk mengkonfirmasi atau mengakui perjanjian apa pun atau mengizinkan pengguna untuk memberikan persetujuan untuk survei.
Tidak seorang pun boleh melakukan penelitian atau mengumpulkan data pribadi tanpa pemahaman yang baik tentang apa itu informed consent dan bagaimana mendapatkannya. Pelajari lebih lanjut di sini.
Sesuaikan survei Anda untuk pengguna yang berbeda.
Logika “lewati”, yang memastikan bahwa setiap pertanyaan hanya ditampilkan kepada orang yang tepat, adalah alat yang hebat untuk membuat survei lebih pendek, lebih bertarget, dan tidak terlalu rentan terhadap data yang buruk.
Pengguna yang berbeda memiliki kebutuhan yang berbeda, jadi mengapa memberi mereka survei yang sama? Survei panjang dengan pertanyaan yang tidak relevan membuka pintu bagi data yang buruk.
“Lewati” (juga disebut persyaratan) adalah cara sederhana untuk membuat survei yang mengalir mulus bagi responden dan surveyor.
Ini memungkinkan Anda untuk menampilkan atau menyembunyikan pertanyaan berdasarkan jawaban atas pertanyaan sebelumnya.
Misalnya, dengan logika skip, hanya wanita yang akan ditanyai apakah mereka hamil. Pria dapat langsung melompat ke pertanyaan berikutnya, tanpa harus membuang waktu untuk menandai “NA”.
Logika lewati dapat meningkatkan kualitas data karena mengurangi durasi survei, memastikan bahwa orang tidak menjawab pertanyaan yang tidak dimaksudkan untuk mereka, dan memungkinkan Anda membuat pertanyaan lebih relevan bagi orang yang melihatnya.
Tekni validasi data ini juga memungkinkan survei memiliki lebih banyak pertanyaan wajib (karena setiap pertanyaan hanya akan ditampilkan kepada orang yang tepat), yang dapat menyebabkan lebih sedikit data yang hilang.
Tandai dan perbaiki data buruk dengan cepat
Saat data dikumpulkan, Anda mungkin melihat tanggapan yang salah atau tidak lengkap. Penandaan memungkinkan Anda menandainya sehingga dapat disurvei kembali di lapangan.
Saat memeriksa data Anda, Anda mungkin menemukan respons yang meragukan, seperti sekolah tanpa ruangan.
Jika Anda menemukan ini selama pembersihan data, Anda akan terjebak bertanya apa arti data itu dan apakah Anda harus menyimpannya.
Tetapi bagaimana jika Anda dapat menandai tanggapan yang meragukan sebelum data diselesaikan?
Penandaan (juga disebut “survei ulang”) adalah fitur yang dibuat untuk situasi tersebut. Penandaan memungkinkan Anda menandai data yang meragukan saat dikumpulkan.
Kemudian surveyor Anda dapat memeriksa ulang dan, jika perlu, mengumpulkan kembali titik data atau survei tersebut segera.
Misalnya, Anda dapat mengirim surveyor kembali ke sekolah ruang kosong untuk melihat apa yang sebenarnya terjadi.
Apakah angka nol itu salah ketik “10”? Ataukah sebenarnya sekolah adalah guru dan murid belajar di bawah pohon?
Dalam kedua kasus tersebut, surveyor dapat memeriksa dan mengumpulkan kembali data yang akurat dengan segera, menyebabkan lebih sedikit pertanyaan selama pembersihan dan analisis data.
Apakah validasi data tepat untuk Anda?
Itu selalu merupakan ide yang baik untuk menambahkan validasi data ke survei Anda. Mereka adalah cara yang bagus untuk meningkatkan kualitas data. Namun, penting untuk menguji coba validasi data Anda untuk memastikan kebenarannya sebelum Anda meluncurkannya.
Jawaban singkatnya – tentu saja. Teknik validasi data ini adalah cara sederhana dan terjangkau untuk meningkatkan kualitas data.
Yang Anda butuhkan hanyalah alat pengumpulan data digital (yang seharusnya Anda gunakan!) Dan sedikit waktu yang dihabiskan untuk membuat survei yang lebih baik.
Meskipun ada satu tangkapan – validasi data perlu ditambahkan dengan cermat.
Buat pertanyaan wajib yang tidak dapat dijawab oleh orang lain, tambahkan batas karakter yang salah, atau tanyakan jumlah pilihan soal pilihan ganda yang salah, dan responden Anda akan terjebak dan bingung.
Tidak yakin apakah Anda telah menambahkan validasi data yang benar? Uji coba mereka. Jalankan mereka oleh tim Anda, pakar sektor, dan staf lapangan.
Uji mereka dengan sekelompok kecil orang. Dengarkan surveyor Anda dan pelajari pertanyaan apa yang membingungkan mereka.
Perhatikan data percontohan dan lihat apa yang salah. Semakin Anda dapat menguji validasi data sebelum meluncurkannya, semakin besar kemungkinan Anda akan mendapatkannya dengan benar saat mulai mengumpulkan data dalam skala besar.
Uji coba dan penandaan mungkin tampak seperti banyak pekerjaan di depan, tetapi upaya itu sepadan.
Waktu yang Anda habiskan untuk uji coba dan survei ulang akan disimpan beberapa kali selama pembersihan dan analisis data. Jika merasa kesulitan Anda dapat mengunjungi page kami di jasa analisis data.