Data
capture adalah identifikasi dan ekstraksi data dari dokumen yang dipindai,
dikirim ke alur kerja untuk routing dan merupakan bagian dari proses bisnis. Masukan data dapat dilakukan dengan
beberapa cara, termasuk dengan entri data. Dalam entri data, data yang
ditempatkan dipilih dari database oleh manusia dengan menggunakan perangkat seperti mouse, keypad,
keyboard, layar sentuh, atau sebaliknya, dengan perangkat lunak pengenalan
suara. Pada data capture
tidak ada entri data. Sebaliknya, data dikumpulkan dalam hubungannya dengan
kegiatan terpisah.
Perangkat
lunak data capture lebih kompleks dan bernilai karena menangkap data dengan spesifik,
menargetkan data - biasanya dari
bentuk yang diperlukan untuk mendukung proses bisnis. Sebagai perbandingan, OCR
adalah konversi dasar informasi alfanumerik yang dipindai menjadi mesin bentuk digital yang dapat
dibaca.
Salah satu perangkat yang terlibat dalam metode ini mencakup checkout supermarket dilengkapi dengan pembaca barcode. Pembaca ini adalah perangkat elektronik yang menggunakan sinar laser untuk memindai barcode. Dikategorikan sebagai non-kontak otomatis perangkat data capture dan harus dekat dengan bahan yang discanning untuk membacanya. Dalam kasus faktur, data capture sendiri tidak mengidentifikasi di mana bagian informasi penting (vendor, alamat, item, harga, syarat pembayaran, dan sebagainya) berada di halaman.
Selain itu, data hasil capture tergantung pada kualitas gambar dari dokumen yang dipindai. Dokumen yang telah diwarnai atau bermotif latar belakang, yang telah ditandai dengan pena stabilo, atau yang bengkok ketika dipindai dapat menghasilkan hasil OCR yang kurang bagus. Memperbaiki hasil yang buruk berarti baik menyesuaikan pengaturan pemindai dan rescanning dokumen (mungkin beberapa kali) atau secara manual memasukkan ke dalam koreksi data elektronik.