Plug-in OCR .NET dari OCRize mengekstrak teks dari gambar dengan jumlah besar teks terstruktur, seperti kontrak yang dipindai, perjanjian, halaman buku, artikel, koran, dan lainnya. Mesin pengenalan dengan akurat menentukan struktur dokumen, memungkinkan Anda untuk bekerja dengan tata letak yang kompleks, termasuk teks multi-kolom.
OcrInput
.Ambil file assembly yang sesuai dari Rilis atau unduh paket dari NuGet untuk menambahkan OCRize langsung ke ruang kerja Anda.
Secara default, OCRize dapat secara otomatis mengenali berbagai bahasa berdasarkan alfabet Latin yang diperluas. Namun, memberikan bahasa tertentu dapat secara signifikan meningkatkan akurasi pengenalan. Secara eksplisit tentukan bahasa saat mengenali teks Cyrillic, Cina, dan Hindi.
OCRize mendukung format populer dari pemindai atau kamera, termasuk PDF, JPEG, PNG, dan TIFF. Hasil pengenalan dikembalikan dalam teks biasa, HTML, Microsoft Word, PDF, JSON, dan XML.
Kualitas gambar yang baik penting untuk OCR yang akurat. Gunakan pemindai atau kamera resolusi tinggi. Perpustakaan ini dilengkapi dengan filter canggih untuk secara otomatis meningkatkan kualitas gambar sebelum proses pengenalan.