Plug-in OCRize .NET mengekstrak teks dari PDF yang dipindai atau mengubahnya menjadi dokumen yang dapat dicari, mempertahankan gambar asli. Algoritme canggih dengan tepat mengidentifikasi teks dan struktur tabel, menjadikannya solusi utama Anda untuk ekstraksi teks PDF.
OcrInput
.Ambil file assembly yang sesuai dari Rilis atau unduh paket dari NuGet untuk menambahkan OCRize langsung ke ruang kerja Anda.
Secara default, OCRize dapat secara otomatis mengenali berbagai bahasa berdasarkan alfabet Latin yang diperluas. Namun, memberikan bahasa tertentu dapat secara signifikan meningkatkan akurasi pengenalan. Secara eksplisit tentukan bahasa saat mengenali teks Cyrillic, Cina, dan Hindi.
OCRize mendukung format populer dari pemindai atau kamera, termasuk PDF, JPEG, PNG, dan TIFF. Hasil pengenalan dikembalikan dalam teks biasa, HTML, Microsoft Word, PDF, JSON, dan XML.
Kualitas gambar yang baik penting untuk OCR yang akurat. Gunakan pemindai atau kamera resolusi tinggi. Perpustakaan ini dilengkapi dengan filter canggih untuk secara otomatis meningkatkan kualitas gambar sebelum proses pengenalan.