Mengubah PDF yang discan menjadi teks dengan OCR

Ekstrak teks dari PDF yang dipindai atau ubah menjadi dokumen yang dapat dicari. Bacalah tata letak dan gaya apa pun, secara akurat mendefinisikan struktur teks dan tabel. Pelihara gambar asli di latar belakang untuk mempertahankan konten. OCRize - Solusi ekstraksi teks PDF Anda untuk .NET.

OCRize Scanned PDF to Text untuk .NET

Plug-in OCRize .NET mengekstrak teks dari PDF yang dipindai atau mengubahnya menjadi dokumen yang dapat dicari, mempertahankan gambar asli. Algoritme canggih dengan tepat mengidentifikasi teks dan struktur tabel, menjadikannya solusi utama Anda untuk ekstraksi teks PDF.

Menggunakan Plugin PDF yang Diskan menjadi Teks

Instal paket OCRize dari NuGet atau file yang diunduh secara lokal.
Set your license keys.
Muatkan gambar yang discan ke objek OcrInput.
Buat instance dari mesin pengenalan OCRize.
Ekstrak teks dari PDF yang discan.
Output teks yang dikenali atau simpan ke dalam file.

Dapatkan Plugin Konverter PDF ke Teks yang Di-scan

Ambil file assembly yang sesuai dari Rilis atau unduh paket dari NuGet untuk menambahkan OCRize langsung ke ruang kerja Anda.

Kompatibel dengan Microsoft Windows atau OS yang kompatibel dengan .NET Standard 2.0
Membutuhkan lingkungan pengembangan seperti Microsoft Visual Studio.

Pertanyaan yang Sering Diajukan

Apakah menspesifikasikan bahasa itu perlu?

Secara default, OCRize dapat secara otomatis mengenali berbagai bahasa berdasarkan alfabet Latin yang diperluas. Namun, memberikan bahasa tertentu dapat secara signifikan meningkatkan akurasi pengenalan. Secara eksplisit tentukan bahasa saat mengenali teks Cyrillic, Cina, dan Hindi.

Apa format file yang didukung?

OCRize mendukung format populer dari pemindai atau kamera, termasuk PDF, JPEG, PNG, dan TIFF. Hasil pengenalan dikembalikan dalam teks biasa, HTML, Microsoft Word, PDF, JSON, dan XML.

Bagaimana cara mencapai hasil terbaik?

Kualitas gambar yang baik penting untuk OCR yang akurat. Gunakan pemindai atau kamera resolusi tinggi. Perpustakaan ini dilengkapi dengan filter canggih untuk secara otomatis meningkatkan kualitas gambar sebelum proses pengenalan.