แปลเอกสาร PDF เป็นข้อความด้วย OCR

แยกข้อความจากไฟล์ PDF ที่สแกนหรือแปลงเป็นเอกสารที่ค้นหาได้ อ่านรูปแบบและสไตล์ใด ๆ กำหนดโครงสร้างของข้อความและตารางได้อย่างแม่นยำ รักษาภาพต้นฉบับไว้ในพื้นหลังเพื่อการเก็บรักษาเนื้อหา OCRize - โซลูชันการดึงข้อมูลข้อความ PDF ของคุณสำหรับ .NET

แปลง PDF ที่สแกนเป็นข้อความสำหรับ .NET

ปลั๊กอิน OCR ของ OCRize ใน .NET สามารถดึงข้อความจาก PDF ที่สแกนหรือแปลงเป็นเอกสารที่ค้นหาได้ โดยรักษาภาพต้นฉบับไว้ อัลกอริธึมขั้นสูงสามารถระบุข้อความและโครงสร้างตารางได้อย่างแม่นยำ ทำให้เป็นโซลูชันที่คุณควรใช้สำหรับการดึงข้อความจาก PDF.

วิธีการใช้ปลัักอินเปลี่ยน PDF สแกนเป็นข้อความ

ติดตั้งแพ็กเกจ OCRize จาก NuGet หรือไฟล์ที่ดาวน์โหลดมาในเครื่อง
ตั้งค่ากุญแจใบอนุญาตของคุณ
โหลดรูปภาพที่สแกนเข้าสู่ออบเจกต์ OcrInput
สร้างตัวอย่างของเครื่องยนต์การรู้จำ OCRize
ดึงข้อความจาก PDF ที่สแกนแล้ว
แสดงข้อความที่รู้จัก หรือบันทึกไว้ในไฟล์

รับปลััยไปเปลี่ยน PDF เป็นข้อความ ปลััยแปลงเสียงเป็นข้อความ

รับไฟล์ assembly ที่เกี่ยวข้องจาก Releases หรือดาวน์โหลดแพ็กเกจจาก NuGet เพื่อเพิ่ม OCRize โดยตรงเข้าสู่พื้นที่ทำงานของคุณ。

สามารถทำงานได้กับ Microsoft Windows หรือ OS ที่เข้ากันได้ ที่มี .NET Standard 2.0
ต้องใช้งานในสภาพแวดล้อมการพัฒนาเช่น Microsoft Visual Studio.

คำถามที่พบบ่อย

การระบุภาษาจำเป็นหรือไม่?

โดยปกติแล้ว OCRize สามารถจดจำภาษาได้หลากหลายชนิดโดยอัตโนมัติตามอักษรละตินที่ขยาย อย่างไรก็ตาม การระบุภาษาที่เฉพาะเจาะจงสามารถเพิ่มความแม่นยำในการจดจำได้อย่างมาก ระบุภาษาที่ชัดเจนเมื่อทำการจดจำข้อความในอักษรซีริลลิก จีน และฮินดี

ไฟล์แบบไหนที่รองรับบ้าง?

OCRize รองรับรูปแบบที่นิยมจากสแกนเนอร์หรือกล้อง รวมถึง PDF, JPEG, PNG และ TIFF ผลลัพธ์การรู้จำจะถูกส่งคืนในรูปแบบข้อความธรรมดา, HTML, Microsoft Word, PDF, JSON และ XML.

วิธีเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดคืออะไร?

คุณภาพภาพที่ดีเป็นสิ่งสำคัญสำหรับ OCR ที่แม่นยำ ใช้สแกนเนอร์หรือกล้องความละเอียดสูง ห้องสมุดมีตัวกรองขั้นสูงเพื่อปรับปรุงคุณภาพภาพโดยอัตโนมัติก่อนการระบบจดจำการแปลงเอกสาร