1. ผลิตภัณฑ์
  2.   แปลง PDF เป็นข้อความ

แปลเอกสาร PDF เป็นข้อความด้วย OCR

แยกข้อความจากไฟล์ PDF ที่สแกนหรือแปลงเป็นเอกสารที่ค้นหาได้ อ่านรูปแบบและสไตล์ใด ๆ กำหนดโครงสร้างของข้อความและตารางได้อย่างแม่นยำ รักษาภาพต้นฉบับไว้ในพื้นหลังเพื่อการเก็บรักษาเนื้อหา OCRize - โซลูชันการดึงข้อมูลข้อความ PDF ของคุณสำหรับ .NET

แปลง PDF ที่สแกนเป็นข้อความสำหรับ .NET

ปลั๊กอิน OCR ของ OCRize ใน .NET สามารถดึงข้อความจาก PDF ที่สแกนหรือแปลงเป็นเอกสารที่ค้นหาได้ โดยรักษาภาพต้นฉบับไว้ อัลกอริธึมขั้นสูงสามารถระบุข้อความและโครงสร้างตารางได้อย่างแม่นยำ ทำให้เป็นโซลูชันที่คุณควรใช้สำหรับการดึงข้อความจาก PDF.

วิธีการใช้ปลัักอินเปลี่ยน PDF สแกนเป็นข้อความ

  • ติดตั้งแพ็กเกจ OCRize จาก NuGet หรือไฟล์ที่ดาวน์โหลดมาในเครื่อง
  • ตั้งค่ากุญแจใบอนุญาตของคุณ
  • โหลดรูปภาพที่สแกนเข้าสู่ออบเจกต์ OcrInput
  • สร้างตัวอย่างของเครื่องยนต์การรู้จำ OCRize
  • ดึงข้อความจาก PDF ที่สแกนแล้ว
  • แสดงข้อความที่รู้จัก หรือบันทึกไว้ในไฟล์

รับปลััยไปเปลี่ยน PDF เป็นข้อความ ปลััยแปลงเสียงเป็นข้อความ

รับไฟล์ assembly ที่เกี่ยวข้องจาก Releases หรือดาวน์โหลดแพ็กเกจจาก NuGet เพื่อเพิ่ม OCRize โดยตรงเข้าสู่พื้นที่ทำงานของคุณ。

  • สามารถทำงานได้กับ Microsoft Windows หรือ OS ที่เข้ากันได้ ที่มี .NET Standard 2.0
  • ต้องใช้งานในสภาพแวดล้อมการพัฒนาเช่น Microsoft Visual Studio.

คำถามที่พบบ่อย

การระบุภาษาจำเป็นหรือไม่?

โดยปกติแล้ว OCRize สามารถจดจำภาษาได้หลากหลายชนิดโดยอัตโนมัติตามอักษรละตินที่ขยาย อย่างไรก็ตาม การระบุภาษาที่เฉพาะเจาะจงสามารถเพิ่มความแม่นยำในการจดจำได้อย่างมาก ระบุภาษาที่ชัดเจนเมื่อทำการจดจำข้อความในอักษรซีริลลิก จีน และฮินดี

ไฟล์แบบไหนที่รองรับบ้าง?

OCRize รองรับรูปแบบที่นิยมจากสแกนเนอร์หรือกล้อง รวมถึง PDF, JPEG, PNG และ TIFF ผลลัพธ์การรู้จำจะถูกส่งคืนในรูปแบบข้อความธรรมดา, HTML, Microsoft Word, PDF, JSON และ XML.

วิธีเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดคืออะไร?

คุณภาพภาพที่ดีเป็นสิ่งสำคัญสำหรับ OCR ที่แม่นยำ ใช้สแกนเนอร์หรือกล้องความละเอียดสูง ห้องสมุดมีตัวกรองขั้นสูงเพื่อปรับปรุงคุณภาพภาพโดยอัตโนมัติก่อนการระบบจดจำการแปลงเอกสาร

 แบบไทย