OCRize’s .NET OCR plug-in ดึงข้อความจากภาพที่มีข้อความที่มีโครงสร้างมากมาย เช่น สัญญาที่สแกนไว้ ข้อตกลง หน้าหนังสือ บทความ หนังสือพิมพ์ และอื่นๆ เครื่องยนต์การรู้จำสามารถกำหนดโครงสร้างเอกสารได้อย่างถูกต้อง ทำให้คุณสามารถทำงานกับเลย์เอาต์ที่ซับซ้อนได้ รวมถึงข้อความแบบหลายคอลัมน์
OcrInput
รับไฟล์ assembly ที่เกี่ยวข้องจาก Releases หรือดาวน์โหลดแพ็กเกจจาก NuGet เพื่อเพิ่ม OCRize โดยตรงเข้าสู่พื้นที่ทำงานของคุณ。
โดยปกติแล้ว OCRize สามารถจดจำภาษาได้หลากหลายชนิดโดยอัตโนมัติตามอักษรละตินที่ขยาย อย่างไรก็ตาม การระบุภาษาที่เฉพาะเจาะจงสามารถเพิ่มความแม่นยำในการจดจำได้อย่างมาก ระบุภาษาที่ชัดเจนเมื่อทำการจดจำข้อความในอักษรซีริลลิก จีน และฮินดี
OCRize รองรับรูปแบบที่นิยมจากสแกนเนอร์หรือกล้อง รวมถึง PDF, JPEG, PNG และ TIFF ผลลัพธ์การรู้จำจะถูกส่งคืนในรูปแบบข้อความธรรมดา, HTML, Microsoft Word, PDF, JSON และ XML.
คุณภาพภาพที่ดีเป็นสิ่งสำคัญสำหรับ OCR ที่แม่นยำ ใช้สแกนเนอร์หรือกล้องความละเอียดสูง ห้องสมุดมีตัวกรองขั้นสูงเพื่อปรับปรุงคุณภาพภาพโดยอัตโนมัติก่อนการระบบจดจำการแปลงเอกสาร