תוסף ה-OCR של OCRize ב- .NET מוציא טקסט מקבצי PDF סרוקים או ממיר אותם במסמכים ניתנים לחיפוש, תוך שמירה על התמונות המקוריות. אלגוריתמים מתקדמים מזהים במדויק טקסט ומבני טבלאות, מה שהופך אותו לפתרון המושלם שלך להוצאת טקסט מ-PDF.
OcrInput
.קבל את קבצי ההתקנה המתאימים מהשחרורים או הורד את החבילה מ-NuGet כדי להוסיף את OCRize ישירות למקום העבודה שלך.
ברירת מחדל, OCRize יכולה לזהות באופן אוטומטי מגוון רחב של שפות בהתבסס על האלף-בית הלטיני המורחב. עם זאת, מתן שפה ספציפית יכול לשפר באופן משמעותי את דיוק הזיהוי. ציין במפורש את השפה כאשר מזהים טקסטים בצירילית, סינית והינדית.
OCRize תומך בפורמטים פופולריים מסורקים או מצלמות, כולל PDF, JPEG, PNG ו- TIFF. תוצאות ההכרה מוחזרות בטקסט פשוט, HTML, Microsoft Word, PDF, JSON ו- XML.
Η καλή ποιότητα εικόνας είναι κρίσιμη για την ακριβή OCR. Χρησιμοποιήστε ένα σαρωτή ή μια κάμερα υψηλής ανάλυσης. Η βιβλιοθήκη περιλαμβάνει προηγμένα φίλτρα για την αυτόματη βελτίωση της ποιότητας της εικόνας πριν από την αναγνώριση.