OCRize’s .NET OCR plug-in витягує текст з масштабованих PDF-документів або перетворює їх у пошукові документи, зберігаючи оригінальні зображення. Сучасні алгоритми точно визначають текст та структури таблиць, роблячи його вашим надійним рішенням для витягування тексту з PDF.
OcrInput
.Отримайте відповідні файли збірки з релізів або завантажте пакет з NuGet, щоб безпосередньо додати OCRize до вашого робочого простору.
За замовчуванням, OCRize може автоматично розпізнавати широкий спектр мов на основі розширеного латинського алфавіту. Однак надання конкретної мови може суттєво підвищити точність розпізнавання. Явно вказуйте мову під час розпізнавання текстів кирилицею, китайською та гінді.
OCRize підтримує популярні формати з сканерів або камер, включаючи PDF, JPEG, PNG та TIFF. Результати розпізнавання повертаються у вигляді простого тексту, HTML, Microsoft Word, PDF, JSON та XML.
Якісне зображення - це ключовий фактор для точного OCR. Використовуйте сканер або камеру високої роздільної здатності. Бібліотека містить розширені фільтри для автоматичного покращення якості зображення перед розпізнаванням.