OCRize’s .NET OCR plug-in витягує текст з зображень з великою кількістю структурованого тексту, такого як відскановані контракти, угоди, сторінки книг, статті, газети та інше. Двигун розпізнавання точно визначає структуру документа, що дозволяє вам працювати зі складними макетами, включаючи текст з кількома колонками.
OcrInput
.Отримайте відповідні файли збірки з релізів або завантажте пакет з NuGet, щоб безпосередньо додати OCRize до вашого робочого простору.
За замовчуванням, OCRize може автоматично розпізнавати широкий спектр мов на основі розширеного латинського алфавіту. Однак надання конкретної мови може суттєво підвищити точність розпізнавання. Явно вказуйте мову під час розпізнавання текстів кирилицею, китайською та гінді.
OCRize підтримує популярні формати з сканерів або камер, включаючи PDF, JPEG, PNG та TIFF. Результати розпізнавання повертаються у вигляді простого тексту, HTML, Microsoft Word, PDF, JSON та XML.
Якісне зображення - це ключовий фактор для точного OCR. Використовуйте сканер або камеру високої роздільної здатності. Бібліотека містить розширені фільтри для автоматичного покращення якості зображення перед розпізнаванням.