OCRize’s .NET OCR plug-in витягує текст з відсканованих або сфотографованих таблиць. Передові алгоритми машинного навчання та спеціально навчені нейронні мережі точно визначають структуру таблиць, витягують текст з комірок і організовують його в searchable та editable електронні таблиці.
OcrInput
.Отримайте відповідні файли збірки з релізів або завантажте пакет з NuGet, щоб безпосередньо додати OCRize до вашого робочого простору.
За замовчуванням, OCRize може автоматично розпізнавати широкий спектр мов на основі розширеного латинського алфавіту. Однак надання конкретної мови може суттєво підвищити точність розпізнавання. Явно вказуйте мову під час розпізнавання текстів кирилицею, китайською та гінді.
OCRize підтримує популярні формати з сканерів або камер, включаючи PDF, JPEG, PNG та TIFF. Результати розпізнавання повертаються у вигляді простого тексту, HTML, Microsoft Word, PDF, JSON та XML.
Якісне зображення - це ключовий фактор для точного OCR. Використовуйте сканер або камеру високої роздільної здатності. Бібліотека містить розширені фільтри для автоматичного покращення якості зображення перед розпізнаванням.