OCRize’s .NET OCR plug-in đọc văn bản từ các bức ảnh chụp bằng máy ảnh hoặc smartphone. Các bộ lọc tiền xử lý tiên tiến và các thuật toán phát hiện ký tự mạnh mẽ xử lý các hình ảnh bị xoay, biến dạng và bị nhiễu, duy trì độ chính xác OCR cao. Trình kiểm tra chính tả tích hợp giúp cải thiện thêm kết quả nhận diện.
OcrInput
.Lấy các tệp lắp ráp tương ứng từ phần Phát hành hoặc tải gói từ NuGet để thêm OCRize trực tiếp vào không gian làm việc của bạn.
Mặc định, OCRize có thể tự động nhận diện một loạt các ngôn ngữ dựa trên bảng chữ cái Latin Mở rộng. Tuy nhiên, việc cung cấp một ngôn ngữ cụ thể có thể cải thiện đáng kể độ chính xác nhận diện. Hãy chỉ định rõ ràng ngôn ngữ khi nhận diện các văn bản Cyrillic, Trung Quốc và Hindi.
OCRize hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG và TIFF. Kết quả nhận diện được trả lại dưới dạng văn bản thuần, HTML, Microsoft Word, PDF, JSON và XML.
Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.