1. Sản Phẩm
  2.   Quét thành văn bản

Chuyển ảnh quét sang văn bản OCR

Trích xuất văn bản từ hình ảnh chứa nhiều văn bản có cấu trúc lớn, chẳng hạn như hợp đồng quét, thỏa thuận, trang sách, bài viết, báo và nhiều hơn nữa. Đạt được nhận diện chính xác, bao gồm cả bố cục nhiều cột, với OCRize.

Chuyển đổi hình ảnh quét thành văn bản cho .NET

OCRize’s .NET OCR plug-in trích xuất văn bản từ hình ảnh có lượng lớn văn bản cấu trúc, như các hợp đồng quét, thỏa thuận, trang sách, bài viết, báo và nhiều hơn nữa. Động cơ nhận diện xác định cấu trúc tài liệu một cách chính xác, cho phép bạn làm việc với các bố cục phức tạp, bao gồm văn bản nhiều cột.

Cách sử dụng Plugin Chuyển Ảnh Quét thành Văn Bản

  • Cài đặt gói OCRize từ NuGet hoặc một tệp được tải xuống cục bộ.
  • Đặt khóa giấy phép của bạn.
  • Tải một hình ảnh đã quét vào đối tượng OcrInput.
  • Tạo một phiên bản của engine nhận diện OCRize.
  • Trích xuất văn bản từ một hình ảnh.
  • Đầu ra văn bản được nhận diện hoặc lưu vào một tệp.

Nhận Plugin Chuyển đổi Quét thành Văn bản cho .NET

Lấy các tệp lắp ráp tương ứng từ phần Phát hành hoặc tải gói từ NuGet để thêm OCRize trực tiếp vào không gian làm việc của bạn.

  • Tương thích với Microsoft Windows hoặc một hệ điều hành tương thích với .NET Standard 2.0
  • Yêu cầu một môi trường phát triển như Microsoft Visual Studio.

Câu Hỏi Thường Gặp

Có cần phải chỉ định một ngôn ngữ không?

Mặc định, OCRize có thể tự động nhận diện một loạt các ngôn ngữ dựa trên bảng chữ cái Latin Mở rộng. Tuy nhiên, việc cung cấp một ngôn ngữ cụ thể có thể cải thiện đáng kể độ chính xác nhận diện. Hãy chỉ định rõ ràng ngôn ngữ khi nhận diện các văn bản Cyrillic, Trung Quốc và Hindi.

Các định dạng tệp nào được hỗ trợ?

OCRize hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG và TIFF. Kết quả nhận diện được trả lại dưới dạng văn bản thuần, HTML, Microsoft Word, PDF, JSON và XML.

Cách đạt được kết quả tốt nhất là gì?

Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.

 Tiếng Việt