1. Sản Phẩm
  2.   Bảng thành Văn bản

Chuyển đổi Bảng sang Văn bản OCR

Trích xuất văn bản từ các bảng được quét hoặc chụp ảnh. Phát hiện chính xác cấu trúc của bảng, trích xuất văn bản từ các ô, và sắp xếp nó thành các bảng tính có thể tìm kiếm và chỉnh sửa. OCRize - Giải pháp của bạn cho việc trích xuất văn bản từ bảng trong .NET.

Chuyển đổi Bảng OCR thành Văn bản cho .NET

OCRize’s .NET OCR plug-in trích xuất văn bản từ các bảng quét hoặc chụp ảnh. Các thuật toán máy học tiên tiến và các mạng nơ-ron được đào tạo đặc biệt xác định chính xác cấu trúc của các bảng, trích xuất văn bản từ các ô, và tổ chức nó thành các bảng tính có thể tìm kiếm và chỉnh sửa.

Cách sử dụng Plugin Bảng thành Văn bản

  • Cài đặt gói OCRize từ NuGet hoặc một tệp được tải xuống cục bộ.
  • Đặt khóa giấy phép của bạn.
  • Tải một hình ảnh đã quét vào đối tượng OcrInput.
  • Tạo một phiên bản của engine nhận diện OCRize.
  • Trích xuất văn bản từ hình ảnh bảng.
  • Đầu ra văn bản được nhận diện hoặc lưu vào một tệp.

Nhận Plugin Chuyển đổi Hình Ảnh Bảng thành Văn Bản

Lấy các tệp lắp ráp tương ứng từ phần Phát hành hoặc tải gói từ NuGet để thêm OCRize trực tiếp vào không gian làm việc của bạn.

  • Tương thích với Microsoft Windows hoặc một hệ điều hành tương thích với .NET Standard 2.0
  • Yêu cầu một môi trường phát triển như Microsoft Visual Studio.

Câu Hỏi Thường Gặp

Có cần phải chỉ định một ngôn ngữ không?

Mặc định, OCRize có thể tự động nhận diện một loạt các ngôn ngữ dựa trên bảng chữ cái Latin Mở rộng. Tuy nhiên, việc cung cấp một ngôn ngữ cụ thể có thể cải thiện đáng kể độ chính xác nhận diện. Hãy chỉ định rõ ràng ngôn ngữ khi nhận diện các văn bản Cyrillic, Trung Quốc và Hindi.

Các định dạng tệp nào được hỗ trợ?

OCRize hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG và TIFF. Kết quả nhận diện được trả lại dưới dạng văn bản thuần, HTML, Microsoft Word, PDF, JSON và XML.

Cách đạt được kết quả tốt nhất là gì?

Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.

 Tiếng Việt