OCRize의 .NET OCR 플러그인은 스캔한 계약서, 합의서, 책 페이지, 기사, 신문 및 그 외 많은 구조화된 텍스트가 포함된 이미지에서 텍스트를 추출합니다. 인식 엔진은 문서 구조를 정확하게 결정하여 다단 텍스트를 포함한 복잡한 레이아웃으로 작업할 수 있게 해줍니다.
릴리스에서 해당 어셈블리 파일을 가져오거나 NuGet에서 패키지를 받아 OCRize를 직접 작업 공간에 추가하세요.'
기본적으로, OCRize는 확장 라틴 알파벳을 기반으로 다양한 언어를 자동으로 인식할 수 있습니다. 그러나 특정 언어를 제공하면 인식 정확도를 크게 향상시킬 수 있습니다. 키릴 문자, 중국어 및 힌디어 텍스트를 인식할 때는 언어를 명시적으로 지정하십시오.
OCRize는 PDF, JPEG, PNG 및 TIFF를 포함한 스캐너 또는 카메라의 인기 형식을 지원합니다. 인식 결과는 일반 텍스트, HTML, Microsoft Word, PDF, JSON 및 XML 형식으로 반환됩니다.
정확한 OCR을 위해 좋은 이미지 품질은 중요합니다. 스캐너나 고해상도 카메라를 사용하세요. 라이브러리에는 인식 전에 이미지 품질을 자동으로 개선하는 고급 필터가 포함되어 있습니다.