스캔 된 이미지를 텍스트로 변환하는 OCR

이미지에서 대량의 구조화된 텍스트 추출하기, 예를 들어 스캔된 계약서, 합의서, 책 페이지, 기사, 신문 등. OCRize를 사용하여 다중 열 레이아웃을 포함한 정확한 인식 달성하기.

OCRize Scanned Image to Text for .NET의 한국어 번역은 다음과 같습니다: 스캔 이미지의 OCR 처리를 통한 텍스트 변환 for .NET

OCRize의 .NET OCR 플러그인은 스캔한 계약서, 합의서, 책 페이지, 기사, 신문 및 그 외 많은 구조화된 텍스트가 포함된 이미지에서 텍스트를 추출합니다. 인식 엔진은 문서 구조를 정확하게 결정하여 다단 텍스트를 포함한 복잡한 레이아웃으로 작업할 수 있게 해줍니다.

스캔 이미지를 텍스트 플러그인 사용 방법

OCRize 패키지를 NuGet 또는 로컬로 다운로드한 파일에서 설치하세요.
라이센스 키를 설정하십시오.
OcrInput` 객체로 스캔된 이미지를 로드합니다.
OCRize 인식 엔진의 인스턴스를 생성합니다.
이미지에서 텍스트 추출하기.
인식된 텍스트를 출력하거나 파일로 저장합니다.

NET용 스캔 to 텍스트 변환 플러그인을 받으세요.

릴리스에서 해당 어셈블리 파일을 가져오거나 NuGet에서 패키지를 받아 OCRize를 직접 작업 공간에 추가하세요.'

Microsoft Windows와 .NET Standard 2.0을 지원하는 호환 가능한 OS와 호환됩니다.
Microsoft Visual Studio와 같은 개발 환경이 필요합니다.

자주 묻는 질문

언어를 지정하는 것이 필요한가요?

기본적으로, OCRize는 확장 라틴 알파벳을 기반으로 다양한 언어를 자동으로 인식할 수 있습니다. 그러나 특정 언어를 제공하면 인식 정확도를 크게 향상시킬 수 있습니다. 키릴 문자, 중국어 및 힌디어 텍스트를 인식할 때는 언어를 명시적으로 지정하십시오.

지원되는 파일 형식은 무엇인가요?

OCRize는 PDF, JPEG, PNG 및 TIFF를 포함한 스캐너 또는 카메라의 인기 형식을 지원합니다. 인식 결과는 일반 텍스트, HTML, Microsoft Word, PDF, JSON 및 XML 형식으로 반환됩니다.

최상의 결과를 이루는 방법은 무엇인가요?

정확한 OCR을 위해 좋은 이미지 품질은 중요합니다. 스캐너나 고해상도 카메라를 사용하세요. 라이브러리에는 인식 전에 이미지 품질을 자동으로 개선하는 고급 필터가 포함되어 있습니다.