1. 製品
  2.   テキストにスキャン

スキャンされた画像からテキストへのOCR

画像から大量の構造化されたテキストを抽出します。例えば、スキャンした契約書、合意書、書籍のページ、記事、新聞などです。OCRizeを使用して、正確な認識を達成します。特にマルチカラムレイアウトを含みます。

スキャンした画像をテキストにOCR化するための .NET

OCRizeの.NET OCRプラグインは、スキャンした契約書、合意書、書籍のページ、記事、新聞など、大量の構造化されたテキストを持つ画像からテキストを抽出します。認識エンジンは文書構造を正確に判断し、複雑なレイアウト、マルチカラムテキストを含む文書を扱うことができます。

スキャンされた画像をテキストに変換するプラグインの使い方

  • NuGetからまたはローカルにダウンロードしたファイルからOCRizeパッケージをインストールします。
  • ライセンスキーを設定してください。
  • OcrInput`オブジェクトにスキャンされた画像を読み込みます。
  • OCRize認識エンジンのインスタンスを作成する。
  • 画像からテキストを抽出します。
  • 認識されたテキストを出力するか、ファイルに保存します。

NET 用の Scan to Text Converter プラグインを入手してください

リリースからそれぞれのアセンブリファイルを取得するか、NuGetからパッケージを取得して、OCRizeを直接ワークスペースに追加してください。

  • Microsoft Windowsと.NET Standard 2.0と互換性があります。
  • Microsoft Visual Studioのような開発環境が必要です。

よくある質問

言語を指定する必要がありますか?

デフォルトでは、OCRizeは拡張ラテンアルファベットに基づいて幅広い言語を自動的に認識できます。ただし、特定の言語を提供することで、認識の精度を大幅に向上させることができます。キリル文字、中国語、ヒンディー語のテキストを認識する際には、言語を明示的に指定してください。

サポートされているファイル形式は何ですか?

OCRizeは、スキャナーやカメラからの一般的なフォーマット、PDF、JPEG、PNG、TIFFをサポートしています。認識結果は、プレーンテキスト、HTML、Microsoft Word、PDF、JSON、およびXMLで返されます。

ベストな結果を得る方法は何ですか?

良質な画像は正確なOCRにとって重要です。スキャナーまたは高解像度カメラを使用してください。ライブラリには、認識前に画質を自動的に向上させる高度なフィルターが含まれています。

 日本語