画像内のテキストをOCRize Image Text Finderで検索しましょう。これは強力な.NET OCRプラグインです。スタイル、解像度、フォント、フォーマット、その他の要因に関係なく、画像テキストの違いを特定します。単一のコード行で正規表現検索、大文字小文字を区別しない検索、比較を実行します。デジタルアーカイブ内のPIIを検出するのに最適で、契約の分析、大量の非テキストデータの分類、ビジネスプロセスの合理化を行います。
Releases’ からそれぞれのアセンブリファイルを取得するか、NuGet からパッケージを取得して、OCRize
を直接ワークスペースに追加してください。
デフォルトでは、当社のライブラリは、拡張ラテンアルファベットに基づく幅広い言語を自動的に認識できます。ただし、特定の言語を提供すると、認識の正確性が大幅に向上します。キリル文字、中国語、ヒンディー語のテキストを認識する際は言語を明示的に指定してください。
次のテキストを翻訳します: スキャナーやカメラから、PDF、JPEG、PNG、TIFFなど、人気のあるフォーマットを使用できます。複数ページのドキュメントを含めても大丈夫です。認識結果はプレーンテキスト、HTML、Microsoft Word、PDF、JSON、XMLで返されます。
良好な画質は正確なOCRにとって重要です。 スキャナーまたは高解像度カメラを使用してください。 ライブラリには、認識前に画質を自動的に向上させるための高度なフィルターがあります。