OCRizeの.NET OCRプラグインは、スキャンまたは撮影された表からテキストを抽出します。高度な機械学習アルゴリズムと特に訓練されたニューラルネットワークが、表の構造を正確に特定し、セルからテキストを抽出し、それを検索可能で編集可能なスプレッドシートに整理します。
リリースからそれぞれのアセンブリファイルを取得するか、NuGetからパッケージを取得して、OCRizeを直接ワークスペースに追加してください。
デフォルトでは、OCRizeは拡張ラテンアルファベットに基づいて幅広い言語を自動的に認識できます。ただし、特定の言語を提供することで、認識の精度を大幅に向上させることができます。キリル文字、中国語、ヒンディー語のテキストを認識する際には、言語を明示的に指定してください。
OCRizeは、スキャナーやカメラからの一般的なフォーマット、PDF、JPEG、PNG、TIFFをサポートしています。認識結果は、プレーンテキスト、HTML、Microsoft Word、PDF、JSON、およびXMLで返されます。
良質な画像は正確なOCRにとって重要です。スキャナーまたは高解像度カメラを使用してください。ライブラリには、認識前に画質を自動的に向上させる高度なフィルターが含まれています。