OCRize的.NET OCR插件可以从用相机或智能手机拍摄的照片中读取文本。先进的预处理滤镜和强大的字符检测算法处理旋转、扭曲和多噪声图像,保持高OCR准确性。内置的拼写检查器进一步提高了识别结果。
OcrInput
对象中。获取相应的程序集文件从发布版本中,或者从 NuGet 获取包,以直接将 OCRize 添加到您的工作区。
默认情况下,OCRize 可以自动识别基于扩展拉丁字母的广泛语言。然而,提供特定的语言可以显著提高识别准确性。在识别西里尔文、中文和印地语文本时,请明确指定语言。
OCRize 支持来自扫描仪或相机的热门格式,包括 PDF、JPEG、PNG 和 TIFF。识别结果以纯文本、HTML、Microsoft Word、PDF、JSON 和 XML 的形式返回。
良好的图像质量对于准确的OCR至关重要。使用扫描仪或高分辨率相机。图书馆包含高级滤镜,可在识别之前自动改善图像质量。