使用OCRize图像文本查找器在图像中搜索文本,这是一款强大的.NET OCR插件。识别图像文本之间的差异,无论样式、分辨率、字体、格式或其他因素如何。只需一行代码即可执行正则表达式搜索、不区分大小写的搜索以及比较。非常适合检测数字档案中的个人信息(PII)、分析合同、对大量非文本数据进行分类,以及简化业务流程。
从发布页面获取相应的程序集文件或从 NuGet 获取包以直接将 OCRize
添加到您的工作区。
默认情况下,我们的库可以根据扩展拉丁字母表自动识别广泛的语言。然而,提供特定的语言可以显著提高识别准确性。在识别西里尔文、汉语和印地文文本时明确指定语言。
您可以使用扫描仪或相机中的任何流行格式,包括PDF、JPEG、PNG和TIFF,包括多页文档。识别结果以纯文本、HTML、Microsoft Word、PDF、JSON和XML返回。
良好的图像质量对于准确的OCR至关重要。使用扫描仪或高分辨率相机。该图书馆具有高级过滤器,可在识别前自动提高图像质量。