产品
将表格转换为文本

表格文本OCR

提取扫描或拍摄的表格中的文本。准确检测表格的结构，从单元格中提取文本，并将其整理成可搜索和可编辑的电子表格。OCRize - 您在 .NET 中提取表格文本的解决方案。

将 OCRize 表格转换为文本 for .NET

OCRize 的 .NET OCR 插件从扫描或拍摄的表格中提取文本。先进的机器学习算法和特别训练的神经网络准确识别表格的结构，提取单元格中的文本，并将其组织成可搜索和可编辑的电子表格。

如何使用表格转文本插件

从NuGet或本地下载的文件安装OCRize包。
设置您的许可证密钥。
将扫描的图像加载到 OcrInput 对象中。
创建OCRize识别引擎的实例。
从表格图像中提取文本。
输出识别的文本或将其保存到文件中。

获取表格图片转文字转换插件

获取相应的程序集文件从发布版本中，或者从 NuGet 获取包，以直接将 OCRize 添加到您的工作区。

与Microsoft Windows或具有.NET Standard 2.0的兼容操作系统兼容。
需要像Microsoft Visual Studio这样的开发环境。

常见问题

在文本中指定语言是否必要？

默认情况下，OCRize 可以自动识别基于扩展拉丁字母的广泛语言。然而，提供特定的语言可以显著提高识别准确性。在识别西里尔文、中文和印地语文本时，请明确指定语言。

支持哪些文件格式？

OCRize 支持来自扫描仪或相机的热门格式，包括 PDF、JPEG、PNG 和 TIFF。识别结果以纯文本、HTML、Microsoft Word、PDF、JSON 和 XML 的形式返回。

如何实现最佳结果？

良好的图像质量对于准确的OCR至关重要。使用扫描仪或高分辨率相机。图书馆包含高级滤镜，可在识别之前自动改善图像质量。