1. Productos
  2.   Convertir PDF Escaneado a Texto

De PDF escaneado a texto OCR.

Extraer texto de PDFs escaneados o convertirlos en documentos buscables. Leer cualquier diseño y estilo, definir con precisión la estructura del texto y las tablas. Preservar las imágenes originales en el fondo para la retención de contenido. OCRize - Su solución de extracción de texto de PDF para .NET.

OCRizar PDF escaneado a texto para .NET

El complemento OCR de .NET de OCRize extrae texto de archivos PDF escaneados o los convierte en documentos de búsqueda, preservando las imágenes originales. Algoritmos avanzados identifican con precisión el texto y las estructuras de tabla, lo que lo convierte en su solución ideal para la extracción de texto de PDF.

Cómo usar el complemento de escaneo de PDF a texto

  • Instala el paquete OCRize desde NuGet o un archivo descargado localmente.
  • Establece tus claves de licencia.
  • Cargue una imagen escaneada en el objeto OcrInput.
  • Crea una instancia del motor de reconocimiento OCRize.
  • Extraer texto de un PDF escaneado.
  • Imprimir el texto reconocido o guardarlo en un archivo.

Obtener el Plugin Convertidor de PDF Escaneados a Texto

Obtén los archivos de ensamblado respectivos de las versiones o descarga el paquete desde NuGet para agregar OCRize directamente a tu espacio de trabajo.

  • Compatible con Microsoft Windows o un sistema operativo compatible con .NET Standard 2.0
  • Requiere un entorno de desarrollo como Microsoft Visual Studio.

Preguntas frecuentes

Es necesario especificar un idioma?

Por defecto, OCRize puede reconocer automáticamente una amplia gama de idiomas basados en el alfabeto latino extendido. Sin embargo, proporcionar un idioma específico puede mejorar significativamente la precisión del reconocimiento. Especifica explícitamente el idioma al reconocer textos en cirílico, chino e hindi.

Qué formatos de archivo son compatibles?

OCRize admite formatos populares de escáneres o cámaras, incluidos PDF, JPEG, PNG y TIFF. Los resultados del reconocimiento se devuelven en texto sin formato, HTML, Microsoft Word, PDF, JSON y XML.

Cómo lograr el mejor resultado?

Buena calidad de imagen es crucial para una OCR precisa. Utilice un escáner o una cámara de alta resolución. La biblioteca incluye filtros avanzados para mejorar automáticamente la calidad de imagen antes de la reconocimiento.

 Español