El complemento OCR de OCRize para .NET extrae texto de imágenes con grandes cantidades de texto estructurado, como contratos escaneados, acuerdos, páginas de libros, artículos, periódicos y más. El motor de reconocimiento determina con precisión la estructura del documento, lo que te permite trabajar con diseños complejos, incluidos textos en varias columnas.
OcrInput
.Obtén los archivos de ensamblado respectivos de las versiones o descarga el paquete desde NuGet para agregar OCRize directamente a tu espacio de trabajo.
Por defecto, OCRize puede reconocer automáticamente una amplia gama de idiomas basados en el alfabeto latino extendido. Sin embargo, proporcionar un idioma específico puede mejorar significativamente la precisión del reconocimiento. Especifica explícitamente el idioma al reconocer textos en cirílico, chino e hindi.
OCRize admite formatos populares de escáneres o cámaras, incluidos PDF, JPEG, PNG y TIFF. Los resultados del reconocimiento se devuelven en texto sin formato, HTML, Microsoft Word, PDF, JSON y XML.
Buena calidad de imagen es crucial para una OCR precisa. Utilice un escáner o una cámara de alta resolución. La biblioteca incluye filtros avanzados para mejorar automáticamente la calidad de imagen antes de la reconocimiento.