Converter PDF digitalizado para texto OCR

Extrair texto de PDFs digitalizados ou convertê-los em documentos pesquisáveis. Ler qualquer layout e estilo, definir com precisão a estrutura de texto e tabelas. Preservar imagens originais em segundo plano para retenção de conteúdo. OCRize - Sua solução de extração de texto em PDF para .NET.

OCRize Scanned PDF to Text for .NET - OCRize PDF Digitalize o PDF escaneado para texto para .NET

O plug-in OCR da .NET da OCRize extrai texto de PDFs digitalizados ou os converte em documentos pesquisáveis, preservando as imagens originais. Algoritmos avançados identificam com precisão estruturas de texto e tabelas, tornando-o a sua solução ideal para extração de texto em PDF.

Como Usar o Plugin PDF Escaneado para Texto

Instale o pacote OCRize do NuGet ou de um arquivo baixado localmente.
Defina suas chaves de licença.
Carregue uma imagem digitalizada no objeto OcrInput.
Crie uma instância do mecanismo de reconhecimento OCRize.
Extrair texto de um PDF digitalizado.
Exibir o texto reconhecido ou salvá-lo em um arquivo.

Obtenha o Plugin Conversor de PDF Digitalizado para Texto.

Obtenha os arquivos de montagem correspondentes nas Releases ou baixe o pacote do NuGet para adicionar o OCRize diretamente ao seu espaço de trabalho.

Compatível com o Microsoft Windows ou um sistema operacional compatível com o .NET Standard 2.0
Requer um ambiente de desenvolvimento como o Microsoft Visual Studio.

Perguntas Frequentes

É necessário especificar um idioma?

Por padrão, o OCRize pode reconhecer automaticamente uma ampla gama de idiomas com base no alfabeto latino estendido. No entanto, fornecer um idioma específico pode aumentar significativamente a precisão do reconhecimento. Especifique explicitamente o idioma ao reconhecer textos em cirílico, chinês e hindi.

Quais formatos de arquivo são suportados?

OCRize suporta formatos populares de scanners ou câmeras, incluindo PDF, JPEG, PNG e TIFF. Os resultados do reconhecimento são retornados em texto simples, HTML, Microsoft Word, PDF, JSON e XML.

Como alcançar o melhor resultado?

Boa qualidade de imagem é crucial para OCR preciso. Use um scanner ou câmera de alta resolução. A biblioteca inclui filtros avançados para melhorar automaticamente a qualidade da imagem antes do reconhecimento.