1. Produtos
  2.   De PDF digitalizado para Texto

Converter PDF digitalizado para texto OCR

Extrair texto de PDFs digitalizados ou convertê-los em documentos pesquisáveis. Ler qualquer layout e estilo, definir com precisão a estrutura de texto e tabelas. Preservar imagens originais em segundo plano para retenção de conteúdo. OCRize - Sua solução de extração de texto em PDF para .NET.

OCRize Scanned PDF to Text for .NET - OCRize PDF Digitalize o PDF escaneado para texto para .NET

O plug-in OCR da .NET da OCRize extrai texto de PDFs digitalizados ou os converte em documentos pesquisáveis, preservando as imagens originais. Algoritmos avançados identificam com precisão estruturas de texto e tabelas, tornando-o a sua solução ideal para extração de texto em PDF.

Como Usar o Plugin PDF Escaneado para Texto

  • Instale o pacote OCRize do NuGet ou de um arquivo baixado localmente.
  • Defina suas chaves de licença.
  • Carregue uma imagem digitalizada no objeto OcrInput.
  • Crie uma instância do mecanismo de reconhecimento OCRize.
  • Extrair texto de um PDF digitalizado.
  • Exibir o texto reconhecido ou salvá-lo em um arquivo.

Obtenha o Plugin Conversor de PDF Digitalizado para Texto.

Obtenha os arquivos de montagem correspondentes nas Releases ou baixe o pacote do NuGet para adicionar o OCRize diretamente ao seu espaço de trabalho.

  • Compatível com o Microsoft Windows ou um sistema operacional compatível com o .NET Standard 2.0
  • Requer um ambiente de desenvolvimento como o Microsoft Visual Studio.

Perguntas Frequentes

É necessário especificar um idioma?

Por padrão, o OCRize pode reconhecer automaticamente uma ampla gama de idiomas com base no alfabeto latino estendido. No entanto, fornecer um idioma específico pode aumentar significativamente a precisão do reconhecimento. Especifique explicitamente o idioma ao reconhecer textos em cirílico, chinês e hindi.

Quais formatos de arquivo são suportados?

OCRize suporta formatos populares de scanners ou câmeras, incluindo PDF, JPEG, PNG e TIFF. Os resultados do reconhecimento são retornados em texto simples, HTML, Microsoft Word, PDF, JSON e XML.

Como alcançar o melhor resultado?

Boa qualidade de imagem é crucial para OCR preciso. Use um scanner ou câmera de alta resolução. A biblioteca inclui filtros avançados para melhorar automaticamente a qualidade da imagem antes do reconhecimento.

 Português