Conversion de PDF numérisé en texte grâce à la reconnaissance optique de caractères (OCR).

Extraire le texte des PDF scannés ou les convertir en documents consultables. Lire toute mise en page et style, définir avec précision la structure du texte et des tableaux. Préserver les images originales en arrière-plan pour la conservation du contenu. OCRize - Votre solution d’extraction de texte PDF pour .NET.

OCRize Scanned PDF to Text pour .NET

Le plug-in OCR de .NET d’OCRize extrait le texte des PDF numérisés ou les convertit en documents consultables, préservant les images originales. Des algorithmes avancés identifient avec précision le texte et les structures de tableau, en faisant votre solution de choix pour l’extraction de texte PDF.

Comment utiliser le plugin PDF scanné vers texte

Installez le package OCRize à partir de NuGet ou d’un fichier téléchargé localement.
Définissez vos clés de licence.
Charger une image scannée dans l’objet OcrInput.
Créer une instance du moteur de reconnaissance OCRize.
Extraire le texte d’un PDF numérisé.
Afficher le texte reconnu ou l’enregistrer dans un fichier.

Obtenez le plugin de conversion de PDF scanné en texte

Obtenez les fichiers d’assemblage respectifs à partir des versions ou téléchargez le package depuis NuGet pour ajouter OCRize directement à votre espace de travail.

Compatible avec Microsoft Windows ou un système d’exploitation compatible avec .NET Standard 2.0
Nécessite un environnement de développement tel que Microsoft Visual Studio.

Foire aux questions

La spécification d’une langue est-elle nécessaire?

Par défaut, OCRize peut automatiquement reconnaître un large éventail de langues basées sur l’alphabet latin étendu. Cependant, fournir une langue spécifique peut améliorer considérablement la précision de la reconnaissance. Spécifiez explicitement la langue lors de la reconnaissance de textes en cyrillique, chinois et hindi.

Quels formats de fichier sont pris en charge?

OCRize prend en charge les formats populaires des scanners ou des caméras, y compris PDF, JPEG, PNG et TIFF. Les résultats de reconnaissance sont renvoyés en texte brut, HTML, Microsoft Word, PDF, JSON et XML.

Comment obtenir le meilleur résultat?

Bonne qualité d’image est crucial pour une OCR précise. Utilisez un scanner ou un appareil photo haute résolution. La bibliothèque inclut des filtres avancés pour améliorer automatiquement la qualité de l’image avant la reconnaissance.