Image scannée en texte OCR

Extraire du texte d’images contenant de grandes quantités de texte structuré, telles que des contrats numérisés, des accords, des pages de livre, des articles, des journaux, et plus encore. Atteindre une reconnaissance précise, y compris les mises en page à plusieurs colonnes, avec OCRize.

OCRisez l'image scannée en texte pour .NET

Le plug-in OCR .NET d’OCRize extrait du texte à partir d’images contenant de grandes quantités de texte structuré, comme des contrats scannés, des accords, des pages de livres, des articles, des journaux, et plus encore. Le moteur de reconnaissance détermine avec précision la structure du document, vous permettant de travailler avec des mises en page complexes, y compris du texte en plusieurs colonnes.

Comment utiliser le plugin de reconnaissance de texte à partir d’une image scannée

Installez le package OCRize à partir de NuGet ou d’un fichier téléchargé localement.
Définissez vos clés de licence.
Charger une image scannée dans l’objet OcrInput.
Créer une instance du moteur de reconnaissance OCRize.
Extraire du texte à partir d’une image.
Afficher le texte reconnu ou l’enregistrer dans un fichier.

Obtenez le plugin de convertisseur Scan to Text pour .NET

Obtenez les fichiers d’assemblage respectifs à partir des versions ou téléchargez le package depuis NuGet pour ajouter OCRize directement à votre espace de travail.

Compatible avec Microsoft Windows ou un système d’exploitation compatible avec .NET Standard 2.0
Nécessite un environnement de développement tel que Microsoft Visual Studio.

Foire aux questions

La spécification d’une langue est-elle nécessaire?

Par défaut, OCRize peut automatiquement reconnaître un large éventail de langues basées sur l’alphabet latin étendu. Cependant, fournir une langue spécifique peut améliorer considérablement la précision de la reconnaissance. Spécifiez explicitement la langue lors de la reconnaissance de textes en cyrillique, chinois et hindi.

Quels formats de fichier sont pris en charge?

OCRize prend en charge les formats populaires des scanners ou des caméras, y compris PDF, JPEG, PNG et TIFF. Les résultats de reconnaissance sont renvoyés en texte brut, HTML, Microsoft Word, PDF, JSON et XML.

Comment obtenir le meilleur résultat?

Bonne qualité d’image est crucial pour une OCR précise. Utilisez un scanner ou un appareil photo haute résolution. La bibliothèque inclut des filtres avancés pour améliorer automatiquement la qualité de l’image avant la reconnaissance.