1. Produkte
  2.   Gescanntes PDF in Text

Gescanntes PDF in Text OCR

Extrahieren Sie Text aus gescannten PDFs oder konvertieren Sie sie in durchsuchbare Dokumente. Lesen Sie jedes Layout und jede Stilrichtung, definieren Sie die Struktur von Texten und Tabellen genau. Bewahren Sie originale Bilder im Hintergrund zur Inhaltsbewahrung auf. OCRize - Ihre PDF-Textextraktionslösung für .NET.

OCRize Scanned PDF to Text für .NET

OCRize’s .NET OCR-Plugin extrahiert Text aus gescannten PDFs oder wandelt sie in durchsuchbare Dokumente um, wobei die ursprünglichen Bilder erhalten bleiben. Fortschrittliche Algorithmen identifizieren Texte und Tabellenstrukturen genau und machen es zu Ihrer bevorzugten Lösung für die Textextraktion aus PDFs.

Wie man das Scanned PDF-zu-Text-Plugin verwendet

  • Installieren Sie das OCRize-Paket von NuGet oder einer lokal heruntergeladenen Datei.
  • Setzen Sie Ihre Lizenzschlüssel.
  • Laden Sie ein gescanntes Bild in das OcrInput-Objekt.
  • Erstellen Sie eine Instanz der OCRize-Erkennungsengine.
  • Extrahiere den Text aus einem gescannten PDF.
  • Geben Sie den erkannten Text aus oder speichern Sie ihn in einer Datei.

Erhalten Sie den Plugin für gescannte PDF in Text Konverter.

Holen Sie sich die entsprechenden Assemblierungsdateien aus den Releases oder laden Sie das Paket von NuGet herunter, um OCRize direkt in Ihre Arbeitsumgebung hinzuzufügen.

  • Kompatibel mit Microsoft Windows oder einem kompatiblen Betriebssystem mit .NET Standard 2.0
  • Erfordert eine Entwicklungsumgebung wie Microsoft Visual Studio.

Häufig gestellte Fragen

Ist die Angabe einer Sprache erforderlich?

Standardmäßig kann OCRize automatisch eine Vielzahl von Sprachen basierend auf dem erweiterten lateinischen Alphabet erkennen. Das Bereitstellen einer spezifischen Sprache kann jedoch die Erkennungsgenauigkeit erheblich verbessern. Geben Sie die Sprache ausdrücklich an, wenn Sie kyrillische, chinesische und Hindi-Texte erkennen.

Welche Dateiformate werden unterstützt?

OCRize unterstützt gängige Formate von Scannern oder Kameras, einschließlich PDF, JPEG, PNG und TIFF. Die Erkennungsergebnisse werden in Plaintext, HTML, Microsoft Word, PDF, JSON und XML zurückgegeben.

Wie erreicht man das beste Ergebnis?

Gute Bildqualität ist entscheidend für eine präzise OCR. Verwenden Sie einen Scanner oder eine Kamera mit hoher Auflösung. Die Bibliothek enthält fortschrittliche Filter, um die Bildqualität vor der Erkennung automatisch zu verbessern.

 Deutsch