Przekonwertuj skanowany plik PDF na tekst przy użyciu OCR.

Wyodrębnij tekst z zeskanowanych plików PDF lub przekształć je w dokumenty wyszukiwalne. Odczytaj dowolny układ i styl, dokładnie określając strukturę tekstu i tabel. Zachowaj oryginalne obrazy w tle dla utrzymania zawartości. OCRize - Twoje rozwiązanie do wyodrębniania tekstu z PDF dla .NET.

OCRizuj zeskanowany PDF do tekstu dla .NET"

OCRize’s .NET OCR plug-in wyodrębnia tekst z zeskanowanych plików PDF lub przekształca je w dokumenty przeszukiwalne, zachowując oryginalne obrazy. Zaawansowane algorytmy dokładnie identyfikują tekst i struktury tabel, co czyni go idealnym rozwiązaniem do wyodrębniania tekstu z PDF.

Jak używać wtyczki PDF do tekstu zeskanowanego

Zainstaluj pakiet OCRize z NuGet lub z lokalnie pobranego pliku.
Ustaw swoje klucze licencyjne.
Załaduj zeskanowany obraz do obiektu OcrInput.
Utwórz instancję silnika rozpoznawania OCRize.
Wydobywanie tekstu z zeskanowanego pliku PDF.
Wyświetl rozpoznany tekst lub zapisz go do pliku.

Pobierz wtyczkę konwertera PDF na tekst.

Pobierz odpowiednie pliki assembly z sekcji Releases lub pobierz paczkę z NuGet, aby dodać OCRize bezpośrednio do swojego obszaru roboczego.

Zgodny z systemem Microsoft Windows lub zgodnym systemem operacyjnym z .NET Standard 2.0
Wymaga środowiska programistycznego, takiego jak Microsoft Visual Studio.

Najczęściej Zadawane Pytania

Czy określenie języka jest konieczne?

Domyślnie, OCRize może automatycznie rozpoznawać szeroki zakres języków opartych na rozszerzonej alfabetze łacińskim. Jednak podanie konkretnego języka może znacznie poprawić dokładność rozpoznawania. Wyraźnie określ język przy rozpoznawaniu tekstów cyrylicznych, chińskich i hindi.

Jakie formaty plików są obsługiwane?

OCRize wspiera popularne formaty z skanerów lub aparatów, w tym PDF, JPEG, PNG i TIFF. Wyniki rozpoznawania są zwracane w formacie prostego tekstu, HTML, Microsoft Word, PDF, JSON i XML.

Jak osiągnąć najlepszy wynik?

Dobra jakość obrazu jest kluczowa dla dokładnego OCR. Użyj skanera lub aparatu o wysokiej rozdzielczości. Biblioteka zawiera zaawansowane filtry, które automatycznie poprawiają jakość obrazu przed rozpoznaniem.