OCRize’s .NET OCR plug-in wyodrębnia tekst z zeskanowanych lub fotografowanych tabel. Zaawansowane algorytmy uczenia maszynowego i specjalnie szkolone sieci neuronowe dokładnie identyfikują strukturę tabel, wyodrębniają tekst z komórek i organizują go w przeszukiwalne i edytowalne arkusze kalkulacyjne.
OcrInput
.Pobierz odpowiednie pliki assembly z sekcji Releases lub pobierz paczkę z NuGet, aby dodać OCRize bezpośrednio do swojego obszaru roboczego.
Domyślnie, OCRize może automatycznie rozpoznawać szeroki zakres języków opartych na rozszerzonej alfabetze łacińskim. Jednak podanie konkretnego języka może znacznie poprawić dokładność rozpoznawania. Wyraźnie określ język przy rozpoznawaniu tekstów cyrylicznych, chińskich i hindi.
OCRize wspiera popularne formaty z skanerów lub aparatów, w tym PDF, JPEG, PNG i TIFF. Wyniki rozpoznawania są zwracane w formacie prostego tekstu, HTML, Microsoft Word, PDF, JSON i XML.
Dobra jakość obrazu jest kluczowa dla dokładnego OCR. Użyj skanera lub aparatu o wysokiej rozdzielczości. Biblioteka zawiera zaawansowane filtry, które automatycznie poprawiają jakość obrazu przed rozpoznaniem.