OCRize’s .NET OCR plug-in extrahuje text z obrázků s velkým množstvím strukturovaného textu, jako jsou skenované smlouvy, dohody, stránky knih, články, noviny a další. Rozpoznávací engine přesně určuje strukturu dokumentu, což vám umožňuje pracovat se složitými rozvrženími, včetně textu ve více sloupcích.
OcrInput
.Získejte příslušné soubory sestavení z verzí nebo stáhněte balíček z NuGet, abyste přidali OCRize přímo do svého pracovního prostoru.
Ve výchozím nastavení může OCRize automaticky rozpoznávat širokou škálu jazyků založených na rozšířené latinské abecedě. Specifikování konkrétního jazyka však může výrazně zlepšit přesnost rozpoznávání. Výslovně specifikujte jazyk při rozpoznávání cyrilice, čínských a hindských textů.
OCRize podporuje populární formáty ze skenerů nebo fotoaparátů, včetně PDF, JPEG, PNG a TIFF. Výsledky rozpoznávání jsou vraceny v prostém textu, HTML, Microsoft Word, PDF, JSON a XML.
Kvalita obrazu je klíčová pro přesný OCR. Použijte skener nebo fotoaparát s vysokým rozlišením. Knihovna obsahuje pokročilé filtry pro automatické zlepšení kvality obrazu před rozpoznáním.