OCRize’s .NET OCR plug-in extrahuje text z naskenovaných nebo vyfocených tabulek. Pokročilé algoritmy strojového učení a speciálně trénované neuronové sítě přesně identifikují strukturu tabulek, extrahují text z buněk a organizují ho do vyhledatelných a upravitelných tabulek.
OcrInput
.Získejte příslušné soubory sestavení z verzí nebo stáhněte balíček z NuGet, abyste přidali OCRize přímo do svého pracovního prostoru.
Ve výchozím nastavení může OCRize automaticky rozpoznávat širokou škálu jazyků založených na rozšířené latinské abecedě. Specifikování konkrétního jazyka však může výrazně zlepšit přesnost rozpoznávání. Výslovně specifikujte jazyk při rozpoznávání cyrilice, čínských a hindských textů.
OCRize podporuje populární formáty ze skenerů nebo fotoaparátů, včetně PDF, JPEG, PNG a TIFF. Výsledky rozpoznávání jsou vraceny v prostém textu, HTML, Microsoft Word, PDF, JSON a XML.
Kvalita obrazu je klíčová pro přesný OCR. Použijte skener nebo fotoaparát s vysokým rozlišením. Knihovna obsahuje pokročilé filtry pro automatické zlepšení kvality obrazu před rozpoznáním.