Tabulka na text OCR

Extrahujte text z naskenovaných nebo vyfocených tabulek. Přesně detekujte strukturu tabulek, extrahujte text z buněk a uspořádejte ho do prohledávatelných a upravitelných tabulek. OCRize - Vaše řešení pro extrakci textu z tabulek v .NET.

OCRize Tabulka na Text pro .NET

OCRize’s .NET OCR plug-in extrahuje text z naskenovaných nebo vyfocených tabulek. Pokročilé algoritmy strojového učení a speciálně trénované neuronové sítě přesně identifikují strukturu tabulek, extrahují text z buněk a organizují ho do vyhledatelných a upravitelných tabulek.

Jak používat plugin Table to Text.

Nainstalujte balíček OCRize z NuGet nebo z místně staženého souboru.
Nastavte své licenční klíče.
Načtěte naskenovaný obrázek do objektu OcrInput.
Vytvořte instanci rozpoznávacího enginu OCRize.
Extrahovat text z obrázku tabulky.
Výstup zobrazte rozpoznaný text nebo uložte do souboru.

Získat plugin pro převod obrázku tabulky na text.

Získejte příslušné soubory sestavení z verzí nebo stáhněte balíček z NuGet, abyste přidali OCRize přímo do svého pracovního prostoru.

Kompatibilní s Microsoft Windows nebo kompatibilním operačním systémem s .NET Standardem 2.0.
Vyžaduje vývojové prostředí jako Microsoft Visual Studio.

Často kladené dotazy

Je specifikace jazyka nezbytná?

Ve výchozím nastavení může OCRize automaticky rozpoznávat širokou škálu jazyků založených na rozšířené latinské abecedě. Specifikování konkrétního jazyka však může výrazně zlepšit přesnost rozpoznávání. Výslovně specifikujte jazyk při rozpoznávání cyrilice, čínských a hindských textů.

Které formáty souborů jsou podporovány?

OCRize podporuje populární formáty ze skenerů nebo fotoaparátů, včetně PDF, JPEG, PNG a TIFF. Výsledky rozpoznávání jsou vraceny v prostém textu, HTML, Microsoft Word, PDF, JSON a XML.

Jak dosáhnout nejlepšího výsledku?

Kvalita obrazu je klíčová pro přesný OCR. Použijte skener nebo fotoaparát s vysokým rozlišením. Knihovna obsahuje pokročilé filtry pro automatické zlepšení kvality obrazu před rozpoznáním.