OCRize’s .NET OCR-plugin extraherar text från skannade eller fotograferade tabeller. Avancerade maskininlärningsalgoritmer och särskilt utbildade neurala nätverk identifierar noggrant strukturen av tabeller, extraherar text från celler och organiserar den i sökbara och redigerbara kalkylblad.
OcrInput
-objektet.Hämta de respektive samlingsfilerna från Utgåvor eller hämta paketet från NuGet för att lägga till OCRize direkt i ditt arbetsutrymme.
Som standard kan OCRize automatiskt känna igen ett brett spektrum av språk baserat på det utvidgade latinska alfabetet. Att ange ett specifikt språk kan dock avsevärt förbättra igenkänningens noggrannhet. Ange uttryckligen språket när du känner igen kyrilliska, kinesiska och hindi-texter.
OCRize stödjer populära format från skannrar eller kameror, inklusive PDF, JPEG, PNG och TIFF. Resultaten från igenkänning returneras i ren text, HTML, Microsoft Word, PDF, JSON och XML.
Bra bildkvalitet är avgörande för korrekt OCR. Använd en skanner eller högupplöst kamera. Biblioteket innehåller avancerade filter för att automatiskt förbättra bildkvaliteten före igenkänning.