OCRize’s .NET OCR-plug-in extraherar text från bilder med stora mängder strukturerad text, såsom skannade kontrakt, avtal, bok sidor, artiklar, tidningar och mer. Gjenkjenningsmotorn bestämmer noggrant dokumentstrukturen, vilket gör att du kan arbeta med komplexa layouter, inklusive flerspaltig text.
OcrInput
-objektet.Hämta de respektive samlingsfilerna från Utgåvor eller hämta paketet från NuGet för att lägga till OCRize direkt i ditt arbetsutrymme.
Som standard kan OCRize automatiskt känna igen ett brett spektrum av språk baserat på det utvidgade latinska alfabetet. Att ange ett specifikt språk kan dock avsevärt förbättra igenkänningens noggrannhet. Ange uttryckligen språket när du känner igen kyrilliska, kinesiska och hindi-texter.
OCRize stödjer populära format från skannrar eller kameror, inklusive PDF, JPEG, PNG och TIFF. Resultaten från igenkänning returneras i ren text, HTML, Microsoft Word, PDF, JSON och XML.
Bra bildkvalitet är avgörande för korrekt OCR. Använd en skanner eller högupplöst kamera. Biblioteket innehåller avancerade filter för att automatiskt förbättra bildkvaliteten före igenkänning.