OCRize’in .NET OCR eklentisi, taranmış PDF’lerden metin çıkartır veya bunları orijinal görüntüleri koruyarak aranabilir belgelere dönüştürür. Gelişmiş algoritmalar, metin ve tablo yapılarını doğru bir şekilde tanımlar, bu da onu PDF metin çıkarımı için en iyi çözüm haline getirir.
OcrInput
nesnesine yükle.Resmi assembly dosyalarını Releases’tan alın veya OCRize’i doğrudan çalışma alanınıza eklemek için NuGet paketini indirin.'
Varsayılan olarak, OCRize, Genişletilmiş Latin alfabesine dayalı çok çeşitli dilleri otomatik olarak tanıyabilir. Ancak, belirli bir dil sağlamak, tanıma doğruluğunu önemli ölçüde artırabilir. Kiril, Çince ve Hintçe metinleri tanırken dili açıkça belirtin.
OCRize, tarayıcılardan veya kameralarından popüler formatları destekler; PDF, JPEG, PNG ve TIFF dahil. Tanıma sonuçları düz metin, HTML, Microsoft Word, PDF, JSON ve XML formatlarında döndürülmektedir.
İyi görüntü kalitesi, doğru OCR için hayati öneme sahiptir. Bir tarayıcı ya da yüksek çözünürlüklü kamera kullanın. Kütüphane, tanıma öncesinde görüntü kalitesini otomatik olarak iyileştirmek için gelişmiş filtreler içerir.