HTML JPG OCR XML BMP
Aspose.OCR  .NET için
Searchable PDF

C# içinde PDF öğesini Searchable PDF biçimine dönüştürün

PDF belgesi üzerinde optik karakter tanıma gerçekleştirin ve Aspose.OCR’yi .NET kitaplığı için PDF belgesi olarak kaydedin.

C# kullanılarak PDF Searchable PDF biçimine nasıl dönüştürülür

Aspose.OCR for .NET, PDF görüntüleri Searchable PDF belgelerine dönüştürmek için güçlü ancak kullanımı kolay ve uygun maliyetli bir kitaplıktır. Latince, Kiril ve Çince’ye dayalı 26 dili destekleyen son teknoloji optik karakter tanıma motoru, sizi formüllerden, sinir ağlarından ve diğer karmaşık teknik ayrıntılardan izole ederken üstün tanıma hızı ve doğruluğu sağlar. 10 satırdan daha kısa bir sürede .NET uygulamalarınıza OCR işlevi eklemenize olanak tanır.

.NET için Aspose.OCR

taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR dosyasını yüklemeniz yeterlidir.

NuGet

projenizde aşağıdaki komutla paketleyin:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

PDF'i Searchable PDF'e Dönüştürme Adımları

.NET OCR ve yalnızca birkaç satır kod ile, bir PDF görüntüsünü Searchable PDF belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:

  • AsposeOcr sınıfının bir örneğini oluşturun
  • AsposeOCR.RecognizeImage yöntemini çağırın
  • PDF dosya yolunu parametre olarak iletin
  • AsposeOCR.RecognizeImage, Searchable PDF türünde bir String veya dosya döndürür

sistem gereksinimleri

Örneği çalıştırmadan önce, sisteminizde NET Standard 2.0 spesifikasyonu ile uyumlu .NET API’nin ve tüm [harici bağımlılıkların] kurulu olduğundan emin olun( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR paketinin bağımlılıkları) projenizde referans alınır.

  • NET Standard 2.0+ uyumlu çözüm
  • Projenizde referans verilen Aspose.OCR for .NET.

Bu örnek kod, PDF - Searchable PDF .NET Dönüşümünü gösterir


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
  • PDF Nedir PDF Dosya formatı

    Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.

    Devamını oku

    Searchable PDF Nedir Searchable PDF Dosya formatı

    Aranabilir PDF dosyaları, orijinal taranmış görüntüyü ve ayrıca bir belge içinde tam metin aramaları veya kopyalama ve yapıştırma işlemleri için metni vurgulama için kullanılabilen gizli bir katmandaki OCR metnini korur. Orijinal görüntüyü içermeyen PDF'ye tam OCR dönüştürme, özellikle belgede çok sayıda görüntü veya karmaşık bir düzen varsa, orijinal biçimlendirmenin %100'ünü asla korumaz.

    Devamını oku

    Desteklenen Diğer Dönüşümler

    C# kullanarak, dahil olmak üzere farklı formatları kolayca dönüştürebilirsiniz.

    TXT (Metin Belgesi Dosyası)
    Text (Metin Belgesi Dosyası)
    DOC (Microsoft Word tarafından oluşturulan belgeler)
    DOCX (Microsoft Word belgeleri)
    XLS (Microsoft Excel İkili Dosya Biçimi)
    XLSX (Microsoft Excel belgeleri)
    PDF (Taşınabilir Belge Formatı (PDF))
    Searchable PDF (Aranabilir Taşınabilir Ağ Grafikleri)
    XML (Genişletilebilir İşaretleme Dili)
    JSON (JavaScript Nesnesi Gösterimi)