C# içinde PDF öğesini XML biçimine dönüştürün
PDF belgesi üzerinde optik karakter tanıma gerçekleştirin ve Aspose.OCR’yi .NET kitaplığı için PDF belgesi olarak kaydedin.
C# kullanılarak PDF XML biçimine nasıl dönüştürülür
Aspose.OCR for .NET, PDF görüntüleri XML belgelerine dönüştürmek için güçlü ancak kullanımı kolay ve uygun maliyetli bir kitaplıktır. Latince, Kiril ve Çince’ye dayalı 26 dili destekleyen son teknoloji optik karakter tanıma motoru, sizi formüllerden, sinir ağlarından ve diğer karmaşık teknik ayrıntılardan izole ederken üstün tanıma hızı ve doğruluğu sağlar. 10 satırdan daha kısa bir sürede .NET uygulamalarınıza OCR işlevi eklemenize olanak tanır.
taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR dosyasını yüklemeniz yeterlidir.
projenizde aşağıdaki komutla paketleyin:
Package Manager Console Command
PM> Install-Package Aspose.OCR
PDF'i XML'e Dönüştürme Adımları
.NET OCR ve yalnızca birkaç satır kod ile, bir PDF görüntüsünü XML belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:
- AsposeOcr sınıfının bir örneğini oluşturun
- AsposeOCR.RecognizeImage yöntemini çağırın
- PDF dosya yolunu parametre olarak iletin
- AsposeOCR.RecognizeImage, XML türünde bir String veya dosya döndürür
sistem gereksinimleri
Örneği çalıştırmadan önce, sisteminizde NET Standard 2.0 spesifikasyonu ile uyumlu .NET API’nin ve tüm [harici bağımlılıkların] kurulu olduğundan emin olun( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR paketinin bağımlılıkları) projenizde referans alınır.
- NET Standard 2.0+ uyumlu çözüm
- Projenizde referans verilen Aspose.OCR for .NET.
Bu örnek kod, PDF - XML .NET Dönüşümünü gösterir
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XML", riText);
PDF Nedir PDF Dosya formatı
Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.
Devamını okuXML Nedir XML Dosya formatı
XML, HTML'ye benzer, ancak nesneleri tanımlamak için etiketlerin kullanımında farklı olan Genişletilebilir İşaretleme Dili anlamına gelir. XML dosya formatının yaratılmasının ardındaki tüm fikir, yazılım veya donanım araçlarına bağımlı olmadan verileri depolamak ve taşımaktı. Popülerliği, hem insan hem de makine tarafından okunabilmesinden kaynaklanmaktadır. Bu, World Wide Web (WWW) gibi ağ üzerinden depolanacak ve paylaşılacak nesneler biçiminde ortak veri protokolleri oluşturmasını sağlar. XML'deki "X" genişletilebilir içindir; bu, dilin kullanıcı gereksinimlerine göre herhangi bir sayıda simgeye genişletilebileceği anlamına gelir. Microsoft Open XML, LibreOffice OpenDocument, XHTML ve SVG gibi birçok standart dosya formatı bu özelliklerden yararlanır.
Devamını okuDesteklenen Diğer Dönüşümler
C# kullanarak, dahil olmak üzere farklı formatları kolayca dönüştürebilirsiniz.