Python üzerinden MHT dosyasını TXT öğesine dönüştürün

MHT - TXT Python dönüşümü. Programcılar bu örnek kodu, COM Interop aracılığıyla herhangi bir.NET Framework, .NET Core ve PHP, VBScript, C++ içinde TXT öğesine TXT aktarmak için bu örnek kodu kullanabilirler.

MHT dosyasını Python via .NET içinde TXT öğesine dönüştürün

MHT’ı TXT’a nasıl dönüştürebilirim? Modern bir belge işleme Python API’si ile bir belgeyi MHT’tan TXT biçimine programatik olarak kolayca dönüştürebilirsiniz. Dosyaları yüksek kalitede dönüştürmek için sadece birkaç satır kod kullanın. Aspose.PDF kütüphanesi, herhangi bir geliştiricinin Python kullanarak MHT’ı TXT’a dönüştürme görevlerini kolayca çözmesini sağlayacaktır.

Kod parçacığının ve diğer olası dönüştürme biçimlerinin daha ayrıntılı bir açıklaması için Dokümantasyon sayfalarına bakın. Ayrıca, kütüphanemiz tarafından desteklenen diğer dönüşümleri de kontrol edebilirsiniz.

Aspose.PDF for Python via .NET kütüphanesi ile MHT’ı TXT’a programatik olarak dönüştürebilirsiniz. Aspose’un PDF yazılımı bireyler, küçük veya büyük işletmeler için idealdir. Büyük miktarda bilgiyi işleyebildiği, dönüştürmeyi hızlı ve verimli bir şekilde gerçekleştirebildiği ve verilerinizi koruyabildiği için. Aspose.PDF’in kendine özgü bir özelliği, MHT’ı TXT’a dönüştürmek için bir API’dir. Bu yaklaşımın özelliği, yalnızca PyPI paket yöneticisini açmanız, aspose-pdf‘i aramanız ve herhangi bir özel karmaşık ayar yapmadan yüklemeniz gerektiğidir. Kütüphanenin faydalarını doğrulamak için MHT’ı TXT’a dönüştürme kod parçacığını kullanmayı deneyin. Konsoldan veya terminalden aşağıdaki komutu da kullanabilirsiniz:

Console

pip install aspose-pdf

MHT TXT öğesine dönüştürme


Python via .NET geliştiricileri MHT dosyalarını sadece birkaç satır kod içinde TXT dosyalarına kolayca yükleyebilir ve dönüştürebilir.

  1. DosyaIO, yol sınıfları da dahil olmak üzere gerekli modülleri aspose.pdf kütüphanesinden içe aktarın. Bu kütüphaneler PDF dosyalarıyla etkileşimde bulunmak ve bunları diğer formatlara kaydetmek için kullanılır.
  2. Girdi PDF dosyasına giden yolu, indir dosyasıyla birleştirerek, doğru dizin yapısını sağlayarak belirtin.
  3. Belge kaydetmek için çıktı biçimini belirtmek için bir MhtLoadOptions sınıfı örneği oluşturun. Bu seçenekler dönüştürülen MHT dosyasının özelliklerini kontrol eder.
  4. Girdi PDF dosyasını apdf.Document() kullanarak bir Belge nesnesine yükleyin. Yüklenen belge diğer formatlara işleme ve kaydetme için kullanılacaktır.
  5. Yüklenen PDF belgesindeki sayfa sayısını yazdırın. Bu bilgi, yüklenen belgenin doğruluğunu doğrulamak için kullanışlıdır.
  6. Metin çıkarma için PDF belgesini işlemek için TextDevice sınıfının bir örneğini oluşturun. Bu cihazlar, metin veya resim gibi PDF dosyalarından belirli verileri ayıklamak için kullanılır.
  7. Metin çıkarma için yüklenen PDF belgesinin ilk sayfasını işlemek için TextDevice örneğini kullanın. Çıkarılan metin path_outfile’daki belirtilen çıktı dosyasına kaydedilir.
  8. Belgeyi TIFF biçiminde kaydettikten sonra dönüştürme işleminin tamamlandığını belirten bir başarı mesajı yazdırın. Bu adım, dönüştürme işleminin başarılı olduğunu ve çıktı dosyasının belirtilen yolda bulunabileceğini doğrular.

Python içinde MHT TXT öğesine nasıl dönüştürüleceğini gösteren bir örnek aşağıda verilmiştir. MHT dosyanızı TXT formatına dönüştürmek için bu kolay adımları takip edebilirsiniz. Önce MHT dosyanızı yükleyin ve ardından bir TXT dosyası olarak kaydedin. Hem MHT okuma hem de TXT yazma için tam nitelikli dosya adlarını kullanabilirsiniz. Çıktı TXT içeriği ve biçimlendirmesi orijinal MHT belgesiyle aynı olacaktır.

Örnek: MHT'yi Python aracılığıyla TXT'a dönüştürün

Örnek: MHT'yi Python aracılığıyla TXT'a dönüştürün

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Python via .NET kullanarak MHT öğesini TXT öğesine dönüştürün

.NET API aracılığıyla Python için Aspose.PDF, en yerleşik PDF standartlarını ve PDF özelliklerini destekler. Geliştiricilerin PDF belgelerine tablolar, grafikler, resimler, köprüler, özel yazı tipleri ve daha fazlasını eklemelerine olanak tanır. Ayrıca, PDF belgelerini sıkıştırmak da mümkündür. .NET üzerinden Python için Aspose.PDF, güvenli PDF belgeleri geliştirmek için mükemmel güvenlik özellikleri sağlar. .NET API aracılığıyla Python için Aspose.PDF uygulamasının temel özelliklerinden bazıları şunlardır:

  • PDF’yi BMP, GIF, JPEG ve PNG dahil olmak üzere birden fazla görüntü formatında okuma ve dışa aktarma yeteneği.
  • PDF belgesinin temel bilgilerini (örn. yazar, yaratıcı) ayarlayın.
  • Dönüştürme Özellikleri: PDF’yi Word, Excel ve PowerPoint’e Dönüştürün. PDF’yi Resim formatlarına dönüştürün. PDF dosyasını HTML biçimine dönüştürün ve bunun tersi de geçerlidir. PDF’yi EPUB, Metin, XPS vb. dosyalara dönüştürün

Aspose.PDF for Python hakkında .NET API aracılığıyla API’nin nasıl kullanılacağına ilişkin dokümantasyon adresinde daha fazla bilgiyi bulabilirsiniz.