Converti MHT in TXT tramite Python

Conversione da MHT a TXT Python. I programmatori possono utilizzare questo codice di esempio per esportare MHT in TXT all’interno di qualsiasi .NET Framework, .NET Core e PHP, VBScript, C++ tramite COM Interop.

Converti MHT in TXT in Python via .NET

Come convertire MHT in TXT? È possibile convertire facilmente un documento dal formato MHT al formato TXT tramite codice, utilizzando una moderna API Python per l’elaborazione dei documenti. Bastano poche righe di codice per convertire file di alta qualità. La libreria Aspose.PDF consente a qualsiasi sviluppatore di risolvere facilmente le operazioni di conversione da MHT a TXT utilizzando Python.

Per una descrizione più dettagliata del frammento di codice e di altri possibili formati di conversione, consultare le pagine di Documentazione. È inoltre possibile consultare le altre conversioni dei formati supportati dalla nostra libreria.

Con la libreria Aspose.PDF for Python via .NET è possibile convertire MHT in TXT tramite codice. Il software PDF di Aspose è ideale per privati, piccole e grandi aziende. Essendo in grado di elaborare una grande quantità di informazioni, esegue la conversione in modo rapido ed efficiente, proteggendo i dati. Una caratteristica peculiare di Aspose.PDF è un’API per convertire MHT in TXT. La caratteristica di questo approccio è che è sufficiente aprire il gestore pacchetti PyPI, cercare aspose-pdf e installarlo senza particolari impostazioni complesse. Per verificare i vantaggi della libreria, prova a utilizzare il frammento di codice per la conversione da MHT a TXT. Puoi anche utilizzare il seguente comando dalla console o dal terminale:

Console

pip install aspose-pdf

Come convertire MHT in TXT


Gli sviluppatori di Python via .NET possono facilmente caricare e convertire file MHT in TXT in poche righe di codice.

  1. Importa i moduli richiesti dalla libreria aspese.pdf, incluse le classi di percorso FileIO. Queste librerie sono utilizzate per interagire con i file PDF e salvarli in altri formati.
  2. Specificare il percorso del file PDF di input unendo indir con l’infile, assicurando la corretta struttura della directory.
  3. Crea un’istanza della classe MhtLoadOptions per specificare il formato di output per il salvataggio del documento. Queste opzioni controllano le caratteristiche del file MHT convertito.
  4. Caricare il file PDF di input in un documento utilizzando apdf.DOCument(). Il documento caricato sarà utilizzato per l’elaborazione e il salvataggio in altri formati.
  5. Stampa il numero di pagine nel documento PDF caricato. Queste informazioni sono utili per verificare l’accuratezza del documento caricato.
  6. Crea un’istanza della classe TextDevice per elaborare il documento PDF per l’estrazione del testo. Questi dispositivi sono utilizzati per estrarre dati specifici da file PDF, come testo o immagini.
  7. Utilizzare l’istanza TextDevice per elaborare la prima pagina del documento PDF caricato per l’estrazione del testo. Il testo estratto verrà salvato nel file di output specificato nel file path_out.
  8. Stampa un messaggio di successo che indica che la conversione è completa dopo aver salvato il documento in formato TIFF. Questo passaggio conferma che il processo di conversione è riuscito e il file di output può essere trovato nel percorso specificato.

Ecco un esempio che dimostra come convertire MHT in TXT in Python. Puoi seguire questi semplici passaggi per convertire il tuo file MHT nel formato TXT. Per prima cosa, carica il tuo file MHT e poi salvalo semplicemente come file TXT. Puoi usare nomi di file completi sia per la lettura di MHT che per la scrittura di TXT. Il contenuto e la formattazione dell’output TXT saranno identici al documento originale MHT.

Esempio: convertire MHT in TXT tramite Python

Questo codice di esempio mostra la conversione da MHT a TXT Python

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Converti MHT in TXT usando Python via .NET

Aspose.PDF per Python tramite API.NET supporta gli standard PDF e le specifiche PDF più consolidati. Consente agli sviluppatori di inserire tabelle, grafici, immagini, collegamenti ipertestuali, caratteri personalizzati e altro ancora nei documenti PDF. Inoltre, è anche possibile comprimere documenti PDF. Aspose.PDF per Python tramite .NET offre eccellenti funzionalità di sicurezza per sviluppare documenti PDF sicuri. Alcune delle funzionalità principali di Aspose.PDF per Python tramite API.NET includono:

  • Possibilità di leggere ed esportare PDF in più formati di immagine tra cui BMP, GIF, JPEG e PNG.
  • Imposta le informazioni di base (ad esempio autore, creatore) del documento PDF.
  • Funzionalità di conversione: converti PDF in Word, Excel e PowerPoint. Converti i formati PDF in immagini. Converti file PDF in formato HTML e viceversa. Converti PDF in EPUB, testo, XPS, ecc.

Puoi trovare maggiori informazioni su Aspose.PDF per Python tramite l’API.NET nella nostra documentazione su come usare l’API.