Unisci PDF a TEXT tramite Python

Unisci documenti PDF in singoli formati TEXT su.NET usando Python. I programmatori possono utilizzare questo codice di esempio per combinare PDF su .NET Framework, .NET Core e PHP, VBScript, Delphi, C++ tramite COM Interop.

Unisci PDF a TEXT usando Python

Come unire PDF a TEXT? Con la libreria Aspose.PDF per Python tramite .NET è possibile unire PDF a TEXT a livello di programmazione. Il software PDF di Aspose è ideale per privati, piccole o grandi imprese. Poiché è in grado di elaborare una grande quantità di informazioni, esegui la concatenazione in modo rapido ed efficiente e proteggi i tuoi dati. Una caratteristica particolare di Aspose.PDF è un’API per unire PDF a TEXT. La caratteristica di questo approccio è che è sufficiente aprire il gestore di pacchetti NuGet, cercare ‘Aspose.pdf for .NET’ e installarlo senza particolari impostazioni complesse. (Usa il comando dalla console di Package Manager per l’installazione). Controlla i dettagli dell’installazione della libreria nelle pagine Documentazione. Per verificare i vantaggi della libreria, prova a utilizzare il frammento di codice di conversione da PDF a TEXT.

Python Package Manager Console

pip install aspose-pdf

Come unire PDF a TEXT tramite Python


Gli sviluppatori Python for .NET possono facilmente caricare e unire file PDF in TEXT in poche righe di codice.

  1. Leggi due file PDF
  2. Creazione di un assorbitore di testo
  3. Estrazione di testo dai PDF applicando TextAbsorber a entrambi i PDF
  4. Memorizzazione del testo estratto
  5. Scrittura di testo estratto in un file

Ecco un esempio che dimostra come unire PDF a TEXT in Python. Combina più documenti in un unico file con facilità. Se state sviluppando codice in Python, questa operazione può essere più semplice di quanto sembri. È possibile utilizzare nomi di file completi sia per la lettura PDF che per la scrittura di TEXT. Dai un’occhiata a questo esempio Python che mostra come unire più documenti dello stesso tipo o di diversi tipi di file in un unico file utilizzando Python

Unisci file PDF usando Python for .NET e salva come TEXT

Esempio Python: questo codice di esempio mostra la concatenazione da PDF a TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

libreria Python for .NET per combinare PDF a TEXT

Aspose.PDF per Python tramite .NET API supporta gli standard PDF e le specifiche PDF più consolidati. Consente agli sviluppatori di inserire tabelle, grafici, immagini, collegamenti ipertestuali, caratteri personalizzati e altro ancora nei documenti PDF. Inoltre, è anche possibile comprimere documenti PDF. Aspose.PDF per Python via .NET offre eccellenti funzionalità di sicurezza per sviluppare documenti PDF sicuri. Alcune delle funzionalità chiave di Aspose.PDF for Python tramite .NET API includono:

  • Possibilità di leggere ed esportare PDF in più formati di immagine tra cui BMP, GIF, JPEG e PNG.
  • Imposta le informazioni di base (ad esempio autore, creatore) del documento PDF.
  • Funzionalità di conversione: converti PDF in Word, Excel e PowerPoint. Converti PDF in formati di immagini. Converti file PDF in formato HTML e viceversa. Converti PDF in EPUB, Text, XPS, ecc.

Puoi trovare ulteriori informazioni su Aspose.PDF per Python tramite .NET API nella nostra documentazione su come usare l’API.