Scal PDF do TEXT przez Python

Scalanie dokumentów PDF w pojedyncze formaty TEXT. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki

C# Java C++ Python

Aspose.PDF
for Python for .NET

Pobierz

Uczyć się

Kupić

Scalanie PDF z TEXT za pomocą Python

Jak scalić PDF do TEXT? Dzięki bibliotece Aspose.PDF for Python via .NET można scalić PDF do TEXT programowo. Oprogramowanie PDF firmy Apose jest idealne dla osób fizycznych, małych lub dużych firm. Ponieważ jest w stanie przetwarzać dużą ilość informacji, szybko i skutecznie wykonaj konkatenację oraz chroń swoje dane. Osobliwą cechą Aspose.PDF jest API do łączenia PDF z TEXT. Cechą tego podejścia jest to, że wystarczy otworzyć menedżera pakietów NuGet, wyszukać „Aspose.pdf dla .NET” i zainstalować go bez żadnych specjalnych złożonych ustawień. (Użyj polecenia z konsoli Package Manager Console do instalacji). Sprawdź szczegóły instalacji biblioteki na stronach Dokumentacja. Aby zweryfikować zalety biblioteki, spróbuj użyć fragmentu kodu PDF do TEXT.

Console

pip install aspose-pdf

Jak scalić PDF z TEXT używając Python

Python for .NET programiści mogą łatwo ładować i scalać pliki PDF z TEXT w zaledwie kilku wierszach kodu.

Przeczytaj dwa pliki PDF
Tworzenie absorbera tekstu
Wyodrębnianie tekstu z plików PDF poprzez zastosowanie TextAbsorber do obu plików PDF
Przechowywanie wyodrębnienia
Zapisywanie wyodrębnionego tekstu do pliku

Oto przykład, który pokazuje, jak scalić PDF do TEXT w Python. Łatwe łączenie wielu dokumentów w jeden plik. Jeśli tworzysz kod w Python, to zadanie może być prostsze niż się wydaje. Możesz używać w pełni kwalifikowanych nazw plików zarówno do odczytu PDF, jak i zapisu TEXT. Sprawdź ten przykład Python, który pokazuje, jak scalić wiele dokumentów tego samego lub różnych typów plików w jeden plik za pomocą Python

Scal pliki PDF za pomocą Python i zapisz jako TEXT

Przykład Python: ten przykładowy kod pokazuje konkatenację PDF do TEXT

Input file:

Upload a file

File not added

Upload a file

File not added

Output format:

TEXT

Output file:

import aspose.pdf as apdf

from os import path

path_infiles = [path.join(self.data_dir, infile) for infile in infiles]
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document.merge_documents(files=path_infiles)
device = apdf.devices.TextDevice()
count = 1
for page in document.pages:
    device.process(page, path_outfile.replace(".txt", str(count) + ".txt"))
    count += 1

Interfejs API dla Python do połączenia PDF z TEXT

Aspose.PDF dla Pythona poprzez API .NET obsługuje większość ustalonych standardów PDF i specyfikacji PDF. Umożliwia programistom wstawianie tabel, wykresów, obrazów, hiperłączy, niestandardowych czcionek - i nie tylko - do dokumentów PDF. Ponadto możliwe jest również kompresowanie dokumentów PDF. Aspose.PDF dla Pythona poprzez .NET zapewnia doskonałe funkcje bezpieczeństwa do tworzenia bezpiecznych dokumentów PDF. Niektóre z kluczowych funkcji Aspose.PDF dla Pythona za pośrednictwem interfejsu API .NET obejmują:

Możliwość odczytu i eksportu plików PDF w wielu formatach obrazu, w tym BMP, GIF, JPEG i PNG.
Ustaw podstawowe informacje (np. autor, twórca) dokumentu PDF.
Funkcje konwersji: Konwertuj PDF na Word, Excel i PowerPoint. Konwertuj PDF na formaty obrazów. Konwertuj plik PDF na format HTML i odwrotnie. Konwertuj PDF na EPUB, tekst, XPS itp.

Więcej informacji na temat Aspose.PDF dla Pythona można znaleźć za pośrednictwem interfejsu API .NET w naszej dokumentacji na temat korzystania z API.