Scal PDF do TEXT przez Python

Scal dokumenty PDF w pojedyncze formaty TEXT na .NET za pomocą Pythona. Programiści mogą użyć tego przykładowego kodu do łączenia PDF na .NET Framework, .NET Core i PHP, VBScript, Delphi, C++ za pośrednictwem COM Interop.

Scal PDF do TEXT przez Python

Jak scalić PDF do TEXT? Dzięki bibliotece Aspose.PDF for Python via .NET można scalić PDF do TEXT programowo. Oprogramowanie PDF firmy Apose jest idealne dla osób fizycznych, małych lub dużych firm. Ponieważ jest w stanie przetwarzać dużą ilość informacji, szybko i skutecznie wykonaj konkatenację oraz chroń swoje dane. Osobliwą cechą Aspose.PDF jest API do łączenia PDF z TEXT. Cechą tego podejścia jest to, że wystarczy otworzyć menedżera pakietów NuGet, wyszukać „Aspose.pdf dla .NET” i zainstalować go bez żadnych specjalnych złożonych ustawień. (Użyj polecenia z konsoli Package Manager Console do instalacji). Sprawdź szczegóły instalacji biblioteki na stronach Dokumentacja. Aby zweryfikować zalety biblioteki, spróbuj użyć fragmentu kodu PDF do TEXT.

Python Package Manager Console

pip install aspose-pdf

Jak scalić PDF z TEXT używając Python


Python for .NET programiści mogą łatwo ładować i scalać pliki PDF z TEXT w zaledwie kilku wierszach kodu.

  1. Przeczytaj dwa pliki PDF
  2. Tworzenie absorbera tekstu
  3. Wyodrębnianie tekstu z plików PDF poprzez zastosowanie TextAbsorber do obu plików PDF
  4. Przechowywanie wyodrębnienia
  5. Zapisywanie wyodrębnionego tekstu do pliku

Oto przykład, który pokazuje, jak scalić PDF do TEXT w Python. Łatwe łączenie wielu dokumentów w jeden plik. Jeśli tworzysz kod w Python, to zadanie może być prostsze niż się wydaje. Możesz używać w pełni kwalifikowanych nazw plików zarówno do odczytu PDF, jak i zapisu TEXT. Sprawdź ten przykład Python, który pokazuje, jak scalić wiele dokumentów tego samego lub różnych typów plików w jeden plik za pomocą Python

Scal pliki PDF za pomocą Python for .NET i zapisz jako TEXT

Przykład Python: ten przykładowy kod pokazuje konkatenację PDF do TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

Python for .NET biblioteka do łączenia PDF z TEXT

Aspose.PDF dla Pythona poprzez API .NET obsługuje większość ustalonych standardów PDF i specyfikacji PDF. Umożliwia programistom wstawianie tabel, wykresów, obrazów, hiperłączy, niestandardowych czcionek - i nie tylko - do dokumentów PDF. Ponadto możliwe jest również kompresowanie dokumentów PDF. Aspose.PDF dla Pythona poprzez .NET zapewnia doskonałe funkcje bezpieczeństwa do tworzenia bezpiecznych dokumentów PDF. Niektóre z kluczowych funkcji Aspose.PDF dla Pythona za pośrednictwem interfejsu API .NET obejmują:

  • Możliwość odczytu i eksportu plików PDF w wielu formatach obrazu, w tym BMP, GIF, JPEG i PNG.
  • Ustaw podstawowe informacje (np. autor, twórca) dokumentu PDF.
  • Funkcje konwersji: Konwertuj PDF na Word, Excel i PowerPoint. Konwertuj PDF na formaty obrazów. Konwertuj plik PDF na format HTML i odwrotnie. Konwertuj PDF na EPUB, tekst, XPS itp.

Więcej informacji na temat Aspose.PDF dla Pythona można znaleźć za pośrednictwem interfejsu API .NET w naszej dokumentacji na temat korzystania z API.