დოკუმენტების დაყოფა ნაწილებად Python ში

დააჩქარეთ Python ბიბლიოთეკა, რათა დაყოს დოკუმენტი მცირე ფაილების ჯგუფად მოცემული კრიტერიუმების მიხედვით

გამოიყენეთ Python ბიბლიოთეკა დოკუმენტების ნაწილებად დასაყოფად. თქვენ შეგიძლიათ მოპოვებული გვერდების ინტეგრირება სხვა მონაცემებთან და, შედეგად, მიიღოთ თქვენთვის საჭირო ფორმისა და შინაარსის დოკუმენტები. დოკუმენტების ნაწილებად დაყოფა აადვილებს მათზე თანამშრომლობას.

კოდის ნაწყვეტის ნახვა

გაყავით Word, PDF Python გამოყენებით

პროგრამული უზრუნველყოფის ეს ბიბლიოთეკა Python დეველოპერებს აძლევს ფუნქციების კომპლექტს Word, PDF, EPUB, HTML, DOCX დოკუმენტების ნაწილებად დაყოფისთვის. ტექსტის ცალკეულ ფაილებად დაყოფა შეიძლება გამოყენებულ იქნას დოკუმენტების მონაკვეთებთან მუშაობის გასაადვილებლად. დოკუმენტის გაყოფის პროცედურა შეიძლება იყოს მონაცემთა ავტომატიზებულ საინფორმაციო სისტემებში ან მონაცემთა ბაზებში ინტეგრირების ტექნოლოგიის ნაწილი.

ჩვენი ბიბლიოთეკა Python დეველოპერებს სთავაზობს ყველა საჭირო ფუნქციას დოკუმენტებისთვის და დოკუმენტის გვერდების ამოღებისთვის მითითებული რეჟიმის მიხედვით. ეს არის ცალკე Python via .NET გადაწყვეტა, რომელსაც არ სჭირდება Microsoft Word, Acrobat Reader ან სხვა აპლიკაციების დაყენება.

დაყავით დოკუმენტი ნაწილებად Python გამოყენებით

გაყავით დოკუმენტის შინაარსი სხვადასხვა კრიტერიუმების გამოყენებით Python. თქვენ შეგიძლიათ გამოიყენოთ გვერდის ამოღების შემდეგი რეჟიმები: "სათაურების მიხედვით დაყოფა", "სექციების მიხედვით დაყოფა", "გვერდის მიხედვით გაყოფა", "გვერდების დიაპაზონის მიხედვით გაყოფა".

დოკუმენტის გაყოფის შემდეგ, შეგიძლიათ შედეგის ექსპორტი ფაილის საჭირო ფორმატში 'Document.Save' მეთოდის გამოყენებით. თქვენ ასევე შეგიძლიათ აკონტროლოთ დოკუმენტის ნაწილების ექსპორტი HTML ან EPUB ფორმატებში 'DocumentPartSavingCallback' თვისების გამოყენებით, რაც საშუალებას მოგცემთ გადამისამართოთ გამომავალი ნაკადები.

ადვილად გაყავით დოკუმენტები ჩვენი გადაწყვეტით Python via .NET. შემდეგი მაგალითი გვიჩვენებს, თუ როგორ უნდა გაიყოს დოკუმენტი Python:

კოდის მაგალითი Python ში დოკუმენტების ნაწილებად დასაყოფად
ატვირთეთ ფაილი, რომლის გაყოფაც გსურთ
გაუშვით კოდი
აირჩიეთ სამიზნე ფორმატი სიიდან
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
გაუშვით კოდი

როგორ გავყოთ Word, PDF, HTML და სხვა ფაილის ფორმატები Python ში

  1. დააინსტალირეთ Python ბიბლიოთეკა დოკუმენტების პროგრამულად გასაყოფად.
  2. დაამატეთ ბიბლიოთეკის მითითება (ბიბლიოთეკის იმპორტი) თქვენს Python პროექტს.
  3. გახსენით საწყისი დოკუმენტი Python ში.
  4. გამოიძახეთ extract_pages() მეთოდი თქვენი დოკუმენტიდან კონკრეტული გვერდების ამოსაღებად.
  5. მიიღეთ დოკუმენტის გაყოფის შედეგი ცალკე ფაილებად.

Python ბიბლიოთეკა ფაილების გასაყოფად

ჩვენ ვმასპინძლებთ ჩვენს Python პაკეტებს PyPi საცავებში. გთხოვთ, მიჰყვეთ ნაბიჯ-ნაბიჯ ინსტრუქციებს, თუ როგორ დააინსტალიროთ "Aspose.Words for Python via .NET" საშუალებით თქვენს დეველოპერის გარემოში.

სისტემის მოთხოვნები

ეს პაკეტი თავსებადია Python ≥3.5 თან და <3.12. თუ თქვენ განავითარებთ პროგრამულ უზრუნველყოფას Linux-ისთვის, გთხოვთ, გადახედოთ gcc და libpython ის დამატებით მოთხოვნებს პროდუქტის დოკუმენტაციაში.

ყველაზე პოპულარული ფაილის ფორმატები გაყოფისთვის

5%

გამოიწერეთ Aspose პროდუქტის განახლებები

მიიღეთ ყოველთვიური გაზეთები და შეთავაზებები პირდაპირ თქვენს საფოსტო ყუთში.