დაყავით HTML ნაწილებად Python ში

დააჩქარეთ Python ბიბლიოთეკა ერთი HTML ფაილის გასაყოფად მცირე ფაილების ჯგუფად მოცემული კრიტერიუმების მიხედვით

გამოიყენეთ Python via .NET ბიბლიოთეკა HTML ფაილების ნაწილებად გასაყოფად. შეგიძლიათ ამოღებული HTML გვერდების ინტეგრირება სხვა მონაცემებთან და, შედეგად, მიიღოთ თქვენთვის საჭირო ფორმისა და შინაარსის დოკუმენტები. HTML ის ნაწილებად დაყოფა აადვილებს თანამშრომლობას HTML ფაილებზე.

კოდის ნაწყვეტის ნახვა

გაყავით HTML Python

ეს პროგრამული ბიბლიოთეკა Python დეველოპერებს აძლევს ფუნქციების ერთობლიობას ფაილების HTML ნაწილებად დაყოფისთვის. HTML ის ცალკეულ ფაილებად დაყოფა შეიძლება გამოყენებულ იქნას დოკუმენტის მონაკვეთებთან პარალელურად მუშაობის გასაადვილებლად. მაგალითად, თუ რამდენიმე ადამიანი ერთდროულად მუშაობს ერთ HTML ზე, მაშინ HTML გაყოფა მათ საშუალებას მისცემს დააჩქარონ მუშაობა. გაყოფა HTML შეიძლება იყოს ტექსტის ამოღების ტექნოლოგიის ნაწილი ფაილებიდან HTML და მონაცემთა ავტომატიზებულ საინფორმაციო სისტემებში ან მონაცემთა ბაზებში ინტეგრაციისთვის.

ჩვენი ბიბლიოთეკა უზრუნველყოფს Python დეველოპერებს ყველა საჭირო ფუნქციით, რათა HTML ნაწილებად და ამოიღონ გვერდები მითითებული რეჟიმის მიხედვით. ეს არის ცალკე Python via .NET გადაწყვეტა, რომელსაც არ სჭირდება Microsoft Word, Acrobat Reader ან სხვა აპლიკაციების დაყენება.

დაყავით ფაილი HTML ნაწილებად კოდით Python

გაყავით HTML კონტენტი სხვადასხვა კრიტერიუმების გამოყენებით Python. შეგიძლიათ გამოიყენოთ გვერდის ამოღების შემდეგი რეჟიმები HTML ფაილებისთვის: 'გაყოფილი სათაურების მიხედვით', 'სექციების მიხედვით', 'გვერდის მიხედვით', 'გვერდების დიაპაზონის მიხედვით'.

თქვენი ფაილის HTML ნაწილებად დაყოფის შემდეგ, შეგიძლიათ შედეგის ექსპორტი ფაილის საჭირო ფორმატში 'Document.Save' მეთოდის გამოყენებით. თქვენ ასევე შეგიძლიათ აკონტროლოთ, თუ როგორ ხდება HTML ნაწილების ექსპორტი HTML ან EPUB ში 'DocumentPartSavingCallback' თვისების გამოყენებით, რაც საშუალებას მოგცემთ გადამისამართოთ გამომავალი ნაკადები.

გაყავით დოკუმენტები HTML მარტივად ჩვენი გადაწყვეტილებით Python via .NET. შემდეგი მაგალითი გვიჩვენებს, თუ როგორ უნდა გაიყოს HTML გამოყენებით Python:

Python კოდის მაგალითი HTML ფაილის გასაყოფად
ატვირთეთ ფაილი, რომლის გაყოფაც გსურთ
გაუშვით კოდი
აირჩიეთ სამიზნე ფორმატი სიიდან
pip install aspose-words
კოპირება
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
გაუშვით კოდი

როგორ გავყოთ HTML Python ად

  1. დააინსტალირეთ Python ბიბლიოთეკა HTML ფაილების პროგრამულად გასაყოფად.
  2. დაამატეთ ბიბლიოთეკის მითითება (ბიბლიოთეკის იმპორტი) თქვენს Python პროექტს.
  3. გახსენით HTML Python ში.
  4. გამოიძახეთ extract_pages() მეთოდი კონკრეტული გვერდების ამოსაღებად HTML დან.
  5. მიიღეთ HTML გაყოფის შედეგი ცალკე ფაილებად.

Python ბიბლიოთეკა HTML დოკუმენტის გასაყოფად

ჩვენ ვმასპინძლებთ ჩვენს Python პაკეტებს PyPi საცავებში. გთხოვთ, მიჰყვეთ ნაბიჯ-ნაბიჯ ინსტრუქციებს, თუ როგორ დააინსტალიროთ "Aspose.Words for Python via .NET" საშუალებით თქვენს დეველოპერის გარემოში.

სისტემის მოთხოვნები

ეს პაკეტი თავსებადია Python ≥3.5 თან და <3.12. თუ თქვენ განავითარებთ პროგრამულ უზრუნველყოფას Linux-ისთვის, გთხოვთ, გადახედოთ gcc და libpython ის დამატებით მოთხოვნებს პროდუქტის დოკუმენტაციაში.

სხვა მხარდაჭერილი HTML გაყოფის ოპერაციები

თქვენ ასევე შეგიძლიათ დაყოთ HTML ფაილის სხვა ფორმატებზე:

5%

გამოიწერეთ Aspose პროდუქტის განახლებები

მიიღეთ ყოველთვიური გაზეთები და შეთავაზებები პირდაპირ თქვენს საფოსტო ყუთში.