HTML öğesini Python içinde parçalara ayırın

Bir HTML dosyasını verilen kriterlere göre daha küçük bir dosya grubuna bölmek için hızlı Python kitaplığı

HTML dosyayı parçalara ayırmak için Python via .NET kitaplığını kullanın. Ayıklanan HTML sayfalarını diğer verilerle entegre edebilir ve sonuç olarak ihtiyacınız olan form ve içeriğe ait dokümanları alabilirsiniz. HTML'i parçalara ayırmak, HTML dosya üzerinde ortak çalışmayı kolaylaştırır.

Kod parçacığını görüntüle

HTML'i Python kullanarak bölme

Bu yazılım kitaplığı, Python geliştiricilerine HTML dosyalarını parçalara bölmek için bir dizi işlev sağlar. Bir HTML'i ayrı dosyalara bölmek, bir belgenin bölümleriyle paralel olarak çalışmayı kolaylaştırmak için kullanılabilir. Örneğin, birkaç kişi aynı anda bir HTML üzerinde çalışıyorsa HTML'i bölmek, onların işi hızlandırmasına olanak tanıyacaktır. Bölme HTML, HTML dosyalarından metin çıkarmaya ve verileri otomatik bilgi sistemlerine veya veritabanlarına entegre etmeye yönelik bir teknolojinin parçası olabilir.

Kitaplığımız Python geliştiricilerine HTML'i parçalara bölmek ve sayfaları belirtilen moda göre çıkarmak için gerekli tüm işlevleri sağlar. Bu, Microsoft Word, Acrobat Reader veya diğer uygulamaların kurulu olmasını gerektirmeyen bağımsız bir Python via .NET çözümüdür.

Bir HTML dosyasını Python kodundaki parçalara ayırın

HTML içeriğini Python kodunda farklı ölçütler kullanarak bölün. HTML dosyaları için şu sayfa çıkarma modlarını kullanabilirsiniz: 'başlıklara göre bölünmüş', 'bölümlere bölünmüş', 'sayfa sayfa bölünmüş', 'sayfa aralıklarına göre bölünmüş'.

HTML dosyanızı parçalara ayırdıktan sonra 'Document.Save' yöntemini kullanarak sonucu istediğiniz dosya formatına aktarabilirsiniz. Çıkış akışlarını yeniden yönlendirmenize olanak tanıyan 'DocumentPartSavingCallback' özelliğini kullanarak HTML parçalarının HTML veya EPUB'a nasıl aktarıldığını da kontrol edebilirsiniz.

Python via .NET çözümümüzle belgeleri HTML'i kolayca bölün. Aşağıdaki örnek, Python kullanılarak bir HTML'in nasıl bölüneceğini gösterir:

Bir HTML dosyasını bölmek için Python kod örneği
Bölmek istediğiniz bir dosyayı yükleyin
Kodu çalıştır
Listeden hedef formatı seçin
pip install aspose-words
Kopyala
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Kodu çalıştır

Python içinde HTML nasıl bölünür

  1. HTML dosyayı programlı olarak bölmek için Python kitaplığını yükleyin.
  2. Python projenize bir kitaplık referansı ekleyin (kitaplığı içe aktarın).
  3. Python içinde HTML açın.
  4. HTML öğesinden belirli sayfaları çıkarmak için extract_pages() yöntemini çağırın.
  5. Ayrı dosyalar olarak HTML bölmenin sonucunu alın.

HTML belgeyi bölmek için Python kitaplığı

Python paketlerimizi PyPi depolarında barındırıyoruz. "Aspose.Words for Python via .NET" geliştirici ortamınıza nasıl kuracağınızla ilgili adım adım talimatları izleyin.

sistem gereksinimleri

Bu paket Python ≥3.5 ve <3.12 ile uyumludur. Linux için yazılım geliştiriyorsanız, lütfen Ürün Belgelerinde gcc ve libpython için ek gereksinimlere bakın.

Desteklenen diğer HTML bölme işlemleri

HTML'i diğer dosya biçimlerine de bölebilirsiniz:

5%

Aspose Ürün Güncellemelerine Abone Olun

Doğrudan posta kutunuza teslim edilen aylık bültenleri ve teklifleri alın.

© Aspose Pty Ltd 2001-2024. Her hakkı saklıdır.