Chia HTML thành các phần trong C#

Thư viện C# nhanh chóng để chia một HTML tệp thành một nhóm tệp nhỏ hơn theo tiêu chí đã cho

Sử dụng thư viện .NET để chia HTML tệp thành nhiều phần. Bạn có thể tích hợp các trang HTML được trích xuất với dữ liệu khác và kết quả là bạn nhận được các tài liệu có dạng và nội dung mà bạn yêu cầu. Việc chia nhỏ HTML thành các phần giúp cộng tác trên các HTML tệp dễ dàng hơn.

Xem đoạn mã

Split HTML sử dụng C#

Thư viện phần mềm này cung cấp cho các nhà phát triển C# một bộ chức năng để chia HTML tệp thành nhiều phần. Chia HTML thành các tệp riêng biệt có thể được sử dụng để giúp làm việc song song với các phần của tài liệu dễ dàng hơn. Ví dụ: nếu nhiều người đang làm việc trên một HTML cùng một lúc, thì việc tách HTML sẽ cho phép họ tăng tốc công việc. Việc phân tách HTML có thể là một phần của công nghệ trích xuất văn bản từ HTML tệp và tích hợp dữ liệu vào cơ sở dữ liệu hoặc hệ thống thông tin tự động.

Thư viện của chúng tôi cung cấp cho các nhà phát triển C# tất cả các chức năng cần thiết để chia HTML thành các phần và trích xuất các trang theo chế độ được chỉ định. Đây là giải pháp .NET độc lập không cần cài đặt Microsoft Word, Acrobat Reader hoặc các ứng dụng khác.

Tách HTML tệp thành các phần trong mã C#

Nội dung Split HTML sử dụng các tiêu chí khác nhau trong mã C#. Bạn có thể sử dụng các chế độ trích xuất trang sau cho các HTML tệp: 'chia theo tiêu đề', 'chia theo phần', 'chia trang theo trang', 'chia theo phạm vi trang'.

Sau khi chia HTML tệp của bạn thành các phần, bạn có thể xuất kết quả sang định dạng tệp được yêu cầu bằng phương pháp 'Document.Save'. Bạn cũng có thể kiểm soát cách phần HTML được xuất sang HTML hoặc EPUB bằng cách sử dụng thuộc tính 'DocumentPartSavingCallback', điều này sẽ cho phép bạn chuyển hướng các luồng đầu ra.

Tách HTML tài liệu dễ dàng với giải pháp của chúng tôi cho .NET. Ví dụ sau cho thấy cách tách HTML bằng C#:

Ví dụ về mã C# để tách một HTML tệp
Tải lên tệp bạn muốn tách
Mã vận hành
Chọn định dạng mục tiêu từ danh sách
dotnet add package Aspose.Words
Sao chép
using Aspose.Words;

var doc = new Document("Input.html");
           
for (var page = 0; page < doc.PageCount; page++)
{
    var extractedPage = doc.ExtractPages(page, 1);
    extractedPage.Save($"Output_{page + 1}.html");
}
Mã vận hành

Cách tách HTML trong C#

  1. Cài đặt thư viện C# để tách HTML tệp theo chương trình.
  2. Thêm tham chiếu thư viện (nhập thư viện) vào dự án C# của bạn.
  3. Mở HTML trong C#.
  4. Gọi phương thức ExtractPages() để trích xuất các trang cụ thể từ HTML.
  5. Nhận kết quả của việc chia tách HTML thành các tệp riêng biệt.

C# thư viện để chia nhỏ HTML tài liệu

Có ba tùy chọn thay thế để cài đặt "Aspose.Words for .NET" vào hệ thống của bạn. Vui lòng chọn một cái giống với nhu cầu của bạn và làm theo hướng dẫn từng bước:

yêu cầu hệ thống

Sản phẩm của chúng tôi hoàn toàn đa nền tảng và hỗ trợ tất cả các triển khai .NET chính:

  • .NET ≥ 5.0
  • .NET Core ≥ 2.0
  • .NET Standard ≥ 2.0
  • .NET Framework ≥ 3.5
  • MonoMac
  • MonoAndroid
  • Xamarin

Vì mã .NET không phụ thuộc vào phần cứng hoặc hệ điều hành cơ bản mà chỉ phụ thuộc vào Máy ảo, bạn có thể tự do phát triển bất kỳ loại phần mềm nào cho Windows, macOS, Android, iOS và Linux. Chỉ cần đảm bảo rằng bạn đã cài đặt phiên bản tương ứng của .NET Framework, .NET Core, Windows Azure, Mono hoặc Xamarin.

Chúng tôi khuyên bạn nên sử dụng các môi trường phát triển tích hợp Microsoft Visual Studio, Xamarin và MonoDevelop để tạo các ứng dụng C#, F#, VB.NET.

Để biết thêm chi tiết, vui lòng tham khảo Tài liệu sản phẩm.

Các hoạt động tách HTML được hỗ trợ khác

Bạn cũng có thể chia HTML thành các định dạng tệp khác:

5%

Đăng ký cập nhật sản phẩm của Aspose

Nhận bản tin hàng tháng và ưu đãi gửi trực tiếp đến hộp thư của bạn.

© Aspose Pty Ltd 2001-2024. Đã đăng ký Bản quyền.