แยก HTML ออกเป็นส่วนๆ ใน C++

ไลบรารี C++ ที่รวดเร็วเพื่อแบ่งไฟล์ HTML ไฟล์ออกเป็นกลุ่มของไฟล์ที่เล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี C++ เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ คุณสามารถรวมหน้า HTML ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก HTML ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ HTML ได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยก HTML โดยใช้ C++

ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา C++ เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ การแยกไฟล์ HTML ออกเป็นไฟล์แยกกัน สามารถใช้เพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารแบบคู่ขนานกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนหลายคนกำลังทำงานบน HTML หนึ่งรายการพร้อมกัน การแยก HTML จะช่วยให้พวกเขาทำงานได้เร็วขึ้น การแยก HTML อาจเป็นส่วนหนึ่งของเทคโนโลยีสำหรับการดึงข้อความจากไฟล์ HTML และการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล

ไลบรารีของเรามีฟังก์ชันที่จำเป็นทั้งหมดสำหรับนักพัฒนา C++ เพื่อแยก HTML ออกเป็นส่วนๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน C++ แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ

แยกไฟล์ HTML ออกเป็นส่วนๆ ในโค้ด C++

แยกเนื้อหา HTML โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด C++ คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับไฟล์ HTML: 'แยกตามส่วนหัว', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'

หลังจากแยกไฟล์ HTML ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วน HTML เป็น HTML หรือ EPUB โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสาร HTML อย่างง่ายดายด้วยโซลูชันของเราสำหรับ C++ ตัวอย่างต่อไปนี้แสดงวิธีแยก HTML โดยใช้ C++:

C++ ตัวอย่างโค้ดเพื่อแบ่ง HTML file
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
using namespace Aspose::Words;

auto doc = MakeObject<Document>(u"Input.html");

for (int page = 0; page < doc->get_PageCount(); page++)
{
    auto extractedPage = doc->ExtractPages(page, 1);
    extractedPage->Save(String::Format(u"Output_{0}.html", page + 1));
}
รันโค้ด

วิธีแยก HTML ใน C++

  1. ติดตั้งไลบรารี C++ เพื่อแยกไฟล์ HTML ไฟล์โดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ C++ ของคุณ
  3. เปิด HTML ใน C++
  4. เรียกเมธอด ExtractPages() เพื่อดึงข้อมูลบางหน้าออกจาก HTML
  5. รับผลลัพธ์จากการแยก HTML เป็นไฟล์แยกกัน

C++ ห้องสมุดเพื่อแยก HTML เอกสาร

มีสามตัวเลือกในการติดตั้ง Aspose.Words for C++ ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ โปรดเลือกหนึ่งรายการที่ตรงกับความต้องการของคุณและทำตามคำแนะนำทีละขั้นตอน:

ความต้องการของระบบ

คุณสามารถใช้ไลบรารี C++ นี้เพื่อพัฒนาซอฟต์แวร์บน Microsoft Windows, Linux และ macOS:

  • GCC >= 6.3.0 และ Clang >= 3.9.1 จำเป็นสำหรับ Linux
  • Xcode >= 12.5.1 Clang และ libc++ สำหรับ macOS

หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux หรือ macOS โปรดตรวจสอบข้อมูลเกี่ยวกับการพึ่งพาไลบรารีเพิ่มเติม (แพ็คเกจโอเพ่นซอร์ส fontconfig และ mesa-glu) ในเอกสารประกอบผลิตภัณฑ์

การดำเนินการแยกอื่นๆ ที่รองรับ HTML

คุณยังสามารถแบ่ง HTML เป็นรูปแบบไฟล์อื่นได้:

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ