Aspose.HTML for Java เป็น API การจัดการ HTML ขั้นสูงเพื่อจัดการและสร้าง HTML ภายในแอปพลิเคชัน Java API อนุญาตให้เพิ่ม ลบ แทนที่โหนด แยก CSS และนำทางผ่านเอกสารได้หลายวิธี นอกจากนี้ API ยังให้ความสามารถในการโหลด EPUB และ MHTML ตลอดจนเสนอสคริปต์ที่อนุญาตให้จัดการ DOM ผ่าน JavaScript
Aspose.HTML for Java รองรับการแปลงรูปแบบระหว่างไฟล์เพื่อโหลดเอกสาร HTML และบันทึกเอาต์พุตเป็น XPS, PDF และภาพแรสเตอร์ รวมถึง JPEG, PNG, BMP และอื่นๆ รวมทั้งมีการเข้ารหัสสำหรับไฟล์ PDF

คุณสมบัติ Java HTML Processing API ขั้นสูง

 

คุณสมบัติ API ในเอกสารประกอบ

คุณสามารถดูรายการคุณลักษณะ Aspose.HTML ทั้งหมดได้ในเอกสารประกอบของเรา การใช้ Aspose.HTML สำหรับไลบรารี Java ในโปรเจ็กต์ของคุณทำให้คุณสามารถทำงานต่อไปนี้ได้:

  • การสร้างหรือเปิดเอกสาร HTML ที่มีอยู่จากแหล่งต่างๆ
  • การจัดการ HTML: การสร้าง แก้ไข ลบ และแทนที่โหนด HTML ผ่าน API
  • การบันทึกเอกสาร HTML
  • แยกรูปแบบ CSS สำหรับโหนด HTML เฉพาะ
  • การกำหนดค่าแซนด์บ็อกซ์เอกสารที่ส่งผลต่อการประมวลผลเอกสาร HTML
  • การนำทางผ่านเอกสาร HTML ด้วยวิธีต่างๆ
  • การแปลงเอกสาร HTML เป็นรูปแบบต่างๆ ที่รองรับ: JPEG, PNG, BMP, TIFF, PDF, XPS และอื่นๆ

แปลง HTML เป็นรูปแบบ PDF และ XPS

API รองรับการแสดงผล HTML เป็นภาพแรสเตอร์ที่ใช้บ่อยที่สุด รวมถึงรูปแบบ BMP, TIFF, JPEG, & PNG, PDF และ XPS นักพัฒนาสามารถปรับแต่งโดยการกำหนดค่าลักษณะ PageSetup สำหรับรูปแบบเลย์เอาต์คงที่ที่เป็นผลลัพธ์ รวมถึงหมายเลขหน้าที่จะแสดง ขนาดหน้าผลลัพธ์ หรือการตั้งค่าการบีบอัด JPEG สำหรับภาพที่ฝัง

แสดงผล HTML เป็นรูปแบบเค้าโครงคงที่ – Java


// Load HTML document from file
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();

renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);

การแปลงเป็นภาพแรสเตอร์

Aspose.HTML for Java มีเอ็นจิ้นการเรนเดอร์ที่มีความเที่ยงตรงสูงที่แกนหลัก ซึ่งสามารถแปลงหน้า HTML เป็นรูปแบบภาพแรสเตอร์ที่ใช้กันมากที่สุด รวมถึง TIFF, BMP, PNG และ JPEG โดยไม่ต้องใช้ซอฟต์แวร์หรือเครื่องมือเพิ่มเติมใดๆ

แปลง HTML เป็น PNG โดยใช้ Aspose.HTML for Java


// Initialize an HTML document from a file
HTMLDocument document = new HTMLDocument("document.html");

// Initialize ImageSaveOptions
ImageSaveOptions options = new ImageSaveOptions(ImageFormat.Png);

// Convert HTML to PNG
Converter.convertHTML(document, options, "document-output.png");

คุณสามารถลองออนไลน์ HTML Converter

คุณยังสามารถแปลง HTML, XHTML, MHTML, Markdown, EPUB หรือ SVG เป็นรูปแบบไฟล์อื่นๆ ได้อีกมากมาย รวมถึงบางรายการด้านล่าง:


จัดการไฟล์ EPUB และ MHTML

ไลบรารีสามารถโหลดไฟล์ EPUB และ MHTML เพื่อดำเนินการต่างๆ รวมถึงการแปลงเป็นรูปแบบเค้าโครงคงที่และรูปแบบภาพแรสเตอร์

แปลง MHTML เป็น PDF โดยใช้ Aspose.HTML for Java


// Open an existing MHTML file for reading
java.io.FileInputStream fileInputStream = new java.io.FileInputStream("sample.mht");

// Create an instance of the PdfSaveOptions class
PdfSaveOptions options = new PdfSaveOptions();

// Call the convertMHTML() method to convert MHTML to PDF
Converter.convertMHTML(fileInputStream, options, "sample-output.pdf");

การนำทางโหนด HTML

API รองรับการนำทางผ่านไฟล์ HTML ด้วย XPath, Elements หรือ CSS Selector Query และสามารถแทรก แยก ลบ หรือแทนที่โหนดได้อย่างง่ายดาย

แยกโหนดทั้งหมดของสมอประเภท – Java


// Instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

// Get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

// Display anchor text & href values for all nodes
for (Node node : nodelist){

    HTMLAnchorElement anchor = (HTMLAnchorElement)node;
    System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}

กำหนดค่าแซนด์บ็อกซ์

HTML API ช่วยให้คุณสามารถกำหนดค่าแซนด์บ็อกซ์เอกสารที่ส่งผลต่อการประมวลผลเอกสาร HTML นั่นคือ รูปแบบ CSS ในบางกรณีขึ้นอยู่กับขนาดหน้าจอ

ปิดใช้งานสคริปต์สำหรับการแปลง HTML เป็น PDF โดยใช้ Java


// Prepare HTML code and save it to a file
String code = "Hello, World!!\n" +
        "\n";

try (java.io.FileWriter fileWriter = new java.io.FileWriter("sandboxing.html")) {
    fileWriter.write(code);
}

// Create an instance of the Configuration class
Configuration configuration = new Configuration();

// Mark 'scripts' as an untrusted resource
configuration.setSecurity(com.aspose.html.Sandbox.Scripts);

// Initialize an HTML document with specified configuration
HTMLDocument document = new HTMLDocument("sandboxing.html", configuration);

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "sandboxing_out.pdf");

FAQ

1. Aspose.HTML for Java คืออะไร?

Aspose.HTML for Java เป็นไลบรารีคลาสที่ช่วยให้นักพัฒนาสามารถจัดการและแปลงเอกสาร HTML ภายในแอปพลิเคชัน Java ได้โดยไม่ต้องใช้เครื่องมือหรือซอฟต์แวร์ภายนอก

2. Aspose.HTML for Java แก้ปัญหาอะไรในระดับ API?

Aspose.HTML for Java ให้เอ็นจินการประมวลผล HTML แบบโปรแกรมได้ ซึ่งช่วยให้คุณสามารถโหลด วิเคราะห์ แก้ไข แสดงผล และแปลงเอกสาร HTML ได้โดยไม่ต้องพึ่ง runtime ของเบราว์เซอร์ คุณสามารถทำงานกับ DOM ที่มีโครงสร้างอย่างชัดเจน ไปป์ไลน์การเรนเดอร์ และเลเยอร์การแปลงผ่าน Java API ทำให้พฤติกรรมมีความแน่นอนและเหมาะสำหรับระบบ backend

3. HTML ถูกพาร์สภายในอย่างไร และเป็นไปตามมาตรฐานสมัยใหม่หรือไม่?

ตัว parser เป็นไปตามข้อกำหนด WHATWG และ W3C ซึ่งหมายความว่าสามารถจัดการมาร์กอัปที่ไม่ถูกต้อง แท็กแบบ implicit และกฎการเข้ารหัสตามมาตรฐานเว็บสมัยใหม่ เอกสารที่ได้จะถูกแสดงเป็น DOM ที่สามารถนำทางได้เต็มรูปแบบ ซึ่งสำคัญสำหรับงานเช่นการแปลง การตรวจสอบ และการเรนเดอร์

4. สามารถดึงข้อมูลแบบมีโครงสร้างจาก HTML ผ่าน API ได้หรือไม่?

ได้ เนื่องจากเอกสารถูกแทนด้วย DOM แบบเต็ม คุณสามารถใช้ selector หรือ API สำหรับ traversal เพื่อดึงข้อมูลเฉพาะ เช่น องค์ประกอบ แอตทริบิวต์ หรือโหนดข้อความ สิ่งนี้มีประโยชน์มากเมื่อ HTML ถูกใช้เป็นคอนเทนเนอร์ของข้อมูล ไม่ใช่เพียงเอกสารสำหรับแสดงผล

5. API สามารถทำงานกับฟอร์แมตอื่นนอกจาก HTML ได้หรือไม่?

ได้ แต่ไม่ใช่ทุกฟอร์แมตจะถูกจัดการในลักษณะเดียวกัน Aspose.HTML for Java สามารถโหลดและประมวลผลฟอร์แมตอย่าง XHTML, MHTML, SVG, EPUB และ Markdown ได้ แต่ไม่ได้ถูกมองว่าเป็นเอกสาร HTML ที่เท่าเทียมกันทั้งหมด บางฟอร์แมตต้องใช้วิธีโหลดเฉพาะ หรือรองรับเพียงบางการทำงาน เช่น การแปลงมากกว่าการแก้ไขเต็มรูปแบบ
ในทางปฏิบัติ HTML ยังคงเป็นฟอร์แมตหลักในการทำงาน ส่วนฟอร์แมตอื่นมักใช้เป็นแหล่งข้อมูลนำเข้า หรือเป็นเป้าหมายของการแปลงภายใน pipeline เดียวกัน




  
  

Aspose.HTML นำเสนอ API การประมวลผล HTML แต่ละรายการสำหรับสภาพแวดล้อมการพัฒนายอดนิยมอื่นๆ ตามรายการด้านล่าง: