Chuyển đổi PDF sang MARKDOWN qua Java

Trên API Premise Java để kết xuất PDF thành MARKDOWN mà không sử dụng bất kỳ ứng dụng bên thứ ba nào

 

Bạn có thể chuyển đổi PDF sang MARKDOWN bằng hai bước đơn giản. Trước tiên, bạn cần kết xuất tệp PDF thành DOC bằng Aspose.PDF for Java . Sau đó, bằng cách sử dụng API xử lý tài liệu mạnh mẽ Aspose.Words for Java , bạn có thể chuyển đổi DOC thành MARKDOWN. Cả hai API đều nằm trong gói Aspose.Total for Java .

Java API để chuyển đổi PDF sang MARKDOWN

  1. Mở tệp PDF bằng lớp Document
  2. Chuyển đổi PDF sang DOC bằng cách sử dụng save phương pháp
  3. Tải tệp DOC bằng cách sử dụng lớp Document của Aspose.Words
  4. Lưu tài liệu ở định dạng MARKDOWN bằng phương pháp save và đặt MARKDOWN dưới dạng SaveFormat

Yêu cầu chuyển đổi

Bạn có thể dễ dàng sử dụng Aspose.Total for Java trực tiếp từ dự án dựa trên Maven và bao gồm Aspose.PDF for JavaAspose.Words for Java trong pom.xml của bạn.

Ngoài ra, bạn có thể tải tệp ZIP từ tải xuống .

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.MARKDOWN
outputDocument.save("output.markdown", SaveFormat.MARKDOWN);   

Yêu cầu chuyển đổi

Trong khi chuyển đổi PDF thành MARKDOWN, ngay cả khi tài liệu của bạn được bảo vệ bằng mật khẩu, bạn vẫn có thể mở nó bằng API thao tác PDF Aspose.PDF for Java . Để mở tệp được mã hóa, bạn cần tạo đối tượng Document và mở PDF bằng mật khẩu của chủ sở hữu.

// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Mở tài liệu PDF được bảo vệ bằng mật khẩu qua Java

Trong khi lưu tài liệu đầu vào của bạn ở định dạng tệp MARKDOWN, bạn cũng có thể lưu tài liệu của mình vào cơ sở dữ liệu thay vì hệ thống tệp. Bạn có thể cần triển khai việc lưu trữ và truy xuất các đối tượng Tài liệu đến và từ cơ sở dữ liệu. Điều này sẽ cần thiết nếu bạn đang triển khai bất kỳ loại hệ thống quản lý nội dung nào. Để lưu MARKDOWN của bạn vào cơ sở dữ liệu, thông thường cần phải tuần tự hóa tài liệu để có được một mảng byte. Điều này có thể được thực hiện bằng cách sử dụng API Aspose.Words for Java . Sau khi nhận được mảng byte của bạn, bạn có thể lưu trữ nó trong cơ sở dữ liệu bằng cách sử dụng câu lệnh SQL.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.MARKDOWN);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Khám phá PDF Chuyển Đổi Tùy Chọn với Java

Chuyển đổi PDF S đến DOCM (Tệp Marco Microsoft Word 2007)
Chuyển đổi PDF S đến DOT (Tệp mẫu Microsoft Word)
Chuyển đổi PDF S đến DOTM (Tệp mẫu Microsoft Word 2007+)
Chuyển đổi PDF S đến DOTX (Tệp mẫu Microsoft Word)
Chuyển đổi PDF S đến FLATOPC (Microsoft Word 2003 Xử lý văn bảnML)
Chuyển đổi PDF S đến GIF (Định dạng trao đổi đồ họa)
Chuyển đổi PDF S đến ODT (Định dạng tệp văn bản OpenDocument)
Chuyển đổi PDF S đến PCL (Ngôn ngữ lệnh máy in)
Chuyển đổi PDF S đến RTF (Định dạng văn bản phong phú)
Chuyển đổi PDF S đến WORDML (Microsoft Word 2003 Xử lý văn bảnML)
Chuyển đổi PDF S đến XAMLFLOW (Power Automate của Microsoft)
Chuyển đổi PDF S đến APNG (Đồ họa mạng di động hoạt hình)
Chuyển đổi PDF S đến DICOM (Hình ảnh kỹ thuật số và truyền thông trong y học)
Chuyển đổi PDF S đến DXF (Định dạng trao đổi bản vẽ Autodesk)
Chuyển đổi PDF S đến EMZ (Siêu tệp nâng cao được nén của Windows)
Chuyển đổi PDF S đến JPEG2000 (Định dạng hình ảnh J2K)
Chuyển đổi PDF S đến ODP (Định dạng trình bày OpenDocument)
Chuyển đổi PDF S đến OTP (Định dạng chuẩn OpenDocument)
Chuyển đổi PDF S đến POT (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi PDF S đến POTM (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi PDF S đến POTX (Bản trình bày mẫu Microsoft PowerPoint)
Chuyển đổi PDF S đến PPS (Trình chiếu PowerPoint)
Chuyển đổi PDF S đến PPSM (Trình chiếu kích hoạt macro)
Chuyển đổi PDF S đến PPSX (Trình chiếu PowerPoint)
Chuyển đổi PDF S đến PPT (Thuyết trình Powerpoint)
Chuyển đổi PDF S đến PPTM (Tệp trình bày hỗ trợ macro)
Chuyển đổi PDF S đến PSD (tài liệu photoshop)
Chuyển đổi PDF S đến SVGZ (Đồ họa vector có thể mở rộng được nén)
Chuyển đổi PDF S đến SWF (Phim Flash sóng xung kích)
Chuyển đổi PDF S đến TGA (Bộ điều hợp đồ họa Truevision)
Chuyển đổi PDF S đến WMF (Siêu tệp Windows)
Chuyển đổi PDF S đến WMZ (Siêu tệp Windows được nén)
Chuyển đổi PDF S đến CSV (Giá trị được phân tách bằng dấu phẩy)
Chuyển đổi PDF S đến DIF (Định dạng trao đổi dữ liệu)