Python for Java 을 통한 PDF 문서 변환

PDF를 마이크로소프트 오피스® 워드, 엑셀, 파워포인트 프레젠테이션, 이미지, HTML 및 고정 레이아웃 형식으로 내보내기

개요

Python과 Java를 사용하여 PDF 파일을 다른 형식으로 변환하는 방법을 찾고 계십니까?자바를 통한 파이썬용 Aspose.PDF 는 PDF 문서를 변환하기 위한 이상적인 솔루션입니다.Python은 웹 애플리케이션 및 데이터 처리를 위한 소프트웨어 프로토타입을 개발하는 데 일반적으로 사용되는 객체 지향 프로그래밍 언어입니다.이 기사에서는 Java를 통해 Python을 사용하여 PDF를 텍스트로 변환하는 방법을 보여줍니다.PDF 파일에는 텍스트, 이미지, 클릭 가능한 버튼, 하이퍼링크, 포함된 글꼴, 서명 및 스탬프를 비롯한 다양한 콘텐츠가 포함될 수 있습니다.PDF 파일을 다른 형식으로 변환할 때 사용자는 종종 PDF 내용을 편집할 수 있는 기능에 관심을 갖습니다.Java를 통한 Python용 Aspose.PDF 를 사용하면 PDF 문서를 가장 인기 있는 형식으로 또는 그 반대로 쉽고 빠르게 변환할 수 있습니다.저희 라이브러리는 PDF 파일이 성공적이고 정확하게 변환되도록 보장합니다.

PDF를 워드로 변환

예제: PDF를 워드로 변환하기 위한 자바를 이용한 파이썬

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

파이썬 API용 Aspose.PDF API를 사용하면 자바를 통해 PDF 문서를 파이썬에서 DOCX 형식으로 쉽게 읽고 변환할 수 있습니다.DOCX는 Microsoft Word 문서에 널리 사용되는 파일 형식으로, 이전 버전인 DOC에서 사용되는 일반 바이너리 형식과 달리 XML과 바이너리 파일을 결합한 구조를 가지고 있습니다.DOCX 파일은 Word 2007 이상 버전에서 열 수 있지만 DOC 파일 확장명을 지원하는 이전 버전의 MS Word에서는 파일을 열 수 없습니다.이 코드를 사용하면 파이썬 API용 Aspose.PDF 를 사용하여 PDF 문서를 DOCX 형식으로 원활하게 변환할 수 있습니다.

PDF를 엑셀 파일로 변환

PDF를 엑셀 파일로 변환

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

자바를 통한 파이썬용 Aspose.PDF 는 PDF 파일을 엑셀 및 CSV 형식으로 변환하는 기능을 제공합니다.이를 통해 PDF 파일에서 테이블 형식 데이터를 쉽게 추출하여 Excel 또는 CSV 파일을 지원하는 다른 응용 프로그램에서 사용할 수 있습니다.Java를 통한 Python용 Aspose.PDF 는 강력한 PDF 조작 구성 요소로, 이제 PDF 파일을 Excel 워크북 (XLSX 파일) 으로 렌더링하는 기능이 포함되어 있습니다.이 기능을 사용하면 PDF 파일의 각 페이지가 별도의 Excel 워크시트로 변환되므로 Excel에서 데이터를 쉽게 작업하고 분석할 수 있습니다.PDF 파일에서 데이터를 추출하거나 추가 분석을 위해 Excel로 변환해야 하는 경우 Java를 통한 Python용 Aspose.PDF 는 작업을 빠르고 쉽게 완료하는 데 필요한 기능을 제공할 수 있습니다.

PDF를 파워포인트 프레젠테이션으로 변환

예제: 자바를 통한 파이썬 PDF를 파워포인트로 변환

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

자바를 이용한 파이썬용 Aspose.PDF 를 사용하면 PDF를 PPTX로 변환하는 과정을 쉽게 추적할 수 있습니다.이는 변환에 시간이 걸리는 크고 복잡한 PDF 파일을 작업할 때 유용할 수 있습니다.Aspose.PDF 변환 외에도 PPT/PPTX 프레젠테이션을 만들고 조작할 수 있는 기능을 제공하는 Aspose.Slides API도 제공합니다.이 API에는 PPT/PPTX 파일을 PDF 형식으로 변환하는 기능이 포함되어 있습니다.이 변환 과정에서 PDF 파일의 각 페이지가 PPTX 파일의 개별 슬라이드로 변환되므로 프레젠테이션을 쉽게 작업하고 편집할 수 있습니다.PDF 파일을 PPTX로 변환해야 하거나 프레젠테이션을 만들고 조작해야 하는 경우 Java 및 Aspose.Slides API를 통한 Python용 Aspose.PDF API는 워크플로를 간소화하고 작업을 효율적으로 완료하는 데 필요한 기능을 제공할 수 있습니다.

PDF를 HTML 파일로 변환

예제: PDF를 HTML로 변환하기 위한 자바를 이용한 파이썬

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Java를 통한 Python용 Aspose.PDF 는 다양한 파일 형식을 PDF 문서로 변환하고 PDF 파일을 다양한 출력 형식으로 변환하는 강력한 도구입니다.Java를 통한 파이썬용 Aspose.PDF 를 사용하여 PDF 파일을 HTML로 변환하는 방법을 살펴보겠습니다.웹 사이트를 만들거나 온라인 포럼에 콘텐츠를 추가하려는 경우 PDF를 HTML로 변환하는 것이 유용할 수 있습니다.몇 줄의 Python 코드만으로 PDF 문서를 HTML 형식으로 쉽게 변환할 수 있습니다.이 프로세스는 Python을 사용하여 자동화할 수 있으므로 많은 파일을 빠르고 효율적으로 변환할 수 있습니다.단일 PDF 파일을 변환해야 하든 대량의 파일을 변환해야 하든 Java를 통한 Python용 Aspose.PDF 는 워크플로를 간소화하고 작업을 효율적으로 완료하는 데 필요한 기능을 제공할 수 있습니다.

PDF를 이미지로 변환

예제: PDF를 이미지로 변환하기 위한 자바를 이용한 파이썬

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

파이썬용 Aspose.PDF 는 PDF 문서를 이미지로 변환하는 다양한 방법을 제공합니다.두 가지 일반적인 접근 방식은 디바이스 접근 방식과 SaveOption 접근 방식입니다.이 섹션에서는 이러한 접근 방식을 사용하여 PDF를 BMP, JPEG, GIF, PNG, EMF, TIFF 및 SVG와 같은 널리 사용되는 이미지 형식으로 변환하는 방법을 살펴보겠습니다.라이브러리에는 가상 장치를 사용하여 이미지를 변환할 수 있는 다양한 클래스가 포함되어 있습니다.DocumentDevice 클래스는 전체 문서를 변환하도록 설계된 반면 ImageDevice 클래스는 특정 페이지를 위한 것입니다.