PDF 형식으로 파싱 데이터를 사용할 수 있는 상태에서 PDF 이외의 문서를 조작해야 하는 경우는 거의 없습니다.따라서 이러한 응용 프로그램에는 자체 솔루션 내에 PDF 파싱 기능을 추가하거나 PDF 변환 기능을 추가하여 지원되는 형식으로 데이터를 조작하는 두 가지 시나리오가 있습니다.PDF를 Word, Excel, HTML, 이미지 또는 기타 필수 형식으로 변환하는 두 번째 시나리오의 경우.NET 기반에서C# PDF 리더 및 변환기 코드를 구현하는 것은 간단합니다.여기서는 프로그래머가 요구 사항에 따라 이러한 변환 코드 스니펫을 수정할 수 있도록 몇 가지 사례를 설명합니다.
PDF를 마이크로소프트 워드 2003-2019로 변환
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_doc.doc"
// 원본 PDF 파일 로드
document = ap.Document(input_pdf)
// 저장 옵션을 사용하여 저장
// 문서 저장 옵션 객체 만들기
save_options = ap.DocSaveOptions()
save_options.format = ap.DocSaveOptions.DocFormat.DOCX
// Flow가 전체 인식 모드를 의미하므로 인식 모드를 설정합니다
save_options.mode = ap.DocSaveOptions.RecognitionMode.FLOW
// 다른 두 가지 모드는 인식 모드입니다.텍스트 상자와 인식 모드.향상된 흐름
// 수평 근접도를 2.5로 설정합니다
save_options.relative_horizontal_proximity = 2.5
// 변환 프로세스 중에 값이 글머리 기호를 인식하도록 설정
save_options.recognize_bullets = True
// 결과 DOC 파일 저장
document.save(output_pdf, save_options)
.NET용 Aspose.PDF 라이브러리는 모든 PDF에서 Word로의 변환을 지원합니다.특별한 설정 없이 Microsoft Word 문서를 변환하는 경우 Document 클래스에서 Save 메서드를 사용하여 PDF 파일을 로드하고 출력 Word 문서 경로 및 SaveFormat을 매개 변수로 사용합니다.라인 거리, 이미지 해상도 및 기타 설정을 개선해야 하는 특수한 경우를 위해 API에는 이러한 모든 설정을 표시하는 DocSaveOptions 클래스가 있습니다.
PDF를 엑셀 파일로 저장
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_excel.xlsx"
// PDF 문서 불러오기
document = ap.Document(input_pdf)
// Excel 저장 옵션 초기화
save_option = ap.ExcelSaveOptions()
// 출력 엑셀 XLSX 형식 설정
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
// 워크시트 수 최소화
save_option.minimize_the_number_of_worksheets = True
// PDF를 엑셀 출력 파일로 변환
document.save(output_pdf, save_option)
PDF를 특정 마이크로소프트 엑셀 XLS XLSX 출력 형식으로 저장하는 데 사용할 수 있는 특수 SaveFormat.Excel 열거입니다.또한 .NET PDF 라이브러리에는 Excel 형식으로 저장할 뿐만 아니라 정확한 출력 형식, 워크시트 수 최소화 등과 같은 다양한 속성을 설정하기 위한 다양한 함수와 속성을 제공하는 특정 ExcelSaveOptions 클래스 도 있습니다.
PDF를 파워포인트 프레젠테이션으로 변환
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx.pptx
// PDF 문서 불러오기
document = ap.Document(input_pdf)
save_option = ap.PptxSaveOptions()
save_option.slides_as_images = True
// 출력 파일 저장
document.save(output_pdf, save_option)
.NET PDF API는 슬라이드를 이미지로 렌더링하여 PDF 페이지를 선택 가능한 텍스트 또는 이미지가 포함된 PowerPoint 프레젠테이션 슬라이드로 변환하는 기능을 지원합니다.PowerPoint에 휴대용 문서 형식을 저장하는 패턴은 거의 동일합니다. Document 클래스를 사용하여 파일을 로드한 다음 출력 파일 경로와 SaveFormat을 매개 변수로 사용하여 Save 메서드를 호출합니다.특수 프레젠테이션 옵션을 사용하여 렌더링하는 경우 프로그래머는 관련된 특정 렌더링 옵션과 함께 PPTxSaveOptions 클래스 를 사용할 수 있습니다.save 메서드를 호출하고 옵션을 매개 변수로 전달합니다.
휴대용 문서 형식 PDF를 HTML로 변환
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
// 소스 PDF 문서 로드
document = ap.Document(input_pdf)
// HTML 저장 옵션 객체 인스턴스화
save_options = ap.HtmlSaveOptions()
// HTML 내에 모든 리소스를 포함시키는 옵션 활성화
save_options.parts_embedding_mode = ap.HtmlSaveOptions.PartsEmbeddingModes.EMBED_ALL_INTO_HTML
// 이미지를 포함한 PDF를 HTML로 변환할 개별 폴더 지정하기
save_options.special_folder_for_all_images = "ImagesFolder"
// 결과 HTML을 여러 페이지로 분할 옵션 지정하기
save_options.split_into_pages = True
document.save(output_pdf, save_options)
PDF 파싱 라이브러리는 이미지를 포함한 내장 리소스뿐만 아니라 PDF를 HTML로 전체적으로 저장할 수 있습니다.소스 문서를 로드하고 출력 HTML 파일 경로와 SaveFormat.Html 를 매개 변수로 사용하여 Save 메서드를 호출하는 등 일반적인 경우에 PDF를 다른 형식으로 변환하는 절차는 PDF와 동일합니다.임베디드 리소스로 저장하는 경우 변환 중에 이미지를 특정 폴더에 저장하거나 결과 HTML을 여러 페이지로 분할하는 등의 여러 옵션이 있는 HTMLSaveOptions 클래스 가 있습니다.
PDF를 이미지로 변환
import aspose.pdf as ap
input_pdf = DIR_INPUT + "many_pages.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_jpeg"
imageStream = io.FileIO(output_pdf + "_page_1_out.jpeg", "x")
// 문서 불러오기
document = ap.Document(input_pdf)
// 해상도 객체 만들기
resolution = ap.devices.Resolution(300)
// 지정된 속성을 가진 이미지 디바이스 생성
// 너비, 높이, 해상도
device = ap.devices.JpegDevice(resolution)
// BMP, PNG, TIFF의 경우 각각 BMP 디바이스, PNG 디바이스, TIFF 디바이스가 됩니다
// 특정 페이지를 변환하고 이미지를 스트림에 저장
device.process(document.pages[i + 1], imageStream)
// 스트림 닫기
imageStream.close()
.NET 기반 응용 프로그램에서는 아래 나열된 코드 스니펫을 사용하여 PDF 페이지를 PNG, JPEG, TIFF, BMP 등의 이미지로 쉽게 변환할 수 있습니다.개발자는 파일을 로드한 후 PDF 페이지를 반복하여 Page by Page를 필요한 이미지 형식으로 변환할 수 있습니다.개발자는 해상도 클래스 를 사용하여 이미지의 수평 및 수직 해상도를 설정할 수 있습니다