PDF 파일을 온라인으로 구문 분석하고 Java를 통해 텍스트 또는 이미지를 추출합니다.
강력한 Java 기반 PDF 문서 파서 유틸리티 애플리케이션을 개발합니다.Java를 통한 PDF 문서 이미지 및 텍스트 추출을 위해 나열된 코드입니다.
온라인 앱을 통해 PDF 문서 구문 분석
- PDF 파일을 업로드하여 구문 분석할 수 있습니다.
- 파서 앱의 드래그 앤 드롭을 통해 드롭 영역 내부를 클릭하여 수행합니다.
- PDF 파일의 크기와 인터넷 속도에 따라 몇 초 정도 기다립니다.
- 문서를 구문 분석하려면 ‘지금 구문 분석’ 버튼을 클릭하세요.
- 즉시 보려면 구문 분석된 파일을 다운로드하세요.
Java를 통해 PDF 파일 구문 분석
- Java 프로젝트에 라이브러리 참조 추가
- Document 클래스를 사용하여 PDF 파일 로드
- TextAbsorber 클래스 객체 사용
- getPages().accept() 메소드 호출
- 모든 텍스트를 얻으려면 textAbsorber.getText() 메소드를 사용하십시오.
PDF 문서를 구문 분석하는 Java 코드
String dirPath = "/home/parsingFiles/PDFSamples/"; | |
String filePath = dirPath + "ExtractTextAll.pdf"; | |
com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath); | |
com.aspose.pdf.TextAbsorber textAbsorber = new com.aspose.pdf.TextAbsorber(); | |
pdfDocument.getPages().accept(textAbsorber); | |
String extractedText = textAbsorber.getText(); | |
try { | |
java.io.FileWriter writer = new java.io.FileWriter(dirPath + "extracted-text.txt", true); | |
writer.write(extractedText); | |
writer.close(); | |
} catch (java.io.IOException e) { | |
e.printStackTrace(); | |
} |
Java를 통해 PDF 파일 파서 애플리케이션 개발
PDF 파서 앱이나 유틸리티를 개발해야 합니까?
Aspose.Total for Java
의 하위 API인
Aspose.PDF for Java
을 사용하면 모든 Python 개발자가 문서 파서 애플리케이션 내에 위의 API 코드를 통합할 수 있습니다.강력한 Java 라이브러리를 사용하면 모든 문서 구문 분석 솔루션을 프로그래밍하여 텍스트는 물론 이미지도 추출할 수 있습니다.또한 PDF 형식을 포함하여 널리 사용되는 다양한 형식을 지원할 수 있습니다.
파서 앱용 PDF 파일을 처리하는 Java 유틸리티
시스템에 “
Aspose.PDF for Java
” 또는 “
Aspose.Total for Java
“을 설치하는 대체 옵션이 있습니다.우리의 Java 패키지는 크로스 플랫폼으로 설계되었으며 Microsoft Windows, Linux, macOS, Android 및 iOS와 같은 다양한 운영 체제에서 JVM 구현과 호환됩니다.귀하의 요구 사항과 유사한 것을 선택하고 단계별 지침을 따르십시오.
- Aspose.PDF for Java 설치
- 아니면 Maven 에서
- 단계별 지침
시스템 요구 사항
- J2SE 8.0(1.8) 이상
- IBM i(Iseries 또는 As/400)에서 Java용 Aspose.PDF 지원
자세한 내용은 [제품 문서](https://docs.aspose.com/pdf/java/system-requirements/#optional-dependencies)을 참조하세요.
자주 묻는 질문
- 내 애플리케이션에서 위의 Java 코드를 사용할 수 있나요?예, 이 코드를 다운로드하여 Java 기반 문서 파서 애플리케이션 개발 목적으로 활용하셔도 좋습니다.이 코드는 노드 읽기, 텍스트 및 이미지 추출을 위한 문서 로드 등 백엔드 문서 처리 영역에서 프로젝트의 기능과 성능을 향상시키는 귀중한 리소스 역할을 할 수 있습니다.
- 이 온라인 문서 파서 앱은 Windows에서만 작동합니까?Windows, Linux, Mac OS, Android 등 실행되는 운영 체제에 관계없이 모든 장치에서 문서 구문 분석을 시작할 수 있는 유연성이 있습니다. 필요한 것은 최신 웹 브라우저와 활성 인터넷 연결뿐입니다.
- PDF 문서를 구문 분석하기 위해 온라인 앱을 사용하는 것이 안전한가요?물론! 당사 서비스를 통해 생성된 출력 파일은 24시간 이내에 당사 서버에서 안전하고 자동으로 제거됩니다.결과적으로 해당 파일과 관련된 표시 링크는 이 기간 이후에는 더 이상 작동하지 않습니다.
- 앱을 사용하려면 어떤 브라우저를 사용해야 하나요?온라인 PDF 문서 파서에는 Google Chrome, Firefox, Opera 또는 Safari와 같은 최신 웹 브라우저를 사용할 수 있습니다.하지만 데스크톱 애플리케이션을 개발하는 경우 효율적인 관리를 위해 Aspose.Total 문서 처리 API를 사용하는 것이 좋습니다.