PDF 파일을 온라인으로 구문 분석하고 .NET을 통해 텍스트 또는 이미지를 추출합니다.
강력한 .NET 기반 PDF 문서 파서 유틸리티 애플리케이션을 개발합니다.PDF 문서 이미지 및 텍스트 추출을 위해 나열된 C# 코드입니다.
온라인 앱을 통해 PDF 문서 구문 분석
- PDF 파일을 업로드하여 구문 분석할 수 있습니다.
- 파서 앱의 드래그 앤 드롭을 통해 드롭 영역 내부를 클릭하여 수행합니다.
- PDF 파일의 크기와 인터넷 속도에 따라 몇 초 정도 기다립니다.
- 문서를 구문 분석하려면 ‘지금 구문 분석’ 버튼을 클릭하세요.
- 즉시 보려면 구문 분석된 파일을 다운로드하세요.
.NET을 통해 PDF 파일 구문 분석
- .NET 프로젝트에 라이브러리 참조 추가
- Document 클래스를 사용하여 PDF 파일 로드
- TextAbsorber 클래스 객체 사용
- 모든 페이지에 대한 흡수체를 수락합니다.
- 추출된 텍스트를 가져와서 작성하세요.
C# 코드 : PDF 문서 텍스트 추출
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf"); | |
TextAbsorber textAbsorber = new TextAbsorber(); | |
pdfDocument.Pages.Accept(textAbsorber); | |
string extractedText = textAbsorber.Text; | |
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt"); | |
tw.WriteLine(extractedText); | |
tw.Close(); |
C# 코드 : PDF 문서 이미지 추출
Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf"); | |
XImage xImage = pdfDocument.Pages[1].Resources.Images[1]; | |
FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create); | |
xImage.Save(outputImage, ImageFormat.Jpeg); | |
outputImage.Close(); | |
dataDir = dataDir + "ExtractImages_out.pdf"; | |
pdfDocument.Save(dataDir); |
.NET을 통해 PDF 파일 파서 애플리케이션 개발
PDF 파서 앱이나 유틸리티를 개발해야 합니까?
Aspose.Total for .NET
의 하위 API인
Aspose.PDF for .NET
을 사용하면 모든 Python 개발자가 문서 파서 애플리케이션 내에 위의 API 코드를 통합할 수 있습니다.강력한 .NET 라이브러리를 사용하면 모든 문서 구문 분석 솔루션을 프로그래밍하여 텍스트는 물론 이미지도 추출할 수 있습니다.또한 PDF 형식을 포함하여 널리 사용되는 다양한 형식을 지원할 수 있습니다.
파서 앱용 PDF 파일을 처리하는 .NET 유틸리티
시스템에 Aspose.PDF for .NET 또는 Aspose.Total for .NET를 설치하는 대체 옵션이 있습니다.귀하의 요구 사항과 유사한 것을 선택하고 단계별 지침을 따르십시오.
- NuGet 패키지 을 설치하세요. 선적 서류 비치 보기
- Visual Studio IDE 내에서 패키지 관리자 콘솔 를 사용하여 라이브러리 설치
시스템 요구 사항
당사 제품은 완전히 크로스 플랫폼이며 ‘.NET Standard 2.0’ 사양을 따르는 모든 주요 .NET 구현을 지원합니다.
- Microsoft .NET Framework, 초기 2.0 버전부터 시작하여 최신 ‘.NET Framework 4.8’까지
- .NET Core, 초기 2.0부터 시작하여 최신 ‘.NET 6’으로 끝남
- 모노 >= 2.6.7
.NET 코드는 기본 하드웨어나 운영 체제에 의존하지 않고 가상 머신에만 의존하므로 Windows, macOS, Android, iOS 및 Linux용 모든 종류의 소프트웨어를 자유롭게 개발할 수 있습니다.해당 버전의 .NET Framework, .NET Core, Windows Azure, Mono 또는 Xamarin을 설치했는지 확인하세요.
C#, F#, VB.NET 애플리케이션을 만들려면 Microsoft Visual Studio, Xamarin 및 MonoDevelop IDE를 사용하는 것이 좋습니다.
자세한 내용은 제품 문서 를 참고하세요.
자주 묻는 질문
- 내 애플리케이션에서 위의 .NET 코드를 사용할 수 있나요?예, 이 코드를 다운로드하여 .NET 기반 문서 파서 애플리케이션 개발 목적으로 활용하실 수 있습니다.이 코드는 노드 읽기, 텍스트 및 이미지 추출을 위한 문서 로드 등 백엔드 문서 처리 영역에서 프로젝트의 기능과 성능을 향상시키는 귀중한 리소스 역할을 할 수 있습니다.
- 이 온라인 문서 파서 앱은 Windows에서만 작동합니까?Windows, Linux, Mac OS, Android 등 실행되는 운영 체제에 관계없이 모든 장치에서 문서 구문 분석을 시작할 수 있는 유연성이 있습니다. 필요한 것은 최신 웹 브라우저와 활성 인터넷 연결뿐입니다.
- PDF 문서를 구문 분석하기 위해 온라인 앱을 사용하는 것이 안전한가요?물론! 당사 서비스를 통해 생성된 출력 파일은 24시간 이내에 당사 서버에서 안전하고 자동으로 제거됩니다.결과적으로 해당 파일과 관련된 표시 링크는 이 기간 이후에는 더 이상 작동하지 않습니다.
- 앱을 사용하려면 어떤 브라우저를 사용해야 하나요?온라인 PDF 문서 파서에는 Google Chrome, Firefox, Opera 또는 Safari와 같은 최신 웹 브라우저를 사용할 수 있습니다.하지만 데스크톱 애플리케이션을 개발하는 경우 효율적인 관리를 위해 Aspose.Total 문서 처리 API를 사용하는 것이 좋습니다.