한국인
  1. 제품
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   Python을 사용하여 온라인으로 DOCX 파일에서 텍스트와 이미지를 추출합니다.

DOCX 파일을 온라인으로 구문 분석하고 Python을 통해 텍스트 또는 이미지를 추출합니다.

강력한 Python 기반 DOCX 문서 파서 유틸리티 애플리케이션을 개발합니다.Python을 통한 DOCX 문서 이미지 및 텍스트 추출을 위해 나열된 코드입니다.

온라인 앱을 통해 DOCX 문서 구문 분석

  1. DOCX 파일을 업로드하여 구문 분석할 수 있습니다.
  2. 파서 앱의 드래그 앤 드롭을 통해 드롭 영역 내부를 클릭하여 수행합니다.
  3. DOCX 파일의 크기와 인터넷 속도에 따라 몇 초 정도 기다립니다.
  4. 문서를 구문 분석하려면 ‘지금 구문 분석’ 버튼을 클릭하세요.
  5. 즉시 보려면 구문 분석된 파일을 다운로드하세요.

Python을 통해 DOCX 파일에서 텍스트 추출

  1. PyPI ( Aspose.Words )에서 직접 프로젝트 내 API 참조
  2. 텍스트 추출 프로세스에 포함할 노드 정의
  3. 첫 번째 및 마지막 노드 포함 또는 제외
  4. 지정된 노드에서 콘텐츠 추출
  5. 추출된 텍스트에 대해 별도의 DOCX 문서 만들기
  6. extract_content 함수에 나열된 코드.
 

DOCX 문서 텍스트를 추출하는 Python의 코드 예제

 

Python을 통해 DOCX 파일에서 이미지 추출

  1. PyPI ( Aspose.Words )에서 직접 프로젝트 내 API 참조
  2. Document 객체의 Shape 노드에 저장된 이미지
  3. 모든 Shape 노드를 선택하려면 Document.get_child_nodes 메소드를 사용하십시오.
  4. 결과 노드 컬렉션을 반복합니다.
  5. Shape.has_image가 true를 반환하는 경우.
  6. Shape.image_data 속성을 사용하여 이미지 데이터를 추출합니다.
  7. 이미지 데이터를 파일로 저장
 

DOCX 문서 이미지를 추출하는 Python의 코드 예제

 
 

Python을 통해 DOCX 파일 파서 애플리케이션 개발

DOCX 파서 앱이나 유틸리티를 개발해야 합니까? Aspose.Total for Python via .NET 의 하위 API인 Aspose.Words for Python via .NET 을 사용하면 모든 Python 개발자가 문서 파서 애플리케이션 내에 위의 API 코드를 통합할 수 있습니다.강력한 Python 라이브러리를 사용하면 모든 문서 구문 분석 솔루션을 프로그래밍하여 텍스트는 물론 이미지도 추출할 수 있습니다.또한 DOCX 형식을 포함하여 널리 사용되는 다양한 형식을 지원할 수 있습니다.

파서 앱용 DOCX 파일을 처리하는 Python 유틸리티

시스템에 “ Aspose.Words for Python via .NET ” 또는 “ Aspose.Total for Python via .NET “를 설치하는 대체 옵션이 있습니다.귀하의 요구 사항과 유사한 것을 선택하고 단계별 지침을 따르십시오.

시스템 요구 사항

  • Python 3.5 이상이 설치되어 있습니다.
  • GCC-6 런타임 라이브러리(또는 그 이상).
  • .NET Core 런타임의 종속성. .NET Core Runtime 자체를 설치할 필요는 없습니다.
  • Python 3.5-3.7의 경우: Python의 pymalloc 빌드가 필요합니다.

    자세한 내용은 제품 문서 를 참고하세요.

자주 묻는 질문

  • 내 애플리케이션에서 위의 Python 코드를 사용할 수 있나요?
    예, 이 코드를 다운로드하여 Python 기반 문서 파서 애플리케이션 개발 목적으로 활용하실 수 있습니다.이 코드는 노드 읽기, 텍스트 및 이미지 추출을 위한 문서 로드 등 백엔드 문서 처리 영역에서 프로젝트의 기능과 성능을 향상시키는 귀중한 리소스 역할을 할 수 있습니다.
  • 이 온라인 문서 파서 앱은 Windows에서만 작동합니까?
    Windows, Linux, Mac OS, Android 등 실행되는 운영 체제에 관계없이 모든 장치에서 문서 구문 분석을 시작할 수 있는 유연성이 있습니다.필요한 것은 최신 웹 브라우저와 활성 인터넷 연결뿐입니다.
  • DOCX 문서를 구문 분석하기 위해 온라인 앱을 사용하는 것이 안전한가요?
    물론! 당사 서비스를 통해 생성된 출력 파일은 24시간 이내에 당사 서버에서 안전하고 자동으로 제거됩니다.결과적으로 해당 파일과 관련된 표시 링크는 이 기간 이후에는 더 이상 작동하지 않습니다.
  • 앱을 사용하려면 어떤 브라우저를 사용해야 하나요?
    온라인 DOCX 문서 파서에는 Google Chrome, Firefox, Opera 또는 Safari와 같은 최신 웹 브라우저를 사용할 수 있습니다.하지만 데스크톱 애플리케이션을 개발하는 경우 효율적인 관리를 위해 Aspose.Total 문서 처리 API를 사용하는 것이 좋습니다.

탐구하다 파일 파서 Python 옵션

구문 분석 DOC 파일 (Microsoft Word 이진 형식)
구문 분석 DOCX 파일 (오피스 2007+ 워드 문서)
구문 분석 DOT 파일 (마이크로소프트 워드 템플릿 파일)
구문 분석 DOTX 파일 (마이크로소프트 워드 템플릿 파일)
구문 분석 ODP 파일 (OpenDocument 프레젠테이션 형식)
구문 분석 ODT 파일 (OpenDocument 텍스트 파일 형식)
구문 분석 OTT 파일 (OpenDocument 템플릿)
구문 분석 PDF 파일 (휴대용 문서 형식)
구문 분석 POWERPOINT 파일 (프레젠테이션 파일)
구문 분석 PPT 파일 (파워포인트 프레젠테이션)
구문 분석 PPTX 파일 (Open XML 프리젠테이션 형식)
구문 분석 RTF 파일 (서식 있는 텍스트 형식)
구문 분석 WORD 파일 (워드프로세싱 파일 형식)