Mã để nén DOCX trong Python

Thư viện Python hiệu suất cao để tối ưu hóa DOCX nội dung và kích thước, giữ lại chất lượng ban đầu và dữ liệu cơ sở

Đây là một giải pháp chuyên nghiệp để nén DOCX bằng Python. Sử dụng DOCX API tối ưu hóa của chúng tôi để phát triển phần mềm cấp cao, độc lập với nền tảng bằng Python. Hãy thử nó trực tuyến miễn phí!

Xem đoạn mã

Nén DOCX tệp trong Python

Làm cho các DOCX tệp lớn nhỏ hơn mà không làm giảm chất lượng. Xóa dữ liệu không cần thiết và không sử dụng. Thu nhỏ kích thước của DOCX tệp trong mã. Thư viện Python cung cấp cho các nhà phát triển một API tích hợp để tối ưu hóa nội dung DOCX.

Giảm kích thước của DOCX tệp bằng cách sử dụng Python

Thư viện Python là một giải pháp độc lập và không yêu cầu cài đặt bất kỳ phần mềm bên thứ ba nào.

Tính năng nén không mất dữ liệu và tối ưu hóa nội dung sâu được thực hiện dễ dàng với 'Aspose.Words for Python via .NET'. Ví dụ sau minh họa cách tối ưu hóa nội dung của DOCX tệp trong Python:

Ví dụ về mã trong Python để nén DOCX tệp
Tải lên tệp bạn muốn tối ưu hóa / nén
Mã vận hành
Chọn định dạng mục tiêu từ danh sách
pip install aspose-words
Sao chép
import aspose.words as aw

doc = aw.Document("Input.docx")
doc.cleanup()

shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
    if shape.isImage:
        #  Tùy nhà phát triển chọn thư viện để nén ảnh.
        image = Image.open(shape.image_data.to_stream())

        # ...
        #  Nén hình ảnh và đặt nó trở lại hình dạng.
        shape.image_data.set_image("yourCompressedImage")

save_options = aw.saving.OoxmlSaveOptions
save_options.compression_level = aw.saving.CompressionLevel.MAXIMUM

doc.save("Output.docx", save_options)
import aspose.words as aw doc = aw.Document("Input.docx") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") save_options = aw.saving.PdfSaveOptions save_options.cache_background_graphics = true doc.save("Output.docx", save_options) import aspose.words as aw doc = aw.Document("Input.docx") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") doc.save("Output.docx") import aspose.words as aw doc = aw.Document("Input.docx") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") save_options = aw.saving.OoxmlSaveOptions save_options.compression_level = aw.saving.CompressionLevel.MAXIMUM doc.save("Output.docx", save_options) import aspose.words as aw doc = aw.Document() builder = aw.DocumentBuilder(doc) shape = builder.InsertImage("Input.docx") save_options = aw.saving.ImageSaveOptions(aw.SaveFormat.DOCX) shape.get_shape_renderer().save("Output.docx", save_options) import aspose.words as aw renderer = aw.pdf2word.fixedformats.PdfFixedRenderer() pdf_read_options = aw.pdf2word.fixedformats.PdfFixedOptions() pdf_read_options.image_format = aw.pdf2word.fixedformats.FixedImageFormat.JPEG pdf_read_options.jpeg_quality = 50 with open ("Input.docx", 'rb') as pdf_stream: pages_stream = renderer.save_pdf_as_images(pdf_stream, pdf_read_options); builder = aw.DocumentBuilder() for i in range(0, len(pages_stream)): # Đặt kích thước trang tối đa để tránh chia tỷ lệ hình ảnh trang hiện tại. max_page_dimension = 1584 page_setup = builder.page_setup set_page_size(page_setup, max_page_dimension, max_page_dimension) page_image = builder.insert_image(pages_stream[i]) set_page_size(page_setup, page_image.width, page_image.height) page_setup.top_margin = 0 page_setup.left_margin = 0 page_setup.bottom_margin = 0 page_setup.right_margin = 0 if i != len(pages_stream) - 1: builder.insert_break(aw.BreakType.SECTION_BREAK_NEW_PAGE) save_options = aw.saving.PdfSaveOptions() save_options.cache_background_graphics = true builder.document.save("Output.docx", save_options) def set_page_size(page_setup, width, height): page_setup.page_width = width; page_setup.page_height = height;
Mã vận hành

Cách nén DOCX Trong Python

  1. Cài đặt Aspose.Words for Python via .NET.
  2. Thêm tham chiếu thư viện (nhập thư viện) vào dự án Python của bạn.
  3. Mở DOCX tệp nguồn trong Python.
  4. Nén DOCX mà không làm giảm chất lượng.
  5. Gọi phương thức document_cleanup(). Mã kết quả có thể khác nhau tùy thuộc vào định dạng tệp đầu ra.
  6. Nhận kết quả nén dưới dạng DOCX tệp.

Python thư viện để tối ưu hóa và nén DOCX tệp

Chúng tôi lưu trữ các gói Python trong kho lưu trữ PyPi. Vui lòng làm theo hướng dẫn từng bước về cách cài đặt "Aspose.Words for Python via .NET" vào môi trường nhà phát triển của bạn.

yêu cầu hệ thống

Gói này tương thích với Python ≥3.5 và <3.12. Nếu bạn phát triển phần mềm cho Linux, vui lòng xem các yêu cầu bổ sung đối với gcc và libpython trong Tài liệu sản phẩm.

Các tối ưu hóa định dạng tệp được hỗ trợ khác

Bạn có thể tối ưu hóa tệp ở nhiều định dạng tệp khác:

5%

Đăng ký cập nhật sản phẩm của Aspose

Nhận bản tin hàng tháng và ưu đãi gửi trực tiếp đến hộp thư của bạn.

© Aspose Pty Ltd 2001-2024. Đã đăng ký Bản quyền.