Mã để nén DOC trong Python

Thư viện Python hiệu suất cao để tối ưu hóa DOC nội dung và kích thước, giữ lại chất lượng ban đầu và dữ liệu cơ sở

Đây là một giải pháp chuyên nghiệp để nén DOC bằng Python. Sử dụng DOC API tối ưu hóa của chúng tôi để phát triển phần mềm cấp cao, độc lập với nền tảng bằng Python. Hãy thử nó trực tuyến miễn phí!

Xem đoạn mã

Nén DOC tệp trong Python

Làm cho các DOC tệp lớn nhỏ hơn mà không làm giảm chất lượng. Xóa dữ liệu không cần thiết và không sử dụng. Thu nhỏ kích thước của DOC tệp trong mã. Thư viện Python cung cấp cho các nhà phát triển một API tích hợp để tối ưu hóa nội dung DOC.

Giảm kích thước của DOC tệp bằng cách sử dụng Python

Thư viện Python là một giải pháp độc lập và không yêu cầu cài đặt bất kỳ phần mềm bên thứ ba nào.

Tính năng nén không mất dữ liệu và tối ưu hóa nội dung sâu được thực hiện dễ dàng với 'Aspose.Words for Python via .NET'. Ví dụ sau minh họa cách tối ưu hóa nội dung của DOC tệp trong Python:

Ví dụ về mã trong Python để nén DOC tệp
Tải lên tệp bạn muốn tối ưu hóa / nén
Mã vận hành
Chọn định dạng mục tiêu từ danh sách
pip install aspose-words
Sao chép
import aspose.words as aw

doc = aw.Document("Input.doc")
doc.cleanup()

shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
    if shape.isImage:
        # Tùy nhà phát triển chọn thư viện để nén ảnh.
        image = Image.open(shape.image_data.to_stream())

        # ...
        # Nén hình ảnh và đặt nó trở lại hình dạng.
        shape.image_data.set_image("yourCompressedImage")

doc.save("Output.doc")
import aspose.words as aw doc = aw.Document("Input.doc") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") save_options = aw.saving.PdfSaveOptions save_options.cache_background_graphics = true doc.save("Output.doc", save_options) import aspose.words as aw doc = aw.Document("Input.doc") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") doc.save("Output.doc") import aspose.words as aw doc = aw.Document("Input.doc") doc.cleanup() shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)] for shape in shapes: if shape.isImage: # Tùy nhà phát triển chọn thư viện để nén ảnh. image = Image.open(shape.image_data.to_stream()) # ... # Nén hình ảnh và đặt nó trở lại hình dạng. shape.image_data.set_image("yourCompressedImage") save_options = aw.saving.OoxmlSaveOptions save_options.compression_level = aw.saving.CompressionLevel.MAXIMUM doc.save("Output.doc", save_options) import aspose.words as aw doc = aw.Document() builder = aw.DocumentBuilder(doc) shape = builder.InsertImage("Input.doc") save_options = aw.saving.ImageSaveOptions(aw.SaveFormat.DOC) shape.get_shape_renderer().save("Output.doc", save_options) import aspose.words as aw renderer = aw.pdf2word.fixedformats.PdfFixedRenderer() pdf_read_options = aw.pdf2word.fixedformats.PdfFixedOptions() pdf_read_options.image_format = aw.pdf2word.fixedformats.FixedImageFormat.JPEG pdf_read_options.jpeg_quality = 50 with open ("Input.doc", 'rb') as pdf_stream: pages_stream = renderer.save_pdf_as_images(pdf_stream, pdf_read_options); builder = aw.DocumentBuilder() for i in range(0, len(pages_stream)): # Đặt kích thước trang tối đa để tránh chia tỷ lệ hình ảnh trang hiện tại. max_page_dimension = 1584 page_setup = builder.page_setup set_page_size(page_setup, max_page_dimension, max_page_dimension) page_image = builder.insert_image(pages_stream[i]) set_page_size(page_setup, page_image.width, page_image.height) page_setup.top_margin = 0 page_setup.left_margin = 0 page_setup.bottom_margin = 0 page_setup.right_margin = 0 if i != len(pages_stream) - 1: builder.insert_break(aw.BreakType.SECTION_BREAK_NEW_PAGE) save_options = aw.saving.PdfSaveOptions() save_options.cache_background_graphics = true builder.document.save("Output.doc", save_options) def set_page_size(page_setup, width, height): page_setup.page_width = width; page_setup.page_height = height;
Mã vận hành

Cách nén DOC

  1. Cài đặt Aspose.Words for Python via .NET.
  2. Thêm tham chiếu thư viện (nhập thư viện) vào dự án Python của bạn.
  3. Mở DOC tệp nguồn trong Python.
  4. Nén DOC mà không làm giảm chất lượng.
  5. Gọi phương thức document_cleanup(). Mã kết quả có thể khác nhau tùy thuộc vào định dạng tệp đầu ra.
  6. Nhận kết quả nén dưới dạng DOC tệp.

Python thư viện để tối ưu hóa và nén DOC tệp

Chúng tôi lưu trữ các gói Python trong kho lưu trữ PyPi. Vui lòng làm theo hướng dẫn từng bước về cách cài đặt "Aspose.Words for Python via .NET" vào môi trường nhà phát triển của bạn.

yêu cầu hệ thống

Gói này tương thích với Python ≥3.5 và <3.12. Nếu bạn phát triển phần mềm cho Linux, vui lòng xem các yêu cầu bổ sung đối với gcc và libpython trong Tài liệu sản phẩm.

Các tối ưu hóa định dạng tệp được hỗ trợ khác

Bạn có thể tối ưu hóa tệp ở nhiều định dạng tệp khác:

5%

Đăng ký cập nhật sản phẩm của Aspose

Nhận bản tin hàng tháng và ưu đãi gửi trực tiếp đến hộp thư của bạn.

© Aspose Pty Ltd 2001-2024. Đã đăng ký Bản quyền.