品質を損なうことなく、大きなファイルを小さくします。不要な未使用のデータを削除します。 Python のWordおよびHTMLファイルのサイズを縮小します。 Python ライブラリは、さまざまな形式のドキュメントを最適化するための統合APIを開発者に提供します。
この Python ライブラリはスタンドアロンソリューションであり、サードパーティのソフトウェアをインストールする必要はありません。
高解像度の画像、およびそのような画像を含むドキュメントを最適化することで、最大の効果を得ることができます。 Python ライブラリは、HTML、DOCX、DOC、RTF、ODT、EPUB、HTML、JPG、PNGファイルの圧縮に役立ちます。
'Aspose.Words for Python via .NET' すると、品質を損なうことなくドキュメントを最適化できます。次の例は、 Python の Word 文書のサイズを縮小する方法を示しています。
pip install aspose-words
コピー
import aspose.words as aw
doc = aw.Document("Input.docx")
doc.cleanup()
shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
if shape.isImage:
# 画像圧縮用のライブラリを選択するのは開発者次第です。
image = Image.open(shape.image_data.to_stream())
# ...
# 画像を圧縮して形状に戻します。
shape.image_data.set_image("yourCompressedImage")
save_options = aw.saving.OoxmlSaveOptions
save_options.compression_level = aw.saving.CompressionLevel.MAXIMUM
doc.save("Output.docx", save_options)
import aspose.words as aw
doc = aw.Document("Input.docx")
doc.cleanup()
shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
if shape.isImage:
# 画像圧縮用のライブラリを選択するのは開発者次第です。
image = Image.open(shape.image_data.to_stream())
# ...
# 画像を圧縮して元の形に戻します。
shape.image_data.set_image("yourCompressedImage")
save_options = aw.saving.PdfSaveOptions
save_options.cache_background_graphics = true
doc.save("Output.docx", save_options)
import aspose.words as aw
doc = aw.Document("Input.docx")
doc.cleanup()
shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
if shape.isImage:
# 画像圧縮用のライブラリを選択するのは開発者次第です。
image = Image.open(shape.image_data.to_stream())
# ...
# 画像を圧縮して形状に戻します。
shape.image_data.set_image("yourCompressedImage")
doc.save("Output.docx")
import aspose.words as aw
doc = aw.Document("Input.docx")
doc.cleanup()
shapes = [node.as_shape() for node in doc.get_child_nodes(aw.NodeType.SHAPE, True)]
for shape in shapes:
if shape.isImage:
# 画像圧縮用のライブラリを選択するのは開発者次第です。
image = Image.open(shape.image_data.to_stream())
# ...
# 画像を圧縮して形状に戻します。
shape.image_data.set_image("yourCompressedImage")
save_options = aw.saving.OoxmlSaveOptions
save_options.compression_level = aw.saving.CompressionLevel.MAXIMUM
doc.save("Output.docx", save_options)
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
shape = builder.InsertImage("Input.docx")
save_options = aw.saving.ImageSaveOptions(aw.SaveFormat.DOCX)
shape.get_shape_renderer().save("Output.docx", save_options)
import aspose.words as aw
renderer = aw.pdf2word.fixedformats.PdfFixedRenderer()
pdf_read_options = aw.pdf2word.fixedformats.PdfFixedOptions()
pdf_read_options.image_format = aw.pdf2word.fixedformats.FixedImageFormat.JPEG
pdf_read_options.jpeg_quality = 50
with open ("Input.docx", 'rb') as pdf_stream:
pages_stream = renderer.save_pdf_as_images(pdf_stream, pdf_read_options);
builder = aw.DocumentBuilder()
for i in range(0, len(pages_stream)):
# 現在のページ画像のスケーリングを避けるために、最大ページサイズを設定します。
max_page_dimension = 1584
page_setup = builder.page_setup
set_page_size(page_setup, max_page_dimension, max_page_dimension)
page_image = builder.insert_image(pages_stream[i])
set_page_size(page_setup, page_image.width, page_image.height)
page_setup.top_margin = 0
page_setup.left_margin = 0
page_setup.bottom_margin = 0
page_setup.right_margin = 0
if i != len(pages_stream) - 1:
builder.insert_break(aw.BreakType.SECTION_BREAK_NEW_PAGE)
save_options = aw.saving.PdfSaveOptions()
save_options.cache_background_graphics = true
builder.document.save("Output.docx", save_options)
def set_page_size(page_setup, width, height):
page_setup.page_width = width;
page_setup.page_height = height;
Python パッケージはPyPiリポジトリでホストしています。 "Aspose.Words for Python via .NET" 開発者環境にインストールする方法のステップバイステップの説明に従ってください。
このパッケージは Python ≥3.5 および <3.12 と互換性があります。 Linux 用のソフトウェアを開発する場合は、 製品ドキュメントの gcc および libpython の追加要件を参照してください。