python抽取word图片到另一个word文档(基于win32com)
示例目的 :将一个word文档(原文档,docx)中的图片全部复制到一个新的word文档中。
工作流程 :遍历原文档.docx中的图片,先统计一共有多少个图片需要处理;然后创建一个新的word文档,再遍历一次图片,并逐个复制和粘贴到新的word文档中。
原文档内容:
抽取复制后的文档:
示例代码:
import win32com.client as win32
from win32com.client import constants
import os
doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序
doc_app.Visible = True
curr_path = os.getcwd()
file_path = r'%s\原文档.docx'%curr_path
doc = doc_app.Documents.Open(file_path)
cnt =0
for shape in doc.InlineShapes:
if(shape.Type ==constants.wdInlineShapePicture):
cnt +=1
print('一共包含%d个图片'%cnt)
#创建一个新的文档,把图片复制进去
doc_new = doc_app.Documents.Add()
for shape in doc.InlineShapes:
if(shape.Type ==constants.wdInlineShapePicture):