python 怎么用docx读取word的某一页然后放到新的word文档中?
关注者
16
被浏览
45,232
9 个回答
【第77集】200+视频轻松搞定Python办公自动化,最适合编程小白的职场课
627
播放
这个是我之前的一个课程中讲解到关于Python办公自动化相关的系列视频中的一个视频内容,本专栏主要侧重于Python办公自动化的内容,免费对外公开。更多内容可关注我的个人专栏《跟风舞烟学Python办公自动化》,专栏内容持续更新中!
发布于 2022-02-12 00:17
·
171
次播放
一、问题的提出
有一位朋友发来70多个数名命名的doc和docx文件,问我有没有vba代码,可以把这些文件按照数字大小的顺序合并。我试着用了chatgpt,搞了一串vba代码行不通,于时我就找出了Python,尝试了一下还不错。
二、算法分析
在实现转换前,需要进行文件遍历、格式转化,最终合并到新的文件中。以下是算法步骤
- 遍历当前目录文件。 利用os.listdir()来遍历。
- 格式转化。 用changeOffice这个模块来实现doc和docx的格式批量转化。
- 合并docx。 用python-docx中的Document来读取,追加到前面的文件。
三、代码展示
经过测式,我编制出以下代码:
from docx import Document
from changeOffice import Change
import os,time
Change(".").doc2docx() #把当前目录下的doc批量转化为docx
time.sleep(3) #设置停顿时间,以防出错
files = sorted([file for file in os.listdir(".") if file.endswith(".docx")],key=lambda x:int(x[:-5])) #文件遍历和排序