相关文章推荐
玉树临风的野马  ·  pathos · PyPI·  4 天前    · 
内向的小蝌蚪  ·  GitHub - ...·  4 天前    · 
唠叨的石榴  ·  How do I use ...·  3 天前    · 
没人理的油条  ·  jq命令 :: AWS Workshop·  5 小时前    · 
爱看球的书包  ·  命令行import ...·  1 年前    · 
活泼的椰子  ·  C# Winform ...·  2 年前    · 

python读取word的自动编号(基于win32com)

有的时候需要提取word中带自动编号的信息。对于word中的文字很多第三方的库都可以搞定,但是,提取格式,可能还是要用pywin32来搞定。

首先,需要知道自动编号,在word对象中的名字,即ListFormat。

listformat的ListString,能获取到编号的字符串,即你看到word文档中编号的字符串,例如“1)”

而,ListValue,则读取到的是编号的值,例如文档中“5)”的编号,读取到的是5。

访问liststring和listvalue的vb代码示例,参考下面的链接

具体用哪个,就看个人需求。

示例:

读取的效果:

脚本:

import win32com.client as win32
from win32com.client import constants
import os
curr_path = os.getcwd()
path = r'%s\带编号.docx'%curr_path
doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序