如何使用 Python 将 Word 文档转换为 HTML 或 Markdown_命令行


最近有一个开发需求,将生成的word数据报表以网页格式推送, 正好 找到一个简单快速 换的模块mammoth。


这篇简短的文章将指导您如何在基于 Python CLI Mammoth 的帮助下,以简单的方式将 .docx word 文档 换为简单的网页文档 ( .html ) Markdown 文档 ( .md )



据统计 Statista 调查( 2020 1 6 日), Microsoft Office 套件是目前最流行的办公软件。您可以使用 Microsoft Word 轻松地做快速笔记、简短报告、教程文档等。而且,您可能希望将文档内容作为 Web 文档 ( .html )) Markdown 文档 ( .md ) 与您的一些朋友、同事、客户共享。过去,在网络上托管一些网络文档可能会很昂贵,但现在云服务对于公共文档(例如 GitHub Pages )来说非常便宜甚至免费。


Install Mammoth

确保 PC 上安装了 Python PIP 。然后,打开 CMD 或终端并使用以下命令:




pip install mammoth



Docx 换为 HTML

使用命令行:




$ mammoth input_name.docx output_name.html



使用Python:

import mammoth
with open("sample.docx", "rb") as docx_file:
result = mammoth.convert_to_html(docx_file)
with open("sample.html", "w") as html_file:
html_file.write(result.value)


Docx 换为 MD

使用命令行:




$ mammoth .\sample.docx output.md --output-format=markdown



使用 Python


with open("sample.docx", "rb") as docx_file:
result = mammoth.convert_to_markdown(docx_file)
with open("sample.md", "w") as markdown_file:
markdown_file.write(result.value)

如何使用 Python 将 Word 文档转换为 HTML 或 Markdown_html_02

android 蓝牙打印h5模板 mui蓝牙打印

MUI蓝牙打印(Android)使用MUI开发手机APP时使用蓝牙打印功能可能较少使用,MUI官方并为集成蓝牙打印功能,而且似乎对iPhone蓝牙打印的类库支持也不够完善。忙完一阶段后回顾下之前的工作,想想蓝牙打印功能折腾了够长时间了,写这篇文章既是自己做个总结,也希望能给遇到同样为蓝牙打印功能挣扎的人带来一点帮助。页面HTML<!DOCTYPE html>

Java 程序内存的释放 java释放内存的方法

Java内存溢出的详细解决方案(转载)文章分类:Java编程 本文介绍了Java内存溢出的详细解决方案。本文总结内存溢出主要有两种情况,而JVM经常调用垃圾回收器解决内存堆不足的问题,但是有时仍会有内存不足的错误。作者分析了JVM内存区域组成及JVM设置虚拟内存的方式,从而给出了一系列解决方案 一、内存溢出类型 1、java.lang.OutOfMemoryError: PermGe

python遍历图像通道 python图像通道数

目的:查看位深分别为8位、24位和32位图像的通道数,探索通道数与位深之间是否有关系技术要求:需要熟悉Python Image Library,主要作用是图像处理,可用于图片剪切、粘贴、缩放、镜像、水印、颜色块、滤镜、图像格式转换、色场空间转换、验证码、旋转图像、图像增强、直方图处理、插值和滤波等功能。代码:from PIL import Image # 查看图片与通道数关系 img1 = Im