python html转TXT python读取html指定区域文本内容转成txt文件

1、首先,通过python,去将读取遍历程序目录文件夹中,【html】文件夹里面的文件、文件


夹以及子目录、子目录里面的 ,获取到该目录下所有的【.html】文件后,返回一个list对象


2、遍历完成后得到一个html文件列表对象,将该列表交给html_to_txt方法,html_to_txt方法


里面循环逐个读取html文件中指定标签中


标签中

标签中的文字,和中指定标签

里面

标签的文字提取出来


3、读取到的文本内容输出到txt文件中,这里可以加上一个替换replace,把我们不需要的内


容替换之后,这里可以做多次替换,也可以加上换行之类的处理,再进行输出,可根据自己


的需求修改,如果有什么不明之处,可以提问

main.py

Html_To_txt.py

发布于 2023-03-22 09:04 ・IP 属地广东