python html转TXT python读取html指定区域文本内容转成txt文件
1、首先,通过python,去将读取遍历程序目录文件夹中,【html】文件夹里面的文件、文件
夹以及子目录、子目录里面的 ,获取到该目录下所有的【.html】文件后,返回一个list对象
2、遍历完成后得到一个html文件列表对象,将该列表交给html_to_txt方法,html_to_txt方法
里面循环逐个读取html文件中指定标签中
标签中
标签中的文字,和中指定标签
里面
标签的文字提取出来
3、读取到的文本内容输出到txt文件中,这里可以加上一个替换replace,把我们不需要的内
容替换之后,这里可以做多次替换,也可以加上换行之类的处理,再进行输出,可根据自己
的需求修改,如果有什么不明之处,可以提问
main.py
Html_To_txt.py