二、利用os.listdir递归获取所有的目录路径和文件路径
def get_file_path(root_path,file_list,dir_list):
#获取该目录下所有的文件名称和目录名称
dir_or_files = os.listdir(root_path)
for dir_file in dir_or_files:
#获取目录或者文件的路径
dir_file_path = os.path.join(root_path,dir_file)
#判断该路径为文件还是路径
if os.path.isdir(dir_file_path):
dir_list.append(dir_file_path)
#递归获取所有文件和目录的路径
get_file_path(dir_file_path,file_list,dir_list)
else:
file_list.append(dir_file_path)
if __name__ == "__main__":
#根目录路径
root_path = r"D:\test"
#用来存放所有的文件路径
file_list = []
#用来存放所有的目录路径
dir_list = []
get_file_path(root_path,file_list,dir_list)
print(file_list)
print(dir_list)
目录结构如下图:test---a------d------g--------g.txttest---a------d------a.txttest---a------e--------b--------c--------1.txt--------2.txt一、使用os.walk遍历所有的目录和文件1、获取test目录下的所有文件 for root,d...
简单暴力法-递归
假设在 E 盘中,有个名为“
Python
”的
文件
夹;该
文件
夹中也有两个
文件
夹,分别是“A”和“B”;另外,在“A”
文件
夹中还有一个 “results.txt” 的文本
文件
。因此,“
Python
”
文件
夹的
文件
结构如下:
Python
| |--results.txt
我们可以从上述看出,一个
文件
夹其实是一个树型的数据结构。
遍历
树的最简单、最暴力的办法就是递归。因此,
遍历
“
Python
”的
文件
夹的代码可以这么写:
# -*- coding: UTF-8 -*-
在
Python
中我们一般使用os模块来操作
文件
夹或
文件
,os为
Python
的内置模块,使用时直接导入即可:os模块中有许多方法,
在这里需要使用的有listdir()---listdir ------- 返回对应
目录
下的所有
文件
(包含你所隐藏的
文件
),返回的结果是列表
abspath()---abspath(相对路径) ----- 返回的是相对路径所对应的绝对路径
sdir()---isdir ------- 判断是Path(
目录
)
join()---- 以特定的格式将一个可迭代的
使用
Python
完整的获取所有
文件
及
文件
夹并读取相应的
文件
使用
Python
合并数据
总共1000多万条数据,如果我们用Excel的话估计要很多时间将这么多表格合并,而且会很卡,最后总结,
python
NP!
不足之处还请大家多多指正!
这样就可以
遍历
当前
目录
下的所有 HTML
文件
了。
注意:`os.walk()` 会递归
遍历
子
目录
,如果只想
遍历
当前
目录
,可以使用 `os.listdir()` 函数。
```
python
import os
# 获取当前
目录
下的所有
文件
files = os.listdir(".")
for file in files:
# 如果
文件
名以 .html 结尾,就打印
文件
名
if file.endswith(".html"):
print(file)