批量提取pdf文件名到excel

您可以使用Python的第三方库来批量提取PDF文件名并将其保存到Excel表格中。下面是一个示例代码,演示如何使用Python的pandas和os模块来完成此任务:

import os
import pandas as pd
# 设置 PDF 文件所在的文件夹路径
pdf_folder_path = "path/to/pdf/folder"
# 获取文件夹中所有的 PDF 文件名
pdf_files = os.listdir(pdf_folder_path)
pdf_files = [file for file in pdf_files if file.endswith(".pdf")]
# 创建一个空的 pandas DataFrame 用于保存 PDF 文件名
pdf_names = pd.DataFrame(columns=["PDF Name"])
# 将 PDF 文件名添加到 DataFrame 中
for file in pdf_files:
    pdf_names = pdf_names.append({"PDF Name": file}, ignore_index=True)
# 将 DataFrame 中的数据保存到 Excel 表格中
pdf_names.to_excel("pdf_names.xlsx", index=False)

上述代码中,首先指定了包含PDF文件的文件夹路径,然后使用os模块的listdir函数获取该文件夹中所有PDF文件的文件名。接下来,创建了一个空的pandas DataFrame,并使用一个for循环将PDF文件名添加到DataFrame中。最后,使用pandas的to_excel函数将DataFrame中的数据保存到Excel表格中。

  •