1、说明

这篇文章是帮一个群友解答的问题。

他有一个需求,就是对于日期的录入都是中文形式的,需要转换为数字形式的。由于python库中没有函数直接进行转换,因此我写了本篇文章。

对于本篇文章中的代码,如果有不懂的地方,可以留言说明,我会解答。


2、测试源数据如下

image.png


3、代码如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\chinese_english.xlsx")
display(df)
def func(x):
    year = x.split("年")[0]
    month = x.split("年")[1].split("月")[0]
    day = x.split("年")[1].split("月")[1].split("日")[0]
    if len(day) >= 3:
        day = day[0] + day[2]
    chinese_english = dict(零=0,一=1,二=2,三=3,四=4,五=5,六=6,七=7,八=8,九=9,十=10)
    year = "".join(str(chinese_english[i]) for i in year)
    month = "".join(str(chinese_english[i]) for i in month)
    day = "".join(str(chinese_english[i]) for i in day)
    if len(month) == 3:
        month = month[0] + month[2]
    if len(day) == 3:
        day = day[0] + day[2]
    final_date = year + "." + month + "." + day
    return final_date
df["final_date"] = df["日期"].apply(func)
display(df)


结果如下:

image.png

Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting、Self-Consistency等;项目实战搭建知识库内容机器人