相关文章推荐
坏坏的饭盒  ·  Java ...·  9 月前    · 
瘦瘦的泡面  ·  Spring ...·  1 年前    · 
import string
stri = 'today is friday, so happy..!!!'
punctuation_string = string.punctuation
print("所有的英文标点符号:", punctuation_string)
for i in punctuation_string:
    stri = stri.replace(i, '')
print(stri)
所有的英文标点符号: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
today is friday so happy
 

string.punctuation中的标点符号只有英文

去除中文标点符号:

如果是中文文本,可以调用zhon包的zhon.hanzi.punctuation函数即可得到中文的标点符号集合。

代码示例:

from zhon.hanzi import punctuation
str = '今天周五,下班了,好开心呀!!'
punctuation_str = punctuation
print("中文标点符合:", punctuation_str)
for i in punctuation:
    str = str.replace(i, '')
print(str)
中文标点符合: "#$%&'()*+,-/:;<=>@[\]^_`{|}~⦅⦆「」、 、〃〈〉《》「」『』【】〔〕〖〗〘〙〚〛〜〝〞〟〰〾〿–—‘’‛“”„‟…‧﹏﹑﹔·!?。。
今天周五下班了好开心呀

参考博客:python之去除文本标点符号

lower_case_documents = ['Hello, how are you!','Win money, win from home.','Call me now.','Hello, Call hello you tomorrow?'] sans_punctuation_documents = [] import string for i in lower_case_documents: # TODO trantab = str.maketrans( dicts={i:'' for i in punctuation} punc_table=str.maketrans(dicts) new_s=s.translate(punc_table) print(... 如果只要去掉英文,那么if判断的地方,只保留add_punc即可,如果英文标点符号也想去掉,就使用punctuation 比如,要去掉数字:add_punc=‘0123456789’ 即可。字母也同理。 from string import pu... import re,string from zhon.hanzi import punctuation text = " Hello, world! 这,是:我;第!一个程序\?()()<>《》 " print(re.sub(r"[%s]+" %punct... 你可以使用字符串方法 translate() 和 maketrans 函数来去除英文标点。 首先,你需要创建一个字符映射表,用于指定哪些字符需要被删除。接着,使用 translate() 方法传递该字符映射表,以在字符串中去除指定字符。 以下是一个示例代码: import string def remove_punctuation(input_string): # 创建字符映射表,用于指... 利用正则表达式去掉字符串中的英文String str = "111,aaa,222,bbb";Pattern p = Pattern.compile("[a-zA-z]");//创建stringBuff用来拼接StringBuffer sb = new StringBuffer();String[] s = str .split(",");for (int i = 0; i < s.leng... python | 字符去除中文英文、数字、标点符号去除标点符号英文字符:string.punctuation中文字符:zhon.hanzi.punctuation去除英文s1: re.sub https://blog.csdn.net/weixin_38819889/article/details/105389248 https://blog.csdn.net/qq_36098284/article/details/89061572 去除标点符号 英文字符:string.punctuation 在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 ,处理的方法会略有不同。本文会介绍 Python 是如何处理 分句 的。 分句的关键是找到合适的结束符号,比如:中文里的 。,英文里的 . 等,而且,在这一点上中英也是有很大区分的。 这里介绍一种纯用 Python 实现的分句函数。 def cut_sentences(content):... python实现去除文本中的中文符号和英文符号import re line = line.decode("utf8") string = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。??、~@#¥%……&*()]+".decode("utf8"), "".decode("utf8"),line) https://blog.csdn.net/weixin_43360896/article/details/114499028 python | 字符去除中文英文、数字、标点符号去除标点符号 去除英文标点符号 去除中文标点符号 去除中文 去除英文 去除数字 去除空格 介绍下去除各个字母、数字、符号的方法,主要就是re的运用,去除用re.sub(),而反过来的提取用re.findall()即可 去除标点符号 标点符号包括中英文两种,要分开处理 去除英文标点符号 string.punctuati 本文由chatgpt生成,文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型,只是展现它原本的实力。对于颠覆工作方式的ChatGPT,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。