import string
stri = 'today is friday, so happy..!!!'
punctuation_string = string.punctuation
print("所有的英文标点符号:", punctuation_string)
for i in punctuation_string:
stri = stri.replace(i, '')
print(stri)
所有的英文标点符号: !"
today is friday so happy
string.punctuation中的标点符号只有英文
如果是中文文本,可以调用zhon包的zhon.hanzi.punctuation函数即可得到中文的标点符号集合。
代码示例:
from zhon.hanzi import punctuation
str = '今天周五,下班了,好开心呀!!'
punctuation_str = punctuation
print("中文标点符合:", punctuation_str)
for i in punctuation:
str = str.replace(i, '')
print(str)
中文标点符合: "#$%&'()*+,-/:;<=>@[\]^_`{|}~⦅⦆「」、 、〃〈〉《》「」『』【】〔〕〖〗〘〙〚〛〜〝〞〟〰〾〿–—‘’‛“”„‟…‧﹏﹑﹔·!?。。
今天周五下班了好开心呀
参考博客:python之去除文本标点符号
lower_case_documents = ['Hello, how are you!','Win money, win from home.','Call me now.','Hello, Call hello you tomorrow?']
sans_punctuation_documents = []
import string
for i in lower_case_documents:
# TODO
trantab = str.maketrans(
dicts={i:'' for i in punctuation}
punc_table=str.maketrans(dicts)
new_s=s.translate(punc_table)
print(...
如果只要去掉英文,那么if判断的地方,只保留add_punc即可,如果英文的标点符号也想去掉,就使用punctuation
比如,要去掉数字:add_punc=‘0123456789’ 即可。字母也同理。
from string import pu...
import re,string
from zhon.hanzi import punctuation
text = " Hello, world! 这,是:我;第!一个程序\?()()<>《》 "
print(re.sub(r"[%s]+" %punct...
你可以使用字符串方法 translate() 和 maketrans 函数来去除英文标点。
首先,你需要创建一个字符映射表,用于指定哪些字符需要被删除。接着,使用 translate() 方法传递该字符映射表,以在字符串中去除指定字符。
以下是一个示例代码:
import string
def remove_punctuation(input_string):
# 创建字符映射表,用于指...
利用正则表达式去掉字符串中的英文String str = "111,aaa,222,bbb";Pattern p = Pattern.compile("[a-zA-z]");//创建stringBuff用来拼接StringBuffer sb = new StringBuffer();String[] s = str .split(",");for (int i = 0; i < s.leng...
python | 字符串去除(中文、英文、数字、标点符号)去除标点符号英文字符:string.punctuation中文字符:zhon.hanzi.punctuation去除英文s1: re.sub
https://blog.csdn.net/weixin_38819889/article/details/105389248
https://blog.csdn.net/qq_36098284/article/details/89061572
去除标点符号
英文字符:string.punctuation
在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 ,处理的方法会略有不同。本文会介绍 Python 是如何处理 分句 的。
分句的关键是找到合适的结束符号,比如:中文里的 。,英文里的 . 等,而且,在这一点上中英也是有很大区分的。
这里介绍一种纯用 Python 实现的分句函数。
def cut_sentences(content):...
python实现去除文本中的中文符号和英文符号import re
line = line.decode("utf8")
string = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。??、~@#¥%……&*()]+".decode("utf8"), "".decode("utf8"),line)
https://blog.csdn.net/weixin_43360896/article/details/114499028
python | 字符串去除(中文、英文、数字、标点符号)
去除标点符号
去除英文标点符号
去除中文标点符号
去除中文
去除英文
去除数字
去除空格
介绍下去除各个字母、数字、符号的方法,主要就是re的运用,去除用re.sub(),而反过来的提取用re.findall()即可
去除标点符号
标点符号包括中英文两种,要分开处理
去除英文标点符号
string.punctuati
本文由chatgpt生成,文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型,只是展现它原本的实力。对于颠覆工作方式的ChatGPT,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。