字符串及其操作

相关文章推荐

帅气的跑步鞋 · ASN.1探索－ 3 ...· 3 月前 ·

深情的爆米花 · 信息安全（一）-编码算法【base64编码、 ...· 2 天前 ·

逆袭的大海 · shell 字符串为空忽略空格 - CSDN文库· 1 年前 ·

强健的松鼠 · 上海交通大学中国法与社会研究院· 1 年前 ·

大气的稀饭 · Word-VBA：替换文字_vba ...· 2 年前 ·

淡定的萝卜 · 驱动程序无法通过使用安全套接字层(SSL)加 ...· 2 年前 ·

满身肌肉的保温杯 · Unable to Import ...· 2 年前 ·

1） Python3编码格式

python 3.x默认的字符串编码是unicode,即程序中类型是str的字符串编码都是unicode;默认的代码文件编码是utf-8，即.py文件的编码是utf-8。

在py3上把你的代码以utf-8编写，保存，然后在windows上执行，加载到了内存里python解释器把utf-8转成了unicode。如下图：

2）计算机常用编码如下：

ASCII码:美国信息交换标准代码,一个字节

GBK 和 GB2312：中文编码

Unicode：把所有语言都统一到一套编码里，两个字节或四个字节表示一个字符

UTF8:Unicode Transformation Format，学术名UTF;UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节。

ANSI:其实ANSI并不是某一种特定的字符编码，而是在不同的系统中，ANSI表示不同的编码。你的美国同事Bob的系统中ANSI编码其实是ASCII编码（ASCII编码不能表示汉字，所以汉字为乱码），而你的系统中（“汉字”正常显示）ANSI编码其实是GBK编码

3） Python编程进行编码转换

#unicode码编码成utf-8或gb2312字节码
s="python程序设计" s_utf_8=s.encode(encoding='utf-8') #默认是utf-8或UTF-8编码，utf8也行 s_gb2312=s.encode(encoding='gb2312') print(s_utf_8) print(s_gb2312)

#字节码解码成unicode码 s1=s_utf_8.decode() s2=s_gb2312.decode(encoding='gb2312') print(s1) print(s2)

字符串方法的调用

字符串类型的名称是（也是字符串类）：str

可以使用str调用字符串方法，比如：str.upper("python")

一般都使用字符串对象调用方法："python".upper()

字符串方法汇总

replace(old, new[, max]) old – 将被替换的子字符串。new – 新字符串，用于替换old子字符串。max – 可选字符串, 替换不超过 max 次把字符串中的 old（旧字符串）替换成 new(新字符串)，如果指定第三个参数max，则替换不超过 max 次。 expandtabs(tabsize=8) tabsize – 指定转换字符串中的 tab 符号(’\t’)转为空格的字符数。把字符串中的 tab 符号(’\t’)转为空格，tab 符号(’\t’)默认的空格数是 8。 maketrans(intab, outtab) intab – 字符串中要替代的字符组成的字符串。outtab – 相应的映射字符的字符串。

用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。两个字符串的长度必须相同，为一一对应的关系。

center(width[, fillchar]) width – 字符串的总宽度。fillchar – 填充字符。返回一个指定的宽度 width 居中的字符串，fillchar 为填充的字符，默认为空格。 ljust(width[, fillchar]) width – 指定字符串长度。fillchar – 填充字符，默认为空格。返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。 startswith(substr, beg=0,end=len(string)) str – 检测的字符串。substr – 指定的子字符串。strbeg – 可选参数用于设置字符串检测的起始位置。strend – 可选参数用于设置字符串检测的结束位置。用于检查字符串是否是以指定子字符串开头，如果是则返回 True，否则返回 False。如果参数 beg 和 end 指定值，则在指定范围内检查。 endswith(suffix[, start[, end]]) suffix – 该参数可以是一个字符串或者是一个元素。start – 字符串中的开始位置。end – 字符中结束位置。用于判断字符串是否以指定后缀结尾，如果以指定后缀结尾返回 True，否则返回 False。可选参数 “start” 与 “end” 为检索字符串的开始与结束位置。 find(str, beg=0, end=len(string)) str – 指定检索的字符串beg – 开始索引，默认为0。end – 结束索引，默认为字符串的长度检测字符串中是否包含子字符串 str ，如果指定 beg（开始）和 end（结束）范围，则检查是否包含在指定范围内，如果指定范围内如果包含指定索引值，返回的是索引值在字符串中的起始位置。如果不包含索引值，返回-1。 rfind(str, beg=0 end=len(string)) str – 查找的字符串beg – 开始查找的位置，默认为0end – 结束查找位置，默认为字符串的长度。返回字符串最后一次出现的位置，如果没有匹配项则返回-1 index(str, beg=0, end=len(string)) str – 指定检索的字符串beg – 开始索引，默认为0。end – 结束索引，默认为字符串的长度。检测字符串中是否包含子字符串 str ，如果指定 beg（开始）和 end（结束）范围，则检查是否包含在指定范围内，该方法与 python find()方法一样，只不过如果str不在 string中会报一个异常。 rindex(str, beg=0 end=len(string)) str – 查找的字符串beg – 开始查找的位置，默认为0end – 结束查找位置，默认为字符串的长度。返回子字符串 str 在字符串中最后出现的位置，如果没有匹配的字符串会报异常，你可以指定可选参数[beg:end]设置查找的区间。 split(str="", num=string.count(str)) 1.str – 分隔符，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等。2.num – 分割次数。默认为 -1, 即分隔所有。通过指定分隔符对字符串进行切片，如果第二个参数 num 有指定值，则分割为 num+1 个子字符串。返回元素列表 splitlines([keepends]) keepends – 在输出结果里是否去掉换行符(’\r’, ‘\r\n’, \n’)，默认为 False，不包含换行符，如果为 True，则保留换行符。按照行(’\r’, ‘\r\n’, \n’)分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。 count(sub, start= 0,end=len(string)) sub – 搜索的子字符串start – 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。end – 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 len( s ) s – 对象。返回对象（字符、列表、元组等）长度或项目个数。 1.translate(table) 2.bytes.translate(table[, delete]) 3.bytearray.translate(table[, delete]) table – 翻译表，翻译表是通过 maketrans() 方法转换而来。 deletechars – 字符串中要过滤的字符列表。根据参数table给出的表(包含 256 个字符)转换字符串的字符,要过滤掉的字符放到 deletechars 参数中。 bytes.decode(encoding=“utf-8”, errors=“strict”) encoding – 要使用的编码，如"UTF-8"。errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。其他可能得值有 ‘ignore’, ‘replace’,‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。以指定的编码格式解码 bytes 对象。默认编码为 ‘utf-8’。 encode(encoding=‘UTF-8’,errors=‘strict’) encoding – 要使用的编码，如: UTF-8。errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。其他可能得值有 ‘ignore’, ‘replace’,‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。以指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。 具体操作请点击：字符串方法代码事例