Python小记（五）：字符串操作

字符串的定义

所谓 字符串 ，就是由0个或者多个 字符组成的有限序列 。

在Python程序中，如果我们把单个或多个字符用单引号 '' 或者双引号 "" 包裹起来，就可以表示一个字符串，也可以用三个单引号或者双引号进行折行。字符串的字符可以是特殊符号、英文字母、中文字符、日文的平假名或片假名、希腊字母、Emoji字符等等。

如下代码展示了Python中的字符串：

text1 = "这是用双引号包裹的字符串"
text2 = '这是用单引号包裹的字符串'
text3 = """
这一个是那个三个引号包裹的字符串
可以保留原来的格式
print(text1)
print(text2)
print(text3)
代码运行结果如下：
这是用双引号包裹的字符串
这是用单引号包裹的字符串
这一个是那个三个引号包裹的字符串
可以保留原来的格式
转义字符串和原始字符串
Python中使用反斜杠“”来表示转义，也就是说后面的内容就不会是原始的内容了，例如\n则表示换行，而不再表示和字符n了；所以如果字符串本身包含了'、"、这些特殊的字符，必须要通过``进行转义处理。
示例代码如下所示：
text1 = "\'Hello world\'"  # 输出被单引号包裹的Hello world
text2 = '\\Hello world\\'  # 输出被两个反斜线包裹的Hello world
print(text1)
print(text2)
下面展示了python中的一些转义字符：
转义字符 描述
(在行尾时) 续行符
\ 反斜杠符号
' 单引号
" 双引号
\a 响铃
\b 退格(Backspace)
\000 空
\n 换行
\v 纵向制表符
\t 横向制表符
\r 回车
\f 换页
\oyy 八进制数，yy 代表的字符，例如：\o12 代表换行，其中 o 是字母，不是数字 0。
\xyy 十六进制数，yy代表的字符，例如：\x0a代表换行
\other 其它的字符以普通格式输出
原始字符串是Python中一类比较特殊的字符串，以大写字母R或者小写字母r开始。在原始字符串中，字符“\” 不再表示转义字符的含义。
示例代码如下所示：
text1 = "古之立大事者，\n不惟有超世之才，\n亦必有坚忍不拔之志"
text2 = r"古之立大事者，\n不惟有超世之才，\n亦必有坚忍不拔之志"
print(text1)
print(text2)
运行代码如下所示：
古之立大事者，
不惟有超世之才，
亦必有坚忍不拔之志
古之立大事者，\n不惟有超世之才，\n亦必有坚忍不拔之志
字符串的运算
Python为字符串类型提供了非常多的运算符
拼接运算符
使用+运算符来实现字符串的拼接，使用*运算符来重复一个字符串的内容
text1 = "Hello,world"
text2 = "!"
print(text1 + text2)  # Hello,world!
print(text2 * 10)  # !!!!!!!!!!
用*实现字符串的重复是很重要，比如要打印一个分隔线如果写成---------------会很麻烦的，但是如果用- * 20就很简单了
Python中可以用in和not in判断一个字符串中是否存在另外一个字符或字符串，in和not in运算通常称为成员运算，会产生布尔值True或False
text1 = "Hello,world"
text2 = "一碗周"
print("llo" in text1)  # True
print("周" not in text2)  # False
print("粥" not in text2)  # True
获取字符串长度
通过内置函数len()来获取字符的长度
text1 = "Hello,world"
text2 = "一碗周"
print(len(text1))  # 11
print(len(text2))  # 3
索引和切片
如果在字符串中引用某个字符，可以对字符从进行索引运算（注：Python的索引值是从0开始的），运算符是[n]，其中n是一个整数，假设字符串的长度为N，那么n可以是从0到N-1的整数，其中0是字符串中第一个字符的索引，而N-1是字符串中最后一个字符的索引，通常称之为正向索引；在Python中，字符串的索引也可以是从-1到-N的整数，其中-1是最后一个字符的索引，而-N则是第一个字符的索引，通常称之为负向索引。
值得注意的是，因为字符串是不可变类型，所以不能通过索引运算修改字符串中的字符。
text1 = "Hello,world"
text2 = "一碗周"
N1 = len(text1)
N2 = len(text2)
# 获取第一个字符
print(text1[0], text1[-N1])  # H H
print(text2[0], text2[-N2])  # 一 一
# 获取最后一个字符
print(text1[N1 - 1], text1[-1])  # d d
print(text2[N2 - 1], text2[-1])  # 周 周
# 获取索引为2和-2的字符
print(text1[2], text1[-2])  # l l
print(text2[2], text2[-2])  # 周 碗
注意：如果索引越界（即索引值不在索引范围内）会引起错误，例如
print(text2[222])
错误信息如下：
IndexError: string index out of range # （字符串索引超出范围）
如果要取出多个字符，要对字符串进行切片，运算符是[i:j:k]，其中i是开始索引，索引对应的字符可以不能取到N-1或者-1；j是结束索引，索引对应的字符不能取到0或者-N；k是步长，默认值为1，表示从前向后获取相邻字符的连续切片（可以省略），如果k的值为正数，即为正向索引；如果k的值为负数，即为负向索引。
s = '123456789abcdef，一碗周'
# i=3, j=6, k=1的正向切片操作
print(s[3:6])       # 456
# i=-17, j=-14, k=1的正向切片操作
print(s[-17:-14])     # 456
# i=16, j=默认, k=1的正向切片操作
print(s[16:])        # 一碗周
# i=-4, j=默认, k=1的正向切片操作
print(s[-3:])       # 一碗周
# i=8, j=默认, k=2的正向切片操作
print(s[8::2])      # 9bdf一周
# i=-12, j=默认, k=2的正向切片操作
print(s[-12::2])     # 8ace，碗
# i=默认, j=默认, k=2的正向切片操作
print(s[::2])       # 13579bdf一周
# i=默认, j=默认, k=1的正向切片
print(s[:])         # 123456789abcdef，一碗周
# i=1, j=-1, k=2的正向切片操作
print(s[1:-1:2])    # 2468ace，碗
print("-"*20)
# i=7, j=1, k=-1的负向切片操作
print(s[7:1:-1])    # 876543
# i=-13, j=-19, k=-1的负向切片操作
print(s[-13:-19:-1])  # 876543
# i=8, j=默认, k=-1的负向切片操作
print(s[8::-1])     # 987654321
# i=默认, j=1, k=-1的负向切片操作
print(s[:15:-1])     # 周碗一
# i=默认, j=默认, k=-1的负向切片
print(s[::-1])      # 周碗一，fedcba987654321
# i=默认, j=默认, k=-2的负向切片
print(s[::-2])      # 周一fdb97531
i的默认值为最开始的那个数，j的默认值为结束的那个数（包括本身）
值得注意的是，返回的字符串是包括i不包括j的。
字符串的方法
在Python中使用字符串的类型自带的方法对字符串进行处理和操作，对于一个字符串类型的变量，使用变量名.方法名()的方式来调用它的方法。所谓方法其实就是跟某个类型的变量绑定的函数。
转换大小写
s1 = 'hello, world!'
# 使用capitalize方法获得字符串首字母大写后的字符串
print(s1.capitalize())   # Hello, world!
# 使用title方法获得字符串每个单词首字母大写后的字符串
print(s1.title())        # Hello, World!
# 使用upper方法获得字符串大写后的字符串
print(s1.upper())        # HELLO, WORLD!
s2 = 'GOODBYE'
# 使用lower方法获得字符串小写后的字符串
print(s2.lower())        # goodbye
如果想在一个字符串中从前向后查找有没有另外一个字符串，可以使用字符串的find或index方法。
s = 'hello, world!'
# find方法从字符串中查找另一个字符串所在的位置
# 找到了返回字符串中另一个字符串首字符的索引
print(s.find('or'))        # 8
# 找不到返回-1
print(s.find('shit'))      # -1
# index方法与find方法类似
# 找到了返回字符串中另一个字符串首字符的索引
print(s.index('or'))       # 8
# 找不到引发异常
print(s.index('shit'))     # ValueError: substring not found
在使用find和index方法时还可以通过方法的参数来指定查找的范围，就是不必从索引0的位置开始。``find和index方法还有逆向查找（从后向前查找）的版本，分别是rfind和rindex`
s = 'hello good world!'
# 从前向后查找字符o出现的位置(相当于第一次出现)
print(s.find('o'))       # 4
# 从索引为5的位置开始查找字符o出现的位置
print(s.find('o', 5))    # 7
# 从后向前查找字符o出现的位置(相当于最后一次出现)
print(s.rfind('o'))      # 12
可以通过字符串的startswith、endswith来判断字符串是否以某个字符串开头和结尾；还可以用is开头的方法判断字符串的特征，这些方法都返回布尔值。
s1 = 'hello, world!'
# startwith方法检查字符串是否以指定的字符串开头返回布尔值
print(s1.startswith('He'))    # False
print(s1.startswith('hel'))   # True
# endswith方法检查字符串是否以指定的字符串结尾返回布尔值
print(s1.endswith('!'))       # True
s2 = 'abc123456'
# isdigit方法检查字符串是否由数字构成返回布尔值
print(s2.isdigit())    # False
# isalpha方法检查字符串是否以字母构成返回布尔值
print(s2.isalpha())    # False
# isalnum方法检查字符串是否以数字和字母构成返回布尔值
print(s2.isalnum())    # True
格式化字符串
在Python中，字符串类型可以通过center、ljust、rjust方法做居中、左对齐和右对齐的处理。
s = 'hello, world'
# center方法以宽度20将字符串居中并在两侧填充*
print(s.center(20, '*'))  # ****hello, world****
# rjust方法以宽度20将字符串右对齐并在左侧填充空格
print(s.rjust(20))        #         hello, world
# ljust方法以宽度20将字符串左对齐并在右侧填充~
print(s.ljust(20, '~'))   # hello, world~~~~~~~~
Python2.6 开始，新增了一种格式化字符串的函数 str.format()，它增强了字符串格式化的功能。
基本语法是通过 {} 和 : 来代替以前的 % 。
a = 111
b = 222
print('{0} + {1} = {2}'.format(a, b, a + b)) # 111 + 222 = 333
c = "hello"
d = "world"
# 不设置指定位置，按默认顺序
print("{} {}".format(c, d))        # hello world
print("{0} {1}".format(c, d))      # hello world
print("{1} {0}".format(d, c))      # hello world
print("{1} {0} {1}".format(c, d))  # world hello world
从Python 3.6开始，格式化字符串还有更为简洁的书写方式，就是在字符串前加上f来格式化字符串，在这种以f打头的字符串中，{变量名}是一个占位符，会被变量对应的值将其替换掉。
a = 111
b = 222
print(f"{a} + {b} = {a + b}") # 111 + 222 = 333
c = "hello"
d = "world"
print(f"{c} {d}")        # hello world
对数字格式化的多种操作
数字 格式 输出 描述
3.1415926 {:.2f} 3.14 保留小数点后两位
3.1415926 {:+.2f} +3.14 带符号保留小数点后两位
-1 {:+.2f} -1.00 带符号保留小数点后两位
2.71828 {:.0f} 3 不带小数
5 {:0>2d} 05 数字补零 (填充左边, 宽度为2)
5 {:x<4d} 5xxx 数字补x (填充右边, 宽度为4)
10 {:x<4d} 10xx 数字补x (填充右边, 宽度为4)
1000000 {:,} 1,000,000 以逗号分隔的数字格式
0.25 {:.2%} 25.00% 百分比格式
1000000000 {:.2e} 1.00e+09 指数记法
13 {:>10d} 13 右对齐 (默认, 宽度为10)
13 {:<10d} 13 左对齐 (宽度为10)
13 {:^10d} 13 中间对齐 (宽度为10)
11 '{:b}'.format(11)<br>'{:d}'.format(11)
 '{:o}'.format(11)
 '{:x}'.format(11)<br>'{:#x}'.format(11)
 '{:#X}'.format(11) 1011<br> 11<br> 13<br>b<br>0xb<br>0XB 进制
分别是居中、左对齐、右对齐，后面带宽度，:号后面带填充的字符，只能是一个字符，不指定则默认是用空格填充。
+表示在正数前显示+，负数前显示 -； （空格）表示在正数前加空格
b、d、o、x 分别是二进制、十进制、八进制、十六进制。
strip() 方法用于移除原字符串修剪掉左右指定的字符（默认为空格或换行符）或字符序列。这个方法非常有实用价值，通常用来将用户输入中因为不小心键入的头尾空格去掉，strip方法还有lstrip(即left strip)和rstrip(即right strip)两个版本。
s = '   一碗周  \t\n'
# strip方法获得字符串修剪左右两侧空格之后的字符串
print(s.strip())    # 一碗周
s1 = "!!!一碗周!!!"
print(s1.lstrip("!"))  # 一碗周!!!
print(s1.rstrip("!"))  # !!!一碗周
复制代码
  分类：
 人工智能
 标签：
 Python掘金翻译计划
 
   
      安装掘金浏览器插件
     多内容聚合浏览、多引擎快捷搜索、多工具便捷提效、多模式随心畅享，你想要的，这里都有！
 前往安装
      
        VIP.5 如鱼得水
        前端造梦师
         5,389

转义字符	描述
(在行尾时)	续行符
`\`	反斜杠符号
`'`	单引号
`"`	双引号
`\a`	响铃
`\b`	退格(Backspace)
`\000`	空
`\n`	换行
`\v`	纵向制表符
`\t`	横向制表符
`\r`	回车
`\f`	换页
`\oyy`	八进制数，yy 代表的字符，例如：\o12 代表换行，其中 o 是字母，不是数字 0。
`\xyy`	十六进制数，yy代表的字符，例如：\x0a代表换行
`\other`	其它的字符以普通格式输出

数字	格式	输出	描述
3.1415926	{:.2f}	3.14	保留小数点后两位
3.1415926	{:+.2f}	+3.14	带符号保留小数点后两位
-1	{:+.2f}	-1.00	带符号保留小数点后两位
2.71828	{:.0f}	3	不带小数
5	{:0>2d}	05	数字补零 (填充左边, 宽度为2)
5	{:x<4d}	5xxx	数字补x (填充右边, 宽度为4)
10	{:x<4d}	10xx	数字补x (填充右边, 宽度为4)
1000000	{:,}	1,000,000	以逗号分隔的数字格式
0.25	{:.2%}	25.00%	百分比格式
1000000000	{:.2e}	1.00e+09	指数记法
13	{:>10d}	13	右对齐 (默认, 宽度为10)
13	{:<10d}	13	左对齐 (宽度为10)
13	{:^10d}	13	中间对齐 (宽度为10)
11	`'{:b}'.format(11)<br>'{:d}'.format(11)` `'{:o}'.format(11)` `'{:x}'.format(11)<br>'{:#x}'.format(11)` `'{:#X}'.format(11)`	`1011<br> 11<br> 13<br>b<br>0xb<br>0XB`	进制