这是用双引号包裹的字符串
这是用单引号包裹的字符串
这一个是那个三个引号包裹的字符串
可以保留原来的格式
转义字符串和原始字符串
Python中使用反斜杠“”来表示转义,也就是说
后面的内容就不会是原始的内容了,例如\n
则表示换行,而不再表示和字符
n了;所以如果字符串本身包含了
'、
"、
这些特殊的字符,必须要通过``进行转义处理。
示例代码如下所示:
text1 = "\'Hello world\'"
text2 = '\\Hello world\\'
print(text1)
print(text2)
下面展示了python中的一些转义字符:
转义字符 | 描述 |
---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
' | 单引号 |
" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy 代表的字符,例如:\o12 代表换行,其中 o 是字母,不是数字 0。 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
原始字符串是Python中一类比较特殊的字符串,以大写字母R
或者小写字母r
开始。在原始字符串中,字符“\
” 不再表示转义字符的含义。
示例代码如下所示:
text1 = "古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
text2 = r"古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
print(text1)
print(text2)
运行代码如下所示:
古之立大事者,
不惟有超世之才,
亦必有坚忍不拔之志
古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志
字符串的运算
Python为字符串类型提供了非常多的运算符
拼接运算符
使用+
运算符来实现字符串的拼接,使用*
运算符来重复一个字符串的内容
text1 = "Hello,world"
text2 = "!"
print(text1 + text2)
print(text2 * 10)
用*
实现字符串的重复是很重要,比如要打印一个分隔线如果写成---------------
会很麻烦的,但是如果用- * 20
就很简单了
Python中可以用in
和not in
判断一个字符串中是否存在另外一个字符或字符串,in
和not in
运算通常称为成员运算,会产生布尔值True
或False
text1 = "Hello,world"
text2 = "一碗周"
print("llo" in text1)
print("周" not in text2)
print("粥" not in text2)
获取字符串长度
通过内置函数len()
来获取字符的长度
text1 = "Hello,world"
text2 = "一碗周"
print(len(text1))
print(len(text2))
索引和切片
如果在字符串中引用某个字符,可以对字符从进行索引运算(注:Python的索引值是从0开始的),运算符是[n]
,其中n
是一个整数,假设字符串的长度为N
,那么n
可以是从0
到N-1
的整数,其中0
是字符串中第一个字符的索引,而N-1
是字符串中最后一个字符的索引,通常称之为正向索引;在Python中,字符串的索引也可以是从-1
到-N
的整数,其中-1
是最后一个字符的索引,而-N
则是第一个字符的索引,通常称之为负向索引。
值得注意的是,因为字符串是不可变类型,所以不能通过索引运算修改字符串中的字符。
text1 = "Hello,world"
text2 = "一碗周"
N1 = len(text1)
N2 = len(text2)
print(text1[0], text1[-N1])
print(text2[0], text2[-N2])
print(text1[N1 - 1], text1[-1])
print(text2[N2 - 1], text2[-1])
print(text1[2], text1[-2])
print(text2[2], text2[-2])
注意:如果索引越界(即索引值不在索引范围内)会引起错误,例如
print(text2[222])
错误信息如下:
IndexError: string index out of range # (字符串索引超出范围)
如果要取出多个字符,要对字符串进行切片,运算符是[i:j:k]
,其中i
是开始索引,索引对应的字符可以不能取到N-1
或者-1
;j
是结束索引,索引对应的字符不能取到0
或者-N
;k
是步长,默认值为1
,表示从前向后获取相邻字符的连续切片(可以省略),如果k
的值为正数,即为正向索引;如果k
的值为负数,即为负向索引。
s = '123456789abcdef,一碗周'
print(s[3:6])
print(s[-17:-14])
print(s[16:])
print(s[-3:])
print(s[8::2])
print(s[-12::2])
print(s[::2])
print(s[:])
print(s[1:-1:2])
print("-"*20)
print(s[7:1:-1])
print(s[-13:-19:-1])
print(s[8::-1])
print(s[:15:-1])
print(s[::-1])
print(s[::-2])
i
的默认值为最开始的那个数,j
的默认值为结束的那个数(包括本身)
值得注意的是,返回的字符串是包括i
不包括j
的。
字符串的方法
在Python中使用字符串的类型自带的方法对字符串进行处理和操作,对于一个字符串类型的变量,使用变量名.方法名()
的方式来调用它的方法。所谓方法其实就是跟某个类型的变量绑定的函数。
转换大小写
s1 = 'hello, world!'
print(s1.capitalize())
print(s1.title())
print(s1.upper())
s2 = 'GOODBYE'
print(s2.lower())
如果想在一个字符串中从前向后查找有没有另外一个字符串,可以使用字符串的find
或index
方法。
s = 'hello, world!'
print(s.find('or'))
print(s.find('shit'))
print(s.index('or'))
print(s.index('shit'))
在使用find
和index
方法时还可以通过方法的参数来指定查找的范围,就是不必从索引0
的位置开始。``find和
index方法还有逆向查找(从后向前查找)的版本,分别是
rfind和
rindex`
s = 'hello good world!'
print(s.find('o'))
print(s.find('o', 5))
print(s.rfind('o'))
可以通过字符串的startswith
、endswith
来判断字符串是否以某个字符串开头和结尾;还可以用is
开头的方法判断字符串的特征,这些方法都返回布尔值。
s1 = 'hello, world!'
print(s1.startswith('He'))
print(s1.startswith('hel'))
print(s1.endswith('!'))
s2 = 'abc123456'
print(s2.isdigit())
print(s2.isalpha())
print(s2.isalnum())
格式化字符串
在Python中,字符串类型可以通过center
、ljust
、rjust
方法做居中、左对齐和右对齐的处理。
s = 'hello, world'
print(s.center(20, '*'))
print(s.rjust(20))
print(s.ljust(20, '~'))
Python2.6 开始,新增了一种格式化字符串的函数 str.format()
,它增强了字符串格式化的功能。
基本语法是通过 {}
和 :
来代替以前的 %
。
a = 111
b = 222
print('{0} + {1} = {2}'.format(a, b, a + b))
c = "hello"
d = "world"
print("{} {}".format(c, d))
print("{0} {1}".format(c, d))
print("{1} {0}".format(d, c))
print("{1} {0} {1}".format(c, d))
从Python 3.6开始,格式化字符串还有更为简洁的书写方式,就是在字符串前加上f
来格式化字符串,在这种以f
打头的字符串中,{变量名}
是一个占位符,会被变量对应的值将其替换掉。
a = 111
b = 222
print(f"{a} + {b} = {a + b}")
c = "hello"
d = "world"
print(f"{c} {d}")
对数字格式化的多种操作
数字 | 格式 | 输出 | 描述 |
---|
3.1415926 | {:.2f} | 3.14 | 保留小数点后两位 |
3.1415926 | {:+.2f} | +3.14 | 带符号保留小数点后两位 |
-1 | {:+.2f} | -1.00 | 带符号保留小数点后两位 |
2.71828 | {:.0f} | 3 | 不带小数 |
5 | {:0>2d} | 05 | 数字补零 (填充左边, 宽度为2) |
5 | {:x<4d} | 5xxx | 数字补x (填充右边, 宽度为4) |
10 | {:x<4d} | 10xx | 数字补x (填充右边, 宽度为4) |
1000000 | {:,} | 1,000,000 | 以逗号分隔的数字格式 |
0.25 | {:.2%} | 25.00% | 百分比格式 |
1000000000 | {:.2e} | 1.00e+09 | 指数记法 |
13 | {:>10d} | 13 | 右对齐 (默认, 宽度为10) |
13 | {:<10d} | 13 | 左对齐 (宽度为10) |
13 | {:^10d} | 13 | 中间对齐 (宽度为10) |
11 | '{:b}'.format(11)<br>'{:d}'.format(11) '{:o}'.format(11) '{:x}'.format(11)<br>'{:#x}'.format(11) '{:#X}'.format(11) | 1011<br> 11<br> 13<br>b<br>0xb<br>0XB | 进制 |
分别是居中、左对齐、右对齐,后面带宽度,:号后面带填充的字符,只能是一个字符,不指定则默认是用空格填充。
+
表示在正数前显示+
,负数前显示 -
; (空格)表示在正数前加空格
b、d、o、x 分别是二进制、十进制、八进制、十六进制。
strip()
方法用于移除原字符串修剪掉左右指定的字符(默认为空格或换行符)或字符序列。这个方法非常有实用价值,通常用来将用户输入中因为不小心键入的头尾空格去掉,strip
方法还有lstrip
(即left strip
)和rstrip
(即right strip
)两个版本。
s = ' 一碗周 \t\n'
print(s.strip())
s1 = "!!!一碗周!!!"
print(s1.lstrip("!"))
print(s1.rstrip("!"))
复制代码