列表、元组、字典和集合
5 Python字符串常用方法
5.1 Python字符串拼接(包含字符串拼接数字)
5.2 Python截取字符串
5.3 Python len()函数:获取字符串长度或字节数
5.4 Python split()分割字符串方法
5.5 Python join()合并字符串方法
5.6 Python count()统计字符串出现的次数
5.7 Python find()检测字符串中是否包含某子串
5.8 Python index()检测字符串中是否包含某子串
5.9 Python ljust()、rjust()和center()方法
5.10 Python startswith()和endswith()
5.11 Python字符串大小写转换
5.12 Python去除字符串中空格
5.13 Python format()格式化输出方法
5.14 Python encode()和decode()方法
5.15 Python dir()和help()
Python流程控制 函数和lambda表达式 Python类和对象 类特殊成员(属性和方法) Python异常处理机制 Python模块和包 Python文件操作(I/O) 其中 string 用于指定要进行长度统计的字符串。
例如,定义一个字符串,内容为“http://c.biancheng.net”,然后用 len() 函数计算该字符串的长度,执行代码如下: >>> a='http://c.biancheng.net'
>>> len(a)
在实际开发中,除了常常要获取字符串的长度外,有时还要获取字符串的字节数。
在 Python 中,不同的字符所占的字节数不同,数字、英文字母、小数点、下划线以及空格,各占一个字节,而一个汉字可能占 2~4 个字节,具体占多少个,取决于采用的编码方式。例如,汉字在 GBK/GB2312 编码中占用 2 个字节,而在 UTF-8 编码中一般占用 3 个字节。
以 UTF-8 编码为例,字符串“人生苦短,我用Python”所占用的字节数如图 1 所示。 图 1 汉字和英文所占字节数 我们可以通过使用 encode() 方法,将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:
>>> str1 = "人生苦短,我用Python"
>>> len(str1.encode())
因为汉字加中文标点符号共 7 个,占 21 个字节,而英文字母和英文的标点符号占 6 个字节,一共占用 27 个字节。
同理,如果要获取采用 GBK 编码的字符串的长度,可以执行如下代码: >>> str1 = "人生苦短,我用Python"
>>> len(str1.encode('gbk'))

关注公众号「 站长严长生 」,在手机上阅读所有教程,随时随地都能学习。本公众号由 C语言中文网站长 亲自运营,长期更新,坚持原创。

微信扫码关注公众号