Python3中普通ASCII编码字符串没有decode()方法,UTF-8编码的字符串有decode()方法
举例如下
普通字符串没有decode()方法
ch='\xe5\xa5\xbd'
print(ch)
结果:好 (按ASCII字符打印)
UTF-8编码表示方式:a=b'\xe5\xa5\xbd' (注意字符串前的b必须有,否则会认为ASCII编码)
UTF-8编码----->中文
a=b'\xe5\xa5\xbd\xe5\xa5\xbd\xe5\xad\xa6\xe4\xb9\xa0'.decode("utf-8")
print(a)
结果:好好学习
中文打印Unicode编码
c=b'\xe5\xa5\xbd\xe5\xa5\xbd\xe5\xad\xa6\xe4\xb9\xa0'.decode("utf-8").encode("unicode_escape")
print(c)
结果:b'\\u597d\\u597d\\u5b66\\u4e60'
若对你有用,请点个赞!
要在
Python
中将一个
字符串
从
UTF-8
编码
转换
为
Unicode
编码
,可以使用内置函数 str.decode()。例如:
# 假设 `s` 是一个
UTF-8
编码
的
字符串
s = b'hello \xe4\xbd\xa0\xe5\xa5\xbd'
# 使用 `decode()` 将其
转换
为
Unicode
编码
u = s.decode('
utf-8
')
print(u) # ...
# encoding:
utf-8
''' Created on 2015年2月8日
import chardet
def myto
utf8
(s): return mytounico...
你可以使用
Python
的内置函数 decode() 将一个
字符串
从
UTF-8
编码
转换
成
Unicode
编码
。
例如,假设你有一个
字符串
s 已经被
编码
成
UTF-8
,你可以使用如下代码将其
转换
成
Unicode
编码
:
s_
unicode
= s.decode('
utf-8
')
print('s1=',s1)
s2='\\u65f6\\u4e0d\\u53ef\\u5931\\uff0c\\u65f6\\u4e0d\\u518d\\u6765\\uff01'
print('s2=',s2)
在
Python
中,我们可以使用 `encode()` 方法将
Unicode
字符串
转换
为
UTF-8
编码
。
例如,假设我们有一个
Unicode
字符串
`my_string`,我们可以使用下面的代码将其
转换
为
UTF-8
编码
:
```
python
my_string = u'你好,世界!'
utf8
_string = my_string.encode('
utf-8
')
print(
utf8
_string)
输出结果为:
b'\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8c\xe4\xb8\x96\xe7\x95\x8c\xef\xbc\x81'
其中 `b''` 表示一个字节
字符串
,`\x` 后面的两个字符表示一个字节的十六进制值。注意,在
Python
3 中,
字符串
默认使用
Unicode
编码
,因此我们需要在
字符串
前加上 `u` 前缀指定其为
Unicode
字符串
。