str.encode([encoding="utf-8"][,errors="strict"])
  • str:表示需要转换的字符串
  • encoding=“utf-8”:可选参数,用于指定进行转码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。当只有这一个参数时,也可以省略前面的“encoding=”,直接写编码。
  • errors=“strict”:可选参数,用于指定错误处理方式,其可选择值可以是strict(遇到非法字符就抛出异常)、ignore(忽略非法字符)、replace(用"?"替换非法字符) 或 xmlcharrefreplace(使用XML的字符引用)等,默认strict。

UTF-8示例代码:

verse = "野渡无人舟自横"
byte = verse.encode()
print("原始字符串:", verse)
print("转换后的二进制数据:", byte)
执行结果:
	原始字符串: 野渡无人舟自横
	转换后的二进制数据: b'\xe9\x87\x8e\xe6\xb8\xa1\xe6\x97\xa0\xe4\xba\xba\xe8\x88\x9f\xe8\x87\xaa\xe6\xa8\xaa'

GBK代码示例:

verse = "野渡无人舟自横"
byte = verse.encode('GBK')
print("原始字符串:", verse)
print("转换后的二进制数据:", byte)
执行结果:
	原始字符串: 野渡无人舟自横
	转换后的二进制数据: b'\xd2\xb0\xb6\xc9\xce\xde\xc8\xcb\xd6\xdb\xd7\xd4\xba\xe1'

使用decode()方法解码

decode()方法为bytes对象的方法用于将二进制数据转换为字符串,即将使用encode()方法转换的结果再转换为字符串,也称为“解码”。

bytes.decode([encoding="utf-8"][,errors="strict"])
  • bytes:表示要进行转换的二进制数据,通常是encode()方法转换的结果。
  • encoding=“utf-8”:可选参数,用于指定进行解码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。当只有这一个参数时,也可以省略前面的“encoding=”,直接写编码。

示例代码:

verse = "野渡无人舟自横"
byte = verse.encode('GBK')
print("原始字符串:", verse)
print("转换后的二进制数据:", byte)
print('解码后的结果:', byte.decode('gbk'))
执行结果:
	原始字符串: 野渡无人舟自横
	转换后的二进制数据: b'\xd2\xb0\xb6\xc9\xce\xde\xc8\xcb\xd6\xdb\xd7\xd4\xba\xe1'
	解码后的结果: 野渡无人舟自横
                    使用encode()方法编码str.encode([encoding="utf-8"][,errors="strict"])str:表示需要转换的字符串encoding=“utf-8”:可选参数,用于指定进行转码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。当只有这一个参数时,也可以省略前面的“encoding=”,直接写编码。errors=“str...
				
本文实例讲述了python判断字符串编码的方法。分享给大家供大家参考,具体如下: 安装chardet模块 chardet文件夹放在/usr/lib/python2.4/site-packages目录下 [root@sha-sso-data01 chardet]# python Python 2.4.3 (#1, Sep 21 2011, 19:55:41) [GCC 4.1.2 20080704 (Red Hat 4.1.2-51)] on linux2 Type "help", "copyright", "credits" or "license" for more information
@author:Honfeiyinxue,2022年4月26日 :str_input 输入待转换为二进制的字符串: :return: 输出元组,元组的4个元素分别是字符串的原始字符( str_output_origi)对应的二进制(string_output_binary), 十进制(string_output_decimal)、十六进制编码(string_output_he
参考博文:https://blog.csdn.net/gdh756462786/article/details/79161525 数据中有分类属性,往往是非数值类型,需要转化为数值属性。 1.头文件 from sklearn.preprocessing import LabelEncoder #用于Label编码 from sklearn.preprocessing import O...
python中的编码转换十六进制与中文概念十六进制转中文1、要转换的类似\\xe8\\xa7\\xa3,且为字符串2、要转换的类似\xe8\xa7\xa3,且为字符串URL的编码与解码url编码 十六进制与中文 \x开头的编码是十六进制字符,\x后面跟的字符即为十六进制的字符串。 十六进制转中文 1、要转换的类似\xe8\xa7\xa3,且为字符串 info = '\\xe8\\xa7\\xa3\\xe6\\x9e\\x84\\xe6\\x89\\xb9\\xe8\\xaf\\x84\\xe6\\x8
主要介绍了python编码机制,unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1 等编码之间的转换。 常见的编码转换分为以下几种情况: 自动识别 字
首先要搞清楚,字符串Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码字符串转换成unicod...