相关文章推荐
想表白的四季豆  ·  经济警察,管的是哪一段?——图解“另类公安” ...·  6 月前    · 
大方的柚子  ·  视频去哪了呢?_哔哩哔哩_bilibili·  10 月前    · 
冷静的茶壶  ·  35岁成职场荣枯线:你是人力资源,还是人力成 ...·  1 年前    · 
腼腆的伤疤  ·  五显镇公交站房工程修建性详细规划公示_舒城县 ...·  1 年前    · 
善良的鞭炮  ·  乾隆当了近3年的太上皇帝,89岁驾崩,这期间 ...·  1 年前    · 
Code  ›  python文本文件的编码格式:ASCII和UNICODE开发者社区
python unicode 字符编码 ascii文件
https://cloud.tencent.com/developer/article/2136998
焦虑的铁板烧
11 月前
python自学网

python文本文件的编码格式:ASCII和UNICODE

原创
前往小程序,Get 更优 阅读体验!
立即前往
腾讯云
开发者社区
文档 建议反馈 控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
python自学网
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
社区首页 > 专栏 > python文本文件的编码格式:ASCII和UNICODE

python文本文件的编码格式:ASCII和UNICODE

原创
作者头像
python自学网
发布 于 2022-10-17 17:26:38
1.9K 0
发布 于 2022-10-17 17:26:38
举报
文章被收录于专栏: python+前端 知识分享

文本文件存储的内容是基于字符编码的文件,常见的编码有ASCII、UNICODE等

  • Python2.x默认使用ASCII编码
  • Python3.x默认使用UTF-8编码

一、ASCII编码和UNICODE编码

1.1》ASCII编码

ASCII编码可以说是最古老的编码了,是因为计算机最早是美国人发明的,美国人为了在计算机中使用自己的英语就制定了ASCII编码。

  • 计算机中只有256个ASCII字符
  • 一个ASCII在内存中占用一个字节的空间
  • 8个0/1的排列组合方式一共有256种,也就是2**8

ASCCI编码只有256个字符,虽然可以涵盖26个英文,但是汉子有数以万计的字符,ASCII编码并不能满足我们,因此UNICODE编码诞生。

1.2》UNICODE编码

UTF-8编码格式:

  • UTF-8是UNICODE编码的一种编码格式
  • 计算机中使用1~6个字节表示一个UTF-8字符,涵盖了地球上几乎所有地区的文字
  • 大多数汉子会使用3个字节表示

二、在Python2.x中如何使用中文

1、在python2.x文件的第一行增加以下代码,解释器会以UTF-8编码来处理Python文件

代码语言: javascript
复制
# *-* coding:utf8 *-*

提示: 这种方式是官方推荐使用过的。

2、也可这样,=号两边不要空格

代码语言: javascript
复制
# coding=utf8

问题:

在python2.x中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串

答:

要能够正确的遍历字符串,在定义字符串时,需要在字符串的引导前增加一个小写字母u,告诉解释器这事一个unicode字符串(是使用UTF-8编码更是的字符串)

代码:这段代码在python2.x中汉子会出现很多符号

代码语言: python
代码 运行次数: 0
复制
str = u"Python自学网"
for a in str:
 
推荐文章
想表白的四季豆  ·  经济警察,管的是哪一段?——图解“另类公安”的几起几落_上海
6 月前
大方的柚子  ·  视频去哪了呢?_哔哩哔哩_bilibili
10 月前
冷静的茶壶  ·  35岁成职场荣枯线:你是人力资源,还是人力成本?-新华网
1 年前
腼腆的伤疤  ·  五显镇公交站房工程修建性详细规划公示_舒城县人民政府
1 年前
善良的鞭炮  ·  乾隆当了近3年的太上皇帝,89岁驾崩,这期间他都干了什么?_腾讯新闻
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号