总结文本文件的编码格式

46次阅读

共计 319 个字符,预计需要花费 1 分钟才能阅读完成。

常见的编码格式 ascii,utf-8

一,ascii

计算机中只有 256 个 ascii 字符
一个 ascii 字符在内存空间中占用一个字节

python2.x 默认使用此编码格式

若在 2.x 中使用中文,需要在 python 文件的首行加上如下格式,则 python 解释器便会以 utf- 8 来处理此 python 文件,

– coding:utf-8 –

若需要对中文进行遍历或者切片操作,还需要在中文字符前加上 u
a1 = u’ 哈哈,你好 ’

二,utf-8

计算机中使用 1 - 6 个字节来表示一个 utf- 8 字符,涵盖了地球上所有的文件
大多数中文会使用 3 个字节来表示
utf- 8 是 unicode 编码的一种

python3.x 默认使用此编码格式,所以使用中文时,不需要再指定 utf- 8 编码格式。

正文完
 0