文件编码问题
概念:出现再咱们眼前的所有文字字符都是 unicode 字符集,unicode 字符集如何保留?通常是用不同的编码编码成字节来存储,常见的有 utf-8, gb2312 等
- windows 默认编码是 gb2312
- latin-1 兼容 ascii
文件乱码问题
乱码通常是咱们无奈用正确的解码形式来将字节解码成 unicode, 而呈现乱码
- unicode 通过编码方式 1 编码成字节存储,咱们用编码方式 2 将字节解码成 unicode
- 编码 1 与编码 2 不统一就会呈现乱码问题;
vim 编码的几个配置
- encoding: vim 软件自身的编码方式,通常不必批改;
- fileencoding: 设置 vim 保留文件的编码方式;
-
fileencodings: vimrc 配置中候选的编码方式,当开打一个文件时,会从中抉择适合的编码方式关上文件(将字节解码成 unicode 出现再咱们眼前)
通常配置成这个 set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1
如何用特定的编码关上文件
当文件的编码不在 fileencodings 中,就会呈现乱码
- 如果咱们晓得文件的编码,能够用
edit ++enc=gb2312
这种形式批改文件关上的编码;
latin-1 的作用
因为 latin-1 兼容 ascii, 所以在代码中不理解文件的编码方式时,可用此编码关上文件,尽管会呈现乱码,但不会呈现谬误;