文件编码问题
概念:出现再咱们眼前的所有文字字符都是unicode 字符集, unicode 字符集如何保留?通常是用不同的编码编码成字节来存储,常见的有utf-8, gb2312等
- windows 默认编码是gb2312
- latin-1 兼容 ascii
文件乱码问题
乱码通常是咱们无奈用正确的解码形式来将字节解码成unicode, 而呈现乱码
- unicode 通过编码方式1 编码成字节存储,咱们用编码方式2 将字节解码成unicode
- 编码1与编码2 不统一就会呈现乱码问题;
vim 编码的几个配置
- encoding: vim 软件自身的编码方式,通常不必批改;
- fileencoding: 设置vim 保留文件的编码方式;
fileencodings: vimrc 配置中候选的编码方式,当开打一个文件时,会从中抉择适合的编码方式关上文件(将字节解码成unicode 出现再咱们眼前)
通常配置成这个 set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1
如何用特定的编码关上文件
当文件的编码不在fileencodings中,就会呈现乱码
- 如果咱们晓得文件的编码,能够用
edit ++enc=gb2312
这种形式批改文件关上的编码;
latin-1 的作用
因为latin-1 兼容 ascii, 所以在代码中不理解文件的编码方式时,可用此编码关上文件,尽管会呈现乱码,但不会呈现谬误;