文件编码问题

概念:出现再咱们眼前的所有文字字符都是unicode 字符集, unicode 字符集如何保留?通常是用不同的编码编码成字节来存储,常见的有utf-8, gb2312等

  • windows 默认编码是gb2312
  • latin-1 兼容 ascii

文件乱码问题

乱码通常是咱们无奈用正确的解码形式来将字节解码成unicode, 而呈现乱码
  • unicode 通过编码方式1 编码成字节存储,咱们用编码方式2 将字节解码成unicode
  • 编码1与编码2 不统一就会呈现乱码问题;

vim 编码的几个配置

  • encoding: vim 软件自身的编码方式,通常不必批改;
  • fileencoding: 设置vim 保留文件的编码方式;
  • fileencodings: vimrc 配置中候选的编码方式,当开打一个文件时,会从中抉择适合的编码方式关上文件(将字节解码成unicode 出现再咱们眼前)

    通常配置成这个 set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1

如何用特定的编码关上文件

当文件的编码不在fileencodings中,就会呈现乱码
  • 如果咱们晓得文件的编码,能够用 edit ++enc=gb2312 这种形式批改文件关上的编码;

latin-1 的作用

因为latin-1 兼容 ascii, 所以在代码中不理解文件的编码方式时,可用此编码关上文件,尽管会呈现乱码,但不会呈现谬误;