关于javascript:js学习笔记5字符串

6次阅读

共计 2325 个字符,预计需要花费 6 分钟才能阅读完成。

留神点

  • 值得注意的是,在 js 中,单引号和双引号都能够示意字符串。而且,在单引号字符串的外部,能够间接应用双引号;双引号字符串的外部,能够间接应用单引号。
'key ="value"'"It's a long journey"

然而,若要在单引号字符串的外部,应用单引号,就必须在外部的单引号后面加上反斜杠,用来本义。双引号字符串外部应用双引号,也是如此。

'Did she say \'Hello\'?'
// "Did she say'Hello'?"

"Did she say \"Hello\"?"
// "Did she say"Hello"?"

在日常编程中,咱们要保持一种格调,例如总是用双引号示意字符串,而在外部应用单引号

  • 另外,字符串默认只能写在一行内,分成多行会报错。
'a
b
c'
// SyntaxError: Unexpected token ILLEGAL

若长字符串必须要分成多行,能够在每行尾部应用反斜杠。但要留神,反斜杠后边必须是换行符,而不能有空格等其余字符,否则会报错

var longString = 'Long \
long \
long \
string';

longString
// "Long long long string"

或者,咱们也能够应用连贯运算符(+),连贯多个单行字符串。

var longString = 'Long'
  + 'long'
  + 'long'
  + 'string';

然而,上边的两种办法,输入的时候还是单行,成果与写在同一行齐全相似。若想输入多行字符串,有一种利用多行正文的变通方法。

(function () { /*
line 1
line 2
line 3
*/}).toString().split('\n').slice(1, -1).join('\n')
// "line 1
// line 2
// line 3"

本义

反斜杠(\)在字符串内有非凡含意,用来示意一些特殊字符,所以又称为本义符。

须要用反斜杠本义的特殊字符,次要有上面这些。

  • \0:null(\u0000
  • \b:后退键(\u0008
  • \f:换页符(\u000C
  • \n:换行符(\u000A
  • \r:回车键(\u000D
  • \t:制表符(\u0009
  • \v:垂直制表符(\u000B
  • \':单引号(\u0027
  • \":双引号(\u0022
  • \\:反斜杠(\u005C

若字符串的失常内容之中,须要蕴含反斜杠,则反斜杠后面须要再加一个反斜杠,用来对本身本义。

"Prev \\ Next"
// "Prev \ Next"

字符串与数组的雷同与差别

  • 雷同:

能够应用数组的方括号运算符,用来返回某个地位的字符(地位编号从 0 开始)。

var s = 'hello';
s[0] // "h"
s[1] // "e"
s[4] // "o"

// 间接对字符串应用方括号运算符
'hello'[1] // "e"

然而,若方括号中的数字超过字符串的长度,或者方括号中基本不是数字,则返回undefined

'abc'[3] // undefined
'abc'[-1] // undefined
'abc'['x'] // undefined
  • 差别:

数组能够独自扭转某个字符,字符串不能够。字符串外部的单个字符无奈扭转和增删,这些操作会默默的失败

var s = 'hello';

delete s[0];
s // "hello"

s[1] = 'a';
s // "hello"

s[5] = '!';
s // "hello"
  • length 属性:返回字符串的长度。这里要留神的是,因为每个字符在 js 外部都是以 16 位(即 2 个字节)的 UTF-16 格局贮存,即 js 的单位字符固定长度为 2 个字节。

然而,UTF-16 有两种长度:对于码点在 U+0000U+FFFF之间的字符,长度为 16 位(即 2 个字节);对于码点在 U+10000U+10FFFF之间的字符,长度为 32 位(即 4 个字节),而且前两个字节在 0xD8000xDBFF之间,后两个字节在 0xDC000xDFFF之间。举例来说,码点 U+1D306 对应的字符为 ????, 它写成 UTF-16 就是0xD834 0xDF06

所以,js 对 UTF-16 的反对是不欠缺的,对四字节的字符,会辨认为两个字符。因而,length 返回的字符串长度可能是不正确的

js 的 Base64 转码办法

Base64 是一种编码方法,能够将任意值转成 0~9、A~Z、a-z、+/ 这 64 个字符组成的可打印字符。应用它的次要目标,不是为了加密,而是为了不呈现特殊字符,简化程序的解决。

如有时文本里蕴含一些不可打印的符号(ASCII 码 0 到 31 的符号都无奈打印进去),这时能够应用 Base64 编码,将它们转成能够打印的字符;或者须要以文本格式传递二进制数据,那么也能够应用 Base64 编码。

js 原生提供两个 Base64 相干的办法。

  • btoa():任意值转为 Base64 编码
  • atob():Base64 编码转为原来的值
var string = 'Hello World!';
btoa(string) // "SGVsbG8gV29ybGQh"
atob('SGVsbG8gV29ybGQh') // "Hello World!"

留神,这两个办法不适宜非 ASCII 码的字符,会报错。

btoa('你好') // 报错

要将非 ASCII 码字符转为 Base64 编码,必须两头插入一个转码环节,再应用这两个办法。

function b64Encode(str) {return btoa(encodeURIComponent(str));
}

function b64Decode(str) {return decodeURIComponent(atob(str));
}

b64Encode('你好') // "JUU0JUJEJUEwJUU1JUE1JUJE"
b64Decode('JUU0JUJEJUEwJUU1JUE1JUJE') // "你好"
正文完
 0