JS正则表达式学习笔记1

正则表达式作为前端学习的一个知识点，是每个合格的前端开发都应该掌握它的用法。正则表达式的学习确实不难，语法和应用也非常简单，能够快速入门，很轻松的就能写出简单的表达式来对字符串执行某些操作。网上也有标题党说一杯咖啡的时间就能学会。能学会吗？能！但要真正的掌握却不易，就好比篮球运动，40分钟的一节课，就能学会基本的规则和投球方法，但要做到非常优秀，就需要长时间的练习，学习正则表达式也一样，其实，学习任何知识和技能都是如此，唯有长时间的练习，尽量避免少犯错误，才能达到专业；废话说了一箩筐，下面进入正题；

在实际工作当中，正则表达式应用的场景有：

表单验证
1. 验证邮箱
2. 验证电话
3. 是否为空
4. etc
替换字符串
检索字符串
开发工具当中的查找和替换

简单来说，正则表达式是对字符串操作的一种逻辑公式，用一些约定好的字符组合对字符串执行检索、匹配、替换等操作。

本文会把学习路径分为两个阶段：

第一阶段，熟悉正则，有一个正确的认识，能够写出简单的正则表达式来操作字符串；

第二阶段，熟练运用正则的一些高级用法，掌握心法，需要时，信手拈来。

第一阶段

需要掌握的内容包括：

如何定义一个正则表达式
定义了正则，在那些方法中使用
元字符
字符类&字符转义
范围&量词
分支条件
反义

如何定义一个正则表达式

有两种方式：

通过实例化RegExp构造函数
1. 有两个参数，第一个是表达式，第二个是修饰符
使用字面量把正则写在两个反斜杠中间
1. 反斜杠中间是表达式，修饰符紧跟在最后一个/后面

DEMO

// 实例化RegExp类定义
const reg = new RegExp("\\d",'g');

// 字面量//定义
const reg = /\d/g;

let str = "mmcai18is94a99boy";
let result = str.replace(reg," ")

console.log(str)
// 结果：mmcai18is94a99boy
console.log(result)
// 结果：mmcai is a body

// 字符串的replace方法不会修改原字符串，会返回一个新的字符串

修饰符

g：全文搜索，匹配到第一个就结束
i：忽略大小写
m：多行搜索

对象属性

global：对象是否具有标志g；结果是布尔值
ignoreCase：对象是否具有标志i；结果是布尔值
lastIndex：一个整数，标识开始下一次匹配的字符位置；结果是数字
multiline：对象是否具有标志m；结果是布尔值
source：正则表达式的源文本；结果是字符串

let patt = /[a-z]\d/gim;

patt.global = true;
patt.ignoreCase = true;
patt.multiline = true;
patt.source = "[a-z]\d"

工作空间

其实这里想要表达的是正则表达式可以在那些方法上使用；

应用场景可以分为两种情况

正则对象本身具有的一些方法
1. test：检索字符串中指定的值。返回true或false
2. exec：检索字符串中指定的值。找到返回数组，否则返回null
3. compile：改变正则表达式，不常用
一些字符串操作方法当中
1. String.replace：替换与正则表达式匹配的字符串
2. String.search：检索与正则表达式相匹配的值
3. String.split：把字符串分割为字符串数组
4. String.match：找到一个或多个正则表达式的匹配

DEMO

// test 判断字符串是否符合我们定义的规则
// 表单验证的时候，可以使用test验证：手机号，邮箱，身份证号码，银行卡等数据是否合法
let patt = /1[35789]\d{9}/;
let str = "13588322792"
let flag = patt.test(str);
console.log(flag);

// exec 当没有全局修饰符的时候，函数的作用和match函数一样，如果匹配到返回一个数组，否则返回null
// 把以下代码放入编辑器，查看结果
var str="I love antzone ,this is animate";
var reg=/[a-z]{2}/;
var result = reg.exec(str);
console.log(result);

// result数组有至少两个值，外加两个属性input和index
- result[0]:匹配的字符串
- result[1]：存放第一个分组匹配的值，否则为undefined
- result[2]：存放第二个分组匹配的值，否则没有改项
- result[n]：存放第n个分组匹配的值，否则没有该项
result.index = 匹配字符串的索引
result.input = 要匹配字符串完整的引用


// exec 有全局修饰符g的时候，此函数返回值同样是一个数组，并且也只能够在字符串中匹配一次。不过此时，此函数一般会和lastIndex属性匹配使用，此函数会在lastIndex属性指定的字符处开始检索字符串，当exec()找到与表达式相匹配的字符串时，在匹配后，它将lastIndex 属性设置为匹配字符串的最后一个字符的下一个位置。可以通过反复调用exec()函数遍历字符串中的所有匹配，当exec()函数再也找不到匹配的文本时，它将返回null，并把lastIndex 属性重置为0。
数组的内容结构和没有g修饰符时完全相同。

var str="the name 123 and 456";
var reg=/\d/g;
reg.lastIndex=15;
console.log(reg.exec(str));

String.search

search不执行全局匹配，会忽略修饰符g。

如果匹配到，返回匹配值所在的索引，否则返回-1

var str="Visit W3School!"
var r = str.search(/w3school/);
console.log(r);

String.replace

返回一个新的字符串，是替换后得到的新值。

replace有两个参数：

第一个可以是字符串，也可以是正则表达式
第二个可以是字符串，也可是function

如果第二个是字符串，字符串中的$字符有特定的含义

字符	说明
$1…$99	子表达式匹配的文本
$&	与regexp想匹配的字符串
$`	位于子匹配字符串左侧的文本
$’	位于子表达式匹配内容右侧的文本
$$	直接量符号

1.简单用法
var str="Visit Microsoft!"
var res = str.replace(/Microsoft/, "W3School");
console.log(res);

2.修饰符g,全局匹配
var str="Welcome to Microsoft! "
str=str + "We are proud to announce that Microsoft has "
str=str + "one of the largest Web Developers sites in the world."

var res = str.replace(/Microsoft/g, "W3School");
console.log(res);

3.修饰符i,忽略大小写
var text = "javascript Tutorial";
var res = text.replace(/javascript/i, "JavaScript");
console.log(res)

4.字符中的$
var name = "Doe, John";
var res =  name.replace(/(\w+)\s*, \s*(\w+)/, "$2 $1");
console.log(res)

5.
var name = '"a", "b"';
var res = name.replace(/"([^"]*)"/g, "'$1'");

6.第二个参数是函数
var name = 'aaa bbb ccc';
var uw=name.replace(/\b\w+\b/g, function(word){
  return word.substring(0,1).toUpperCase()+word.substring(1);}
);

String.match

匹配到就返回一个数组，数组结构参考上面的exec方法，否则返回null

var str="Hello world!"
var res1 = str.match("world");
var res2 = str.match("World");
console.log(res1);
console.log(res2);


var str="1 plus 2 equal 3"
var res3 = str.match(/\d+/g);
console.log(res3);

String.split

把字符串分割成字符串数组。

返回一个字符串数组。

1.
var str="How are you doing today?"
var res1 = str.split(" ");
var res2 = str.split("");
var res3 = str.split(" ",3);

2.
var words = str.split(/\s+/)

3.
"hello".split("")

元字符

一般情况下，正则表达式的一个字符对应字符串的一个字符。
如果我们想要匹配一类的字符的时候，就可以通过元字符来处理，常用的元字符有：

代码	说明
.	匹配除换行符以外的任意字符
w	匹配字母或数字或下划线或汉字
s	匹配任意的空白符（包括空格，制表符(Tab)，换行符，中文全角空格等）
d	匹配数字
b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束

DEMO

1.匹配前后都是空格的字符串
let reg = /\b\w+\b/g;
let str = "my name is mmcai";
str.replace(reg,"xx");

2.修改时间格式2019 07 18为2019/07/18
let reg = /\s/g;
let str = "2019 07 18";
str.replace(reg,"-");

3.匹配不是特殊符号的字符串
var str="Give 100%!";
var patt1=/\w/g;

4.匹配以Is开头的字符串
var str="Is this his";
var patt1=/^Is/g;

5.对数字进行全局搜索
var str="Give 100%!";
var patt1=/\d/g;

6.对字符串结尾是is的进行匹配
var str="Is this his";
var patt1=/is$/g;

字符类&范围类&字符转义

要想查找数字，字母或数字，空白我们可以根据上面一节提到的元字符来匹配。但是如果想匹配的字符集合没有预定义的元字符集合，怎么办？这时候我们就可以通过定义字符类类的形式进行匹配。

例如

[.?!]——匹配表单符号（.或?或!)
[abc]——匹配字符a或b或c
[aeiou]——匹配任何一个英文元音字母

除了以上方式，我们还可以通过-来指定一个字符范围。

例如

[0-9]——匹配0到9的任意数字，含义和 \d 元字符一样
[a-zA-Z]——匹配26个英文字符，大小写都行

特点

使用元字符[]来构建一个简单的类
使用-字符定义一个字符范围
所谓类就是符合某些特性的对象，一个泛指，不是指某个字符

DEMO

1.匹配开头是a或b或c紧跟一个数字的字符
var reg =/[abc]\d/g;
var str = "a1b2c3d4";
str.replace(reg,"-");
// result = "---d4";

2.匹配a到h之间的字符
var str="Is this all there is?";
var patt1=/[a-h]/g;

字符转义理解起来相对简单，所谓的转义其实是转义我们的元字符，有时候我们需要匹配那些元字符本身的字符串，
就可以通过在元字符前面添加来进行转义；

例如下面一些例子：

// 匹配元字符.
let reg = /\./;

// 匹配元字符/
let reg = /\//

//匹配元字符*
let reg = /\*/

//匹配字符类的[]
let reg = /\[\]/

// 匹配\本身
let reg = /\\/;

量词

就是表示匹配的数量，我们可以通过一些限定符类指定匹配重复的数量

代码	说明

| 重复0次或更多次
| 重复一次或更多次

? | 重复0次或一次
{n} | 重复n次
{n,} | 重复n次或更多次
{n,m} | 重复n到m次

DEMO

// 匹配window后面跟1个或多个数字的字符
let reg = /window\d+/;

// 匹配字符的第一个单词
let reg = /^\w+/

//匹配时间格式为YYYY-MM-DD的字符串
let reg = /\d{4}(-\d{2}){2}$/;
let str = "2019-07-18";

//为了 避免匹配到"2019-07-1234124"这样的字符串，添加$结尾符号
reg.test(str)

分支条件

有时候我们匹配的时候，规则不是单一的，可能有多个规则，我们就可以通过分支条件来实现。

比如，我们想要匹配固定电话，有些是三位区号，八位本地号，有些是四位区号，7位本地号，我们就可以如下写:

let reg = /0\d{2}-\d{8}|0\d{3}-\d{7}/

DEMO

1. 匹配IP
let reg = /^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/
let str = "192.168.0.253";
reg.test(str);

// 必须添加^，否则会匹配315.168.0.254这样的字段中的15.168.0.254这一段

反义

反义就是取相反，例如d是匹配数字，D就是匹配不是数字的字符，s匹配空白符字符，S匹配不是空白符的字符。
在字符类中我们也可以使用^表示反义，¹匹配除abc以外的字符，常见的反义代码如下：

代码	说明
W	匹配任意不是字母、数字、下划线、汉字的字符
S	匹配任意不是空白符的字符
D	匹配任意不是数字的字符
B	匹配不是单词开头或结束位置的字符
²	匹配除x以外的任意字符
³	匹配除aeiou以外的任意字符

DEMO

参考匹配IP地址里面，是如何匹配.这个元字符的

abc ↩
x ↩
aeiou ↩

第一阶段

如何定义一个正则表达式

工作空间

元字符

字符类&范围类&字符转义

量词

分支条件

反义

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

JS正则表达式学习笔记1

第一阶段

如何定义一个正则表达式

工作空间

元字符

字符类&范围类&字符转义

量词

分支条件

反义

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复