正则表达式使用笔记

jiezi

5 年前

欢迎关注我的公众号 睿 Talk，获取我最新的文章：

正则表达式在做一些小工具的时候特别实用，但想掌握好并不是一件容易的事情。最近又专门花时间学习了下，顺手记录一些心得。

好用的测试网站：https://regex101.com/
特殊字符，使用时需要转义

{} [] / \ + * . $ ^ | ?

元字符	描述
.	句号匹配任意单个字符除了换行符.
[]	字符种类. 匹配方括号内的任意字符.
*	匹配 >= 0 个重复的在 * 号之前的字符.
+	匹配 >= 1 个重复的 + 号前的字符.
?	标记? 之前的字符为可选.
{n,m}	匹配 num 个大括号之前的字符 (n <= num <= m).
(xyz)	字符集, 匹配与 xyz 完全相等的字符串.
\|	或运算符, 匹配符号前或后的字符.
\	转义字符, 用于匹配一些保留的字符 `[] () {} . * + ? ^ $ \|`
^	从开始行开始匹配.
$	从末端开始匹配.

贪婪 & 非贪婪

正则表达式默认采用贪婪匹配模式，在该模式下意味着会匹配尽可能长的子串。我们可以使用 ? 来修饰以下字符*, +, ?, {}，将贪婪匹配模式转化为非贪婪匹配模式：

/.*at/ => The fat cat sat on the mat
/.*?at/ => The fat cat sat on the mat

或运算

对单个字符的或运算，可以使用字符集：
/[aeiou]/ => hello world
或者或运算符：
/a|e|i|o|u/ => hello world
但如果是多个字符，只能使用或运算符：
/apple|banana/ => i like apple and banana

捕获组 & 非捕获组

捕获组: (x)，非捕获组: (?:x)。

捕获组可以被引用，引用的时候是实际匹配上的字符，而不是对应的正则。
(\w+)\s\1可以匹配 hi hi，但不能匹配hi ho，因为这里的\1 是hi，而不是正则\w+

非捕获组主要用于多个字符的匹配，如 /(?:foo){1,2}/ 匹配 foo 这个单词连续出现 1 到 2 次。如果写成/foo{1,2}/，则只会匹配最后一个o1 到 2 次，而不是整个单词。

先行断言 & 后行断言

符号	描述	例子
?=	正先行断言 - 存在	/g(?=o)/ => go
?!	负先行断言 - 排除	/g(?!o)/ => ga
?<=	正后发断言 - 存在	/(?<=o)k/ => ok
?<!	负后发断言 - 排除	/(?<!o)k/ => gk

/g的坑

const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // false
reg.test("hi dickens"); // true

同一个正则，同一个字符串，为什么会有不同的结果？？？

当有 /g 参数时，下次运行 test 是会基于上一次的匹配位置再继续匹配后面的字符。

const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // 继续匹配后面的字符 'dickens'，找不到所有返回 false
reg.test("hi dickens"); // 因为上一次匹配为 false，从新开始一次匹配，所以返回 true

去掉 \g 参数或者每次重新生成一个正则就能解决这一问题。

正则表达式博大精深，如果你遇到什么坑或者有什么使用心得欢迎留言，大家共同来丰富这篇文章。

正则表达式使用笔记

一、前言

二、笔记

三、总结