共计 1317 个字符,预计需要花费 4 分钟才能阅读完成。
欢迎关注我的公众号 睿 Talk
,获取我最新的文章:
一、前言
正则表达式在做一些小工具的时候特别实用,但想掌握好并不是一件容易的事情。最近又专门花时间学习了下,顺手记录一些心得。
二、笔记
- 好用的测试网站:https://regex101.com/
- 特殊字符,使用时需要转义
{} [] / \ + * . $ ^ | ?
元字符 | 描述 |
---|---|
. | 句号匹配任意单个字符除了换行符. |
[] | 字符种类. 匹配方括号内的任意字符. |
* | 匹配 >= 0 个重复的在 * 号之前的字符. |
+ | 匹配 >= 1 个重复的 + 号前的字符. |
? | 标记? 之前的字符为可选. |
{n,m} | 匹配 num 个大括号之前的字符 (n <= num <= m). |
(xyz) | 字符集, 匹配与 xyz 完全相等的字符串. |
| | 或运算符, 匹配符号前或后的字符. |
\ | 转义字符, 用于匹配一些保留的字符 [] () {} . * + ? ^ $ |
|
^ | 从开始行开始匹配. |
$ | 从末端开始匹配. |
- 贪婪 & 非贪婪
正则表达式默认采用贪婪匹配模式,在该模式下意味着会匹配尽可能长的子串。我们可以使用 ?
来修饰以下字符*, +, ?, {}
,将贪婪匹配模式转化为非贪婪匹配模式:
/.*at/ => The fat cat sat on the mat
/.*?at/ => The fat cat sat on the mat
- 或运算
对单个字符的或运算,可以使用字符集:
/[aeiou]/ => hello world
或者或运算符:
/a|e|i|o|u/ => hello world
但如果是多个字符,只能使用或运算符:
/apple|banana/ => i like apple and banana
- 捕获组 & 非捕获组
捕获组: (x)
,非捕获组: (?:x)
。
捕获组可以被引用,引用的时候是实际匹配上的字符,而不是对应的正则。(\w+)\s\1
可以匹配 hi hi
,但不能匹配hi ho
,因为这里的\1
是hi
,而不是正则\w+
非捕获组主要用于多个字符的匹配,如 /(?:foo){1,2}/
匹配 foo
这个单词连续出现 1 到 2 次。如果写成/foo{1,2}/
,则只会匹配最后一个o
1 到 2 次,而不是整个单词。
- 先行断言 & 后行断言
符号 | 描述 | 例子 |
---|---|---|
?= | 正先行断言 - 存在 | /g(?=o)/ => go |
?! | 负先行断言 - 排除 | /g(?!o)/ => ga |
?<= | 正后发断言 - 存在 | /(?<=o)k/ => ok |
?<! | 负后发断言 - 排除 | /(?<!o)k/ => gk |
-
/g
的坑
const reg = /hi/g;
reg.test("hi dickens"); // true
reg.test("hi dickens"); // false
reg.test("hi dickens"); // true
同一个正则,同一个字符串,为什么会有不同的结果???
当有 /g
参数时,下次运行 test
是会基于上一次的匹配位置再继续匹配后面的字符。
const reg = /hi/g;
reg.test("hi dickens"); // true
reg.test("hi dickens"); // 继续匹配后面的字符 'dickens',找不到所有返回 false
reg.test("hi dickens"); // 因为上一次匹配为 false,从新开始一次匹配,所以返回 true
去掉 \g
参数或者每次重新生成一个正则就能解决这一问题。
三、总结
正则表达式博大精深,如果你遇到什么坑或者有什么使用心得欢迎留言,大家共同来丰富这篇文章。