正则表达式使用笔记

欢迎关注我的公众号睿Talk，获取我最新的文章：

一、前言

正则表达式在做一些小工具的时候特别实用，但想掌握好并不是一件容易的事情。最近又专门花时间学习了下，顺手记录一些心得。

二、笔记

好用的测试网站：https://regex101.com/
特殊字符，使用时需要转义

{ } [ ] / \ + * . $ ^ | ?

元字符	描述
.	句号匹配任意单个字符除了换行符.
[ ]	字符种类. 匹配方括号内的任意字符.
*	匹配>=0个重复的在*号之前的字符.
+	匹配>=1个重复的+号前的字符.
?	标记?之前的字符为可选.
{n,m}	匹配num个大括号之前的字符 (n <= num <= m).
(xyz)	字符集, 匹配与 xyz 完全相等的字符串.
\|	或运算符,匹配符号前或后的字符.
\	转义字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \|`
^	从开始行开始匹配.
$	从末端开始匹配.

贪婪 & 非贪婪

正则表达式默认采用贪婪匹配模式，在该模式下意味着会匹配尽可能长的子串。我们可以使用?来修饰以下字符*, +, ?, {}，将贪婪匹配模式转化为非贪婪匹配模式：

/.*at/ => The fat cat sat on the mat
/.*?at/ => The fat cat sat on the mat

或运算

对单个字符的或运算，可以使用字符集：
/[aeiou]/ => hello world
或者或运算符：
/a|e|i|o|u/ => hello world
但如果是多个字符，只能使用或运算符：
/apple|banana/ => i like apple and banana

捕获组 & 非捕获组

捕获组: (x)，非捕获组: (?:x)。

捕获组可以被引用，引用的时候是实际匹配上的字符，而不是对应的正则。
(\w+)\s\1可以匹配hi hi，但不能匹配hi ho，因为这里的\1是hi，而不是正则\w+

非捕获组主要用于多个字符的匹配，如/(?:foo){1,2}/匹配foo这个单词连续出现 1 到 2 次。如果写成/foo{1,2}/，则只会匹配最后一个o1 到 2 次，而不是整个单词。

先行断言 & 后行断言

符号	描述	例子
?=	正先行断言-存在	/g(?=o)/ => go
?!	负先行断言-排除	/g(?!o)/ => ga
?<=	正后发断言-存在	/(?<=o)k/ => ok
?<!	负后发断言-排除	/(?<!o)k/ => gk

/g的坑

const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // false
reg.test("hi dickens"); // true

同一个正则，同一个字符串，为什么会有不同的结果？？？

当有/g参数时，下次运行test是会基于上一次的匹配位置再继续匹配后面的字符。

const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // 继续匹配后面的字符' dickens'，找不到所有返回false
reg.test("hi dickens"); // 因为上一次匹配为 false，从新开始一次匹配，所以返回true

去掉\g参数或者每次重新生成一个正则就能解决这一问题。

三、总结

正则表达式博大精深，如果你遇到什么坑或者有什么使用心得欢迎留言，大家共同来丰富这篇文章。

一、前言

二、笔记

三、总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

正则表达式使用笔记

一、前言

二、笔记

三、总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复