大话javascript-8期正则表达式

42次阅读

共计 6554 个字符,预计需要花费 17 分钟才能阅读完成。

一、正则表达式的定义

正则表达式(Regular Expression,在代码中常简写为 regex、regexp 或 RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。
在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。(为字符串定义规则,为输入内容定义规则!)

正则表达式用于字符串处理、表单验证等场合,实用高效。

二、正则表达式声明

1. 通过构造函数定义

var 变量名 = new RegExp(/ 表达式 /);  

2. 通过直接量定义(较为常用)

var 变量名 = / 表达式 /;
console.log(regexp1.test(345));
console.log(/\d/.test(567));(直接使用)

3.test() 方法

正则对象方法,检测测试字符串是否符合该规则,返回 true 和 false,参数(测试字符串)

使用语法:Boolean = 表达式.test("要验证的内容");  
console.log(/\d/.test(567));
 验证  567 符不符合 \d 的规范

三、正则五大内部类(帮我们写好的工具直接使用)

1. 预定义类

 [^\n\r]    除了换行和回车之外的任意字符(“”不行)\d    [0-9]        数字字符
 \D    [^0-9]       非数字字符

 \s    [\t\n\x0B\f\r]     空白字符 
 \S    [^ \t\n\x0B\f\r]     非空白字符

 \w    [a-zA-Z_0-9]         单词字符
 \W    [^a-zA-Z_0-9]        非单词字符  

2. 简单类(正则:// 中什么特殊符号都不写,和 [] 的加入)

1)/string/.test(“string”); 必须是完整的,只多不能少

/andy/.test(“andy”)                     // true
/andy/.test(“andylv”)                  // true
/andy/.test(“an”)                      // false
一句话,只要完整包含了 andy 就可以了(有他就行)

2)/[string]/.test(“string”); 只要包含里面的任何一个就可以

   /[andy]/.test("andy");                  // true
   /[andy]/.test("an");                    // true
   /[andy]/.test("ady");                   // true
   /[andy]/.test("anll");                   // true
   /[andy]/.test("assd");               // true
   /[andy]/.test("ss");                   // false
   /[3aH8]/.test("ss");                   // false

3. 负向类(不能是其中的整体或者一部分)

中括号内,前面加个元字符 ^ 进行取反,不是括号里面的字符(一部分也不行)。
(可以不够,但是不能多)(不够和正好,返回 false;多了或者没有返回 true)

 console.log(/[^abc]/.test("iiii"));//true
 console.log(/[^abc]/.test("aiiii"));// 只有一部分睁一只眼闭一只眼 true
 console.log(/[^abc]/.test("abc"));// 刚好为 false
 console.log(/[^abc]/.test("b"));// 不够为 false
 console.log(/[^abc]/.test("bcdef"));// 只有一部分睁一只眼闭一只眼 true
 console.log(/[^abc]/.test("abcdef"));// 只有一部分睁一只眼闭一只眼 true
注意:  这个符号 ^  一定是写到方括号里面

4. 范围类

有时匹配的东西过多,而且类型又相同,全部输入太麻烦,我们可以在中间加了个横线

console.log(/[a-c]/.test("dghhj"));   //false
console.log(/[a-c]/.test("b"));       //true

5. 组合类

用中括号匹配不同类型的单个字符。console.log(/[a-m1-5]/.test("b"))//true

四、正则表达式的功能

正则表达式主要是 针对字符串进行操作 ,可以简化对字符串的复杂操作,其主要功能有 匹配 切割 替换 获取

1、匹配

检查字符串是否符合正则表达式中的规则,有一次不匹配,则返回 false。如:

String str="abc";
String reg="[a-zA-Z]\\d?";// 次表达式表示字符串的第一位只能是字母,第二位只能是数字或没有
boolean flag=str.matches(reg);// 返回结果为 true

2、切割

所谓切割,即是按一定的规则将字符串分割成多个子字符串,如:

String str="zhangsan,lishi,wangwu";
String reg=",";// 表示以逗号作为切割符
String[] arr=str.split(reg);// 返回结果为{“zhangsan”,"lisi","wangwu}

3、替换

即将字符串中符合规则的字符替换成指定字符,如:

String str="sfhjhfh136hjasdf73466247fsjha8437482jfjsfh746376";
str.replaceAll("\\d{3,}","#");// 表示将连续出现三个或三个以上的数字替换成“#”

4、获取

即获取与规格相符的字符串, 其步骤为:
①将正则表达式封装成对象
②让正则表达式和要操作的字符串相关联,获得匹配器对象
③获取正则匹配引擎
④通过引擎对符合规则的子串进行操作:如

String str="ming tian jiu yao fang jia le";
String reg="\\b[a-z]{3}\\b";//"//b" 表示单词边界
Pattern p=Pattern.compile(reg);
Matcher m=p.matcher(str);// 获得匹配器
m.find();

五、正则边界(重点)

^ 会匹配行或者字符串的起始位置
注:^ 在 [] 中才表示非!这里表示开始
$ 会匹配行或字符串的结尾位置
^$ 在一起 表示必须是这个(精确匹配)

// 边界可以精确说明要什么
console.log(/lily/.test("lilyname")); // true
console.log(/^lily$/.test("lily"));  // true
console.log(/^lily$/.test("ly"));   // false
console.log(/^andy$/.test("andy"));  // true
这个的最终意思就是 说,必须是 andy 这四个字母

六、量词(重点)

(多个字母,重复最后一个)*   (贪婪)   重复零次或更多   (>=0)
 +   (懒惰)   重复一次或更多次  (>=1)
 ?    (占有)   重复零次或一次(0||1)要么有 要么没有
{}  重复多少次的意思   可以有多少个  
您的银行卡密码只能是 6 位      {6}
{n}    n 次(x=n){n,}    重复 n 次或更多  (x>=n)
{n,m} 重复出现的次数比 n 多但比 m 少 (n<=x<=m)
*        {0,}
+        {1,}
?        {0,1}
x|y    一个 |   x  或者 y(没有 &,用的是,代替的)()提高权限,有限计算

七、replace 函数

replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。语法格式:(返回值是新字符串)
需要匹配的对象.replace(正则式 / 字符串,替换的目标字符)

正则表达式的匹配模式支持的 2 个标志
g:表示全局模式(global),即模式将被应用于所有字符串而非发现一个而停止
i:表示不区分大小写(ease-insensitive)模式,在确定匹配想时忽略模式与字符串的大小写

封装自己的 trim 函数

function trim(str) {return str.replace(/(^\s+)|(\s+$)/g,"");  // 去掉前面和后面的空格
}

八、常用的正则表达式

1、校验数字的表达式

数字:^[0-9]*$
n 位的数字:^\d{n}$
至少 n 位的数字:^\d{n,}$
m- n 位的数字:^\d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
带 1 - 2 位小数的正数或负数:^(-)?\d+(.\d{1,2})?$
正数、负数、和小数:^(-|+)?\d+(.\d+)?$
有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
有 1~3 位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
非零的正整数:^[1-9]\d$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]*$
非零的负整数:^-[1-9][]0-9”$ 或 ^-[1-9]\d$
非负整数:^\d+$ 或 ^[1-9]\d*|0$
非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非负浮点数:^\d+(.\d+)?$ 或 ^[1-9]\d.\d|0.\d[1-9]\d|0?.0+|0$
非正浮点数:^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d.\d|0.\d[1-9]\d))|0?.0+|0$
正浮点数:^[1-9]\d.\d|0.\d[1-9]\d$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数:^-([1-9]\d.\d|0.\d[1-9]\d)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数:^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d.\d|0.\d[1-9]\d|0?.0+|0)$

2、校验字符的表达式

汉字:^[\u4e00-\u9fa5]{0,}$
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为 3 -20 的所有字符:^.{3,20}$
由 26 个英文字母组成的字符串:^[A-Za-z]+$
由 26 个大写英文字母组成的字符串:^[A-Z]+$
由 26 个小写英文字母组成的字符串:^[a-z]+$
由数字和 26 个英文字母组成的字符串:^[A-Za-z0-9]+$
由数字、26 个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
可以输入含有 ^%&’,;=?$\”等字符:[^%&’,;=?$\x22]+
禁止输入含有~ 的字符:[^~\x22]+

3、特殊需求表达式

Email 地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL:[a-zA-z]+://[^\s] 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=])?$
手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
电话号码正则表达式(支持手机号码,3- 4 位区号,7- 8 位直播号码,1-4 位分机号): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份证号(15 位、18 位数字),最后一位是校验位,可能为数字或字符 X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
帐号是否合法(字母开头,允许 5 -16 字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在 6~18 之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8 -10 之间):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
日期格式:^\d{4}-\d{1,2}-\d{1,2}
一年的 12 个月(01~09 和 1~12):^(0?[1-9]|1[0-2])$
一个月的 31 天(01~09 和 1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式:有四种钱的表示形式我们可以接受:”10000.00”和“10,000.00”, 和没有“分”的“10000”和“10,000”:^[1-9][0-9]*$
这表示任意一个不以 0 开头的数字, 但是, 这也意味着一个字符”0”不通过, 所以我们采用下面的形式:^(0|[1-9][0-9]*)$
一个 0 或者一个不以 0 开头的数字. 我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
这表示一个 0 或者一个可能为负的开头不为 0 的数字. 让用户以 0 开头好了. 把负号的也去掉, 因为钱总不能是负的吧。下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
必须说明的是, 小数点后面至少应该有 1 位数, 所以”10.”是不通过的, 但是“10”和“10.2”是通过的:^[0-9]+(.[0-9]{2})?$
这样我们规定小数点后面必须有两位, 如果你认为太苛刻了, 可以这样:^[0-9]+(.[0-9]{1,2})?$
这样就允许用户只写一位小数. 下面我们该考虑数字中的逗号了, 我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
1 到 3 个数字, 后面跟着任意个 逗号 + 3 个数字, 逗号成为可选, 而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
备注:这就是最终结果了, 别忘了”+”可以用”*”替代如果你觉得空字符串也可以接受的话 (奇怪, 为什么?) 最后, 别忘了在用函数时去掉去掉那个反斜杠, 一般的错误都在这里
xml 文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
中文字符的正则表达式:[\u4e00-\u9fa5]
双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计 2,ASCII 字符计 1))
空白行的正则表达式:\n\s*\r (可以用来删除空白行)
HTML 标记的正则表达式:<(\S?)[^>]>.?|<.? /> (首尾空白字符的正则表达式:^\s|\s$ 或(^\s)|(\s$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
腾讯 QQ 号:[1-9][0-9]{4,} (腾讯 QQ 号从 10000 开始)
中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为 6 位数字)
IP 地址:((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))

如果你觉得这篇文章对你有所帮助,那就顺便 点个赞 吧,点赞收藏 不迷路~

黑芝麻哇,白芝麻发,黑芝麻白芝麻哇发哈!

前端哇发哈

正文完
 0