一、正则表达式的定义
正则表达式(Regular Expression,在代码中常简写为 regex、regexp 或 RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。
在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。(为字符串定义规则,为输入内容定义规则!)
正则表达式用于字符串处理、表单验证等场合,实用高效。
二、正则表达式声明
1. 通过构造函数定义
var 变量名 = new RegExp(/ 表达式 /);
2. 通过直接量定义(较为常用)
var 变量名 = / 表达式 /;
console.log(regexp1.test(345));
console.log(/\d/.test(567));(直接使用)
3.test() 方法
正则对象方法,检测测试字符串是否符合该规则,返回 true 和 false,参数(测试字符串)
使用语法:Boolean = 表达式.test("要验证的内容");
console.log(/\d/.test(567));
验证 567 符不符合 \d 的规范
三、正则五大内部类(帮我们写好的工具直接使用)
1. 预定义类
[^\n\r] 除了换行和回车之外的任意字符(“”不行)\d [0-9] 数字字符
\D [^0-9] 非数字字符
\s [\t\n\x0B\f\r] 空白字符
\S [^ \t\n\x0B\f\r] 非空白字符
\w [a-zA-Z_0-9] 单词字符
\W [^a-zA-Z_0-9] 非单词字符
2. 简单类(正则:// 中什么特殊符号都不写,和 [] 的加入)
1)/string/.test(“string”); 必须是完整的,只多不能少
/andy/.test(“andy”) // true
/andy/.test(“andylv”) // true
/andy/.test(“an”) // false
一句话,只要完整包含了 andy 就可以了(有他就行)
2)/[string]/.test(“string”); 只要包含里面的任何一个就可以
/[andy]/.test("andy"); // true
/[andy]/.test("an"); // true
/[andy]/.test("ady"); // true
/[andy]/.test("anll"); // true
/[andy]/.test("assd"); // true
/[andy]/.test("ss"); // false
/[3aH8]/.test("ss"); // false
3. 负向类(不能是其中的整体或者一部分)
中括号内,前面加个元字符 ^ 进行取反,不是括号里面的字符(一部分也不行)。
(可以不够,但是不能多)(不够和正好,返回 false;多了或者没有返回 true)
console.log(/[^abc]/.test("iiii"));//true
console.log(/[^abc]/.test("aiiii"));// 只有一部分睁一只眼闭一只眼 true
console.log(/[^abc]/.test("abc"));// 刚好为 false
console.log(/[^abc]/.test("b"));// 不够为 false
console.log(/[^abc]/.test("bcdef"));// 只有一部分睁一只眼闭一只眼 true
console.log(/[^abc]/.test("abcdef"));// 只有一部分睁一只眼闭一只眼 true
注意: 这个符号 ^ 一定是写到方括号里面
4. 范围类
有时匹配的东西过多,而且类型又相同,全部输入太麻烦,我们可以在中间加了个横线
console.log(/[a-c]/.test("dghhj")); //false
console.log(/[a-c]/.test("b")); //true
5. 组合类
用中括号匹配不同类型的单个字符。console.log(/[a-m1-5]/.test("b"))//true
四、正则表达式的功能
正则表达式主要是
针对字符串进行操作
,可以简化对字符串的复杂操作,其主要功能有匹配
、切割
、替换
、获取
。
1、匹配
检查字符串是否符合正则表达式中的规则,有一次不匹配,则返回 false。如:
String str="abc";
String reg="[a-zA-Z]\\d?";// 次表达式表示字符串的第一位只能是字母,第二位只能是数字或没有
boolean flag=str.matches(reg);// 返回结果为 true
2、切割
所谓切割,即是按一定的规则将字符串分割成多个子字符串,如:
String str="zhangsan,lishi,wangwu";
String reg=",";// 表示以逗号作为切割符
String[] arr=str.split(reg);// 返回结果为{“zhangsan”,"lisi","wangwu}
3、替换
即将字符串中符合规则的字符替换成指定字符,如:
String str="sfhjhfh136hjasdf73466247fsjha8437482jfjsfh746376";
str.replaceAll("\\d{3,}","#");// 表示将连续出现三个或三个以上的数字替换成“#”
4、获取
即获取与规格相符的字符串, 其步骤为:
①将正则表达式封装成对象
②让正则表达式和要操作的字符串相关联,获得匹配器对象
③获取正则匹配引擎
④通过引擎对符合规则的子串进行操作:如
String str="ming tian jiu yao fang jia le";
String reg="\\b[a-z]{3}\\b";//"//b" 表示单词边界
Pattern p=Pattern.compile(reg);
Matcher m=p.matcher(str);// 获得匹配器
m.find();
五、正则边界(重点)
^ 会匹配行或者字符串的起始位置
注:^ 在 [] 中才表示非!这里表示开始
$ 会匹配行或字符串的结尾位置
^$ 在一起 表示必须是这个(精确匹配)
// 边界可以精确说明要什么
console.log(/lily/.test("lilyname")); // true
console.log(/^lily$/.test("lily")); // true
console.log(/^lily$/.test("ly")); // false
console.log(/^andy$/.test("andy")); // true
这个的最终意思就是 说,必须是 andy 这四个字母
六、量词(重点)
(多个字母,重复最后一个)* (贪婪) 重复零次或更多 (>=0)
+ (懒惰) 重复一次或更多次 (>=1)
? (占有) 重复零次或一次(0||1)要么有 要么没有
{} 重复多少次的意思 可以有多少个
您的银行卡密码只能是 6 位 {6}
{n} n 次(x=n){n,} 重复 n 次或更多 (x>=n)
{n,m} 重复出现的次数比 n 多但比 m 少 (n<=x<=m)
* {0,}
+ {1,}
? {0,1}
x|y 一个 | x 或者 y(没有 &,用的是,代替的)()提高权限,有限计算
七、replace 函数
replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。语法格式:(返回值是新字符串)
需要匹配的对象.replace(正则式 / 字符串,替换的目标字符)
正则表达式的匹配模式支持的 2 个标志
g:表示全局模式(global),即模式将被应用于所有字符串而非发现一个而停止
i:表示不区分大小写(ease-insensitive)模式,在确定匹配想时忽略模式与字符串的大小写
封装自己的 trim 函数
function trim(str) {return str.replace(/(^\s+)|(\s+$)/g,""); // 去掉前面和后面的空格
}
八、常用的正则表达式
1、校验数字的表达式
数字:^[0-9]*$
n 位的数字:^\d{n}$
至少 n 位的数字:^\d{n,}$
m- n 位的数字:^\d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
带 1 - 2 位小数的正数或负数:^(-)?\d+(.\d{1,2})?$
正数、负数、和小数:^(-|+)?\d+(.\d+)?$
有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
有 1~3 位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
非零的正整数:^[1-9]\d$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]*$
非零的负整数:^-[1-9][]0-9”$ 或 ^-[1-9]\d$
非负整数:^\d+$ 或 ^[1-9]\d*|0$
非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非负浮点数:^\d+(.\d+)?$ 或 ^[1-9]\d.\d|0.\d[1-9]\d|0?.0+|0$
非正浮点数:^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d.\d|0.\d[1-9]\d))|0?.0+|0$
正浮点数:^[1-9]\d.\d|0.\d[1-9]\d$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数:^-([1-9]\d.\d|0.\d[1-9]\d)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数:^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d.\d|0.\d[1-9]\d|0?.0+|0)$
2、校验字符的表达式
汉字:^[\u4e00-\u9fa5]{0,}$
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为 3 -20 的所有字符:^.{3,20}$
由 26 个英文字母组成的字符串:^[A-Za-z]+$
由 26 个大写英文字母组成的字符串:^[A-Z]+$
由 26 个小写英文字母组成的字符串:^[a-z]+$
由数字和 26 个英文字母组成的字符串:^[A-Za-z0-9]+$
由数字、26 个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
可以输入含有 ^%&’,;=?$\”等字符:[^%&’,;=?$\x22]+
禁止输入含有~ 的字符:[^~\x22]+
3、特殊需求表达式
Email 地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL:[a-zA-z]+://[^\s] 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=])?$
手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
电话号码正则表达式(支持手机号码,3- 4 位区号,7- 8 位直播号码,1-4 位分机号): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份证号(15 位、18 位数字),最后一位是校验位,可能为数字或字符 X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
帐号是否合法(字母开头,允许 5 -16 字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在 6~18 之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8 -10 之间):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
日期格式:^\d{4}-\d{1,2}-\d{1,2}
一年的 12 个月(01~09 和 1~12):^(0?[1-9]|1[0-2])$
一个月的 31 天(01~09 和 1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式:有四种钱的表示形式我们可以接受:”10000.00”和“10,000.00”, 和没有“分”的“10000”和“10,000”:^[1-9][0-9]*$
这表示任意一个不以 0 开头的数字, 但是, 这也意味着一个字符”0”不通过, 所以我们采用下面的形式:^(0|[1-9][0-9]*)$
一个 0 或者一个不以 0 开头的数字. 我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
这表示一个 0 或者一个可能为负的开头不为 0 的数字. 让用户以 0 开头好了. 把负号的也去掉, 因为钱总不能是负的吧。下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
必须说明的是, 小数点后面至少应该有 1 位数, 所以”10.”是不通过的, 但是“10”和“10.2”是通过的:^[0-9]+(.[0-9]{2})?$
这样我们规定小数点后面必须有两位, 如果你认为太苛刻了, 可以这样:^[0-9]+(.[0-9]{1,2})?$
这样就允许用户只写一位小数. 下面我们该考虑数字中的逗号了, 我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
1 到 3 个数字, 后面跟着任意个 逗号 + 3 个数字, 逗号成为可选, 而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
备注:这就是最终结果了, 别忘了”+”可以用”*”替代如果你觉得空字符串也可以接受的话 (奇怪, 为什么?) 最后, 别忘了在用函数时去掉去掉那个反斜杠, 一般的错误都在这里
xml 文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
中文字符的正则表达式:[\u4e00-\u9fa5]
双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计 2,ASCII 字符计 1))
空白行的正则表达式:\n\s*\r (可以用来删除空白行)
HTML 标记的正则表达式:<(\S?)[^>]>.?|<.? /> (首尾空白字符的正则表达式:^\s|\s$ 或(^\s)|(\s$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
腾讯 QQ 号:[1-9][0-9]{4,} (腾讯 QQ 号从 10000 开始)
中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为 6 位数字)
IP 地址:((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))
如果你觉得这篇文章对你有所帮助,那就顺便 点个赞
吧,点赞收藏
不迷路~
黑芝麻哇,白芝麻发,黑芝麻白芝麻哇发哈!
前端哇发哈