正则表达式基础

jiezi

5 年前

正则表达式的概念
正则表达式（英语：Regular Expression，在代码中常简写为 regex）。
正则表达式是一个字符串，使用单个字符串来描述、用来定义匹配规则，匹配一系列符合某个句法规则的字符串。在开发中，正则表达式通常被用来检索、替换那些符合某个规则的文本。
1.2 字符串类中涉及正则表达式的常用方法
file:///C:UsersADMINI~1.DESAppDataLocalTempksohtmlwps705E.tmp.jpg
public boolean matches(String regex) // 判断字符串是否匹配给定的规则
举例：校验 qq 号码.

    1: 要求必须是 5 -15 位数字
    2:0 不能开头

代码演示：

[Java] 纯文本查看复制代码
?
1
2
String qq = “604154942”;[/align] String regex = “1-9{4,14}”;

booleanflag2 = qq.matches(regex);

举例：校验手机号码

    1：要求为 11 位数字

2：第 1 位为 1，第 2 位为 3、4、5、7、8 中的一个，后面 9 位为 0 到 9 之间的任意数字。
代码演示：

[Java] 纯文本查看复制代码
?
1
2
String phone = “18800022116”;[/align] String regex = “134578{9}”;

 booleanflag = phone.matches(regex);

l public String[] split(String regex) // 根据给定正则表达式的匹配规则，拆分此字符串
举例：分割出字符串中的的数字
代码演示：

[Java] 纯文本查看复制代码
?
1
2
String s = “18-22-40-65”;[/align] String regex = “-“;
String[] result = s.split(regex);
代码演示：

[Java] 纯文本查看复制代码
?
1
2
String s = “18 22 40 65”;[/align] String regex = “”;

 String[] result = s.split(regex);

附录 (这部分内容大家知道有就可以了): 正则表达式的匹配规则
参照帮助文档，在 Pattern 类中有正则表达式的的规则定义，正则表达式中明确区分大小写字母。我们来学习语法规则。
正则表达式的语法规则：
字符：x
含义：代表的是字符 x
例如：匹配规则为 “a”，那么需要匹配的字符串内容就是”a”

字符：\
含义：代表的是斜线字符 ”
例如：匹配规则为 ”\”，那么需要匹配的字符串内容就是””

字符：t
含义：制表符
例如：匹配规则为 ”\t”，那么对应的效果就是产生一个制表符的空间

字符：n
含义：换行符
例如：匹配规则为 ”\n”，那么对应的效果就是换行, 光标在原有位置的下一行

字符：r
含义：回车符
例如：匹配规则为 ”\r”，那么对应的效果就是回车后的效果, 光标来到下一行行首

字符类：[abc]
含义：代表的是字符 a、b 或 c
例如：匹配规则为 ”[abc]”，那么需要匹配的内容就是字符 a，或者字符 b，或字符 c 的一个

字符类：¹
含义：代表的是除了 a、b 或 c 以外的任何字符
例如：匹配规则为 ”¹“，那么需要匹配的内容就是不是字符 a，或者不是字符 b，或不是字符 c 的任意一个字符

字符类：[a-zA-Z]
含义：代表的是 a 到 z 或 A 到 Z，两头的字母包括在内
例如：匹配规则为 ”[a-zA-Z]”，那么需要匹配的是一个大写或者小写字母

字符类：[0-9]
含义：代表的是 0 到 9 数字，两头的数字包括在内
例如：匹配规则为 ”[0-9]”，那么需要匹配的是一个数字

字符类：[a-zA-Z_0-9]
含义：代表的字母或者数字或者下划线 (即单词字符)
例如：匹配规则为 ” [a-zA-Z_0-9] “，那么需要匹配的是一个字母或者是一个数字或一个下滑线

预定义字符类：.
含义：代表的是任何字符
例如：匹配规则为 ” . “，那么需要匹配的是一个任意字符。如果，就想使用 . 的话，使用匹配规则 ”\.” 来实现

预定义字符类：d
含义：代表的是 0 到 9 数字，两头的数字包括在内，相当于 [0-9]
例如：匹配规则为 ”\d “，那么需要匹配的是一个数字

预定义字符类：w
含义：代表的字母或者数字或者下划线 (即单词字符)，相当于[a-zA-Z_0-9]
例如：匹配规则为 ”\w “，，那么需要匹配的是一个字母或者是一个数字或一个下滑线

边界匹配器：^
含义：代表的是行的开头
例如：匹配规则为 ^abc$，那么需要匹配的内容从 [abc] 这个位置开始, 相当于左双引号

边界匹配器：$
含义：代表的是行的结尾
例如：匹配规则为 ^abc$，那么需要匹配的内容以 [0-9] 这个结束, 相当于右双引号

边界匹配器：b
含义：代表的是单词边界
例如：匹配规则为 ”\b[abc]\b”，那么代表的是字母 a 或 b 或 c 的左右两边需要的是非单词字符([a-zA-Z_0-9])

[Java] 纯文本查看复制代码
?
1
2
String regex = “.\b[abc]\b.“;[/align] String str = “abc a bbc”;

        booleanflag = str.matches(regex);

数量词：X?
含义：代表的是 X 出现一次或一次也没有
例如：匹配规则为 ”a?”，那么需要匹配的内容是一个字符 a，或者一个 a 都没有

数量词：X*
含义：代表的是 X 出现零次或多次
例如：匹配规则为 ”a*”，那么需要匹配的内容是多个字符 a，或者一个 a 都没有

数量词：X+
含义：代表的是 X 出现一次或多次
例如：匹配规则为 ”a+”，那么需要匹配的内容是多个字符 a，或者一个 a

数量词：X{n}
含义：代表的是 X 出现恰好 n 次
例如：匹配规则为 ”a{5}”，那么需要匹配的内容是 5 个字符 a

数量词：X{n,}
含义：代表的是 X 出现至少 n 次
例如：匹配规则为 ”a{5,}”，那么需要匹配的内容是最少有 5 个字符 a

数量词：X{n,m}
含义：代表的是 X 出现至少 n 次，但是不超过 m 次
例如：匹配规则为 ”a{5,8}”，那么需要匹配的内容是有 5 个字符 a 到 8 个字符 a 之间

逻辑运算符：XY
含义：代表的是 X 后跟 Y
例如：匹配规则为 ”ab”，那么需要匹配的字符串内容就是”ab”

逻辑运算符：X|Y
含义：代表的是 X 或 Y
例如：匹配规则为 ”a|b”，那么需要匹配的字符串内容就是”a”或”b”

逻辑运算符：(X)
含义：代表的是（）括号内的数据作为一组数据出现，(X)的方式称为正则表达式中的组
例如：匹配规则为 ”(hello)+”，那么需要匹配的内容是组内数据要出现多次，如”hellohellohello”；或者组内数据出现一次，如”hello”。
l 注意实现：
n 在定义正则表达式的匹配规则字符串的里面，想再次使用组中的内容，可通过 \1 来进行使用
例如：正则表达式的匹配规则为 ”(a) == \1″；
使用数据 ”a == a” 进行匹配结果为 true；使用数据 ”a == b” 进行匹配结果为 false。

abc ↩