乐趣区

关于java:正则表达式

各式各样的正则表达式参考大全(拜访正则表达式实例库):
^d+$ // 匹配非负整数(正整数 + 0)
// 匹配整数 ^d+(.d+)?$ // 匹配非负浮点数(正浮点数 + 0)
^(([0-9]+.[0-9]1-9)|([0-9]1-9.[0-9]+)|([0-9]1-9))$ // 匹配正浮点数
^((-d+(.d+)?)|(0+(.0+)?))$ // 匹配非正浮点数(负浮点数 + 0)
^(-(([0-9]+.[0-9]1-9)|([0-9]1-9.[0-9]+)|([0-9]1-9)))$ // 匹配负浮点数
^(-?d+)(.d+)?$ // 匹配浮点数
^[A-Za-z]+$ // 匹配由 26 个英文字母组成的字符串
^[A-Z]+$ // 匹配由 26 个英文字母的大写组成的字符串
^[a-z]+$ // 匹配由 26 个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ // 匹配由数字和 26 个英文字母组成的字符串
^w+$ // 匹配由数字、26 个英文字母或者下划线组成的字符串
^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$ // 匹配 email 地址
^[a-zA-z]+:// 匹配 (w+(-w+))(.(w+(-w+)))(?S)?$ // 匹配 url
匹配中文字符的正则表达式:[u4e00-u9fa5]
匹配双字节字符 (包含汉字在内):1
匹配空行的正则表达式:n[s|]*r
匹配 HTML 标记的正则表达式:/<(.)>.</>|<(.*) />/
匹配首尾空格的正则表达式:(^s)|(s$)
匹配 Email 地址的正则表达式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
匹配网址 URL 的正则表达式:^[a-zA-z]+://(w+(-w+))(.(w+(-w+)))(?S)?$
匹配帐号是否非法 (字母结尾,容许 5 -16 字节,容许字母数字下划线):^a-zA-Z{4,15}$
匹配国内电话号码:(d{3}-|d{4}-)?(d{8}|d{7})?
匹配腾讯 QQ 号:^[1-9]1-9$

下表是元字符及其在正则表达式上下文中的行为的一个残缺列表,具体到每个正则表达式符号:
将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向援用、或一个八进制本义符。
^ 匹配输出字符串的开始地位。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配’n’或’r’之后的地位。
$ 匹配输出字符串的完结地位。如果设置了 RegExp 对象的 Multiline 属性,$ 也匹配’n’或’r’之前的地位。

  • 匹配后面的子表达式零次或屡次。
  • 匹配后面的子表达式一次或屡次。+ 等价于 {1,}。

? 匹配后面的子表达式零次或一次。? 等价于 {0,1}。
{n} n 是一个非负整数,匹配确定的 n 次。
{n,} n 是一个非负整数,至多匹配 n 次。
{n,m} m 和 n 均为非负整数,其中 n <= m。起码匹配 n 次且最多匹配 m 次。在逗号和两个数之间不能有空格。
? 当该字符紧跟在任何一个其余限制符 (*, +, ?, {n}, {n,}, {n,m}) 前面时,匹配模式是非贪心的。非贪心模式尽可能少的匹配所搜寻的字符串,而默认的贪心模式则尽可能多的匹配所搜寻的字符串。
. 匹配除 “n” 之外的任何单个字符。要匹配包含’n’在内的任何字符,请应用象’[.n]’的模式。
(pattern) 匹配 pattern 并获取这一匹配。(?:pattern) 匹配 pattern 但不获取匹配后果,也就是说这是一个非获取匹配,不进行存储供当前应用。(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不须要获取供当前应用。(?!pattern) 负向预查,与 (?=pattern) 作用相同 x|y 匹配 x 或 y。
[xyz] 字符汇合。
2 负值字符汇合。
[a-z] 字符范畴,匹配指定范畴内的任意字符。
3 负值字符范畴,匹配任何不在指定范畴内的任意字符。
b 匹配一个单词边界,也就是指单词和空格间的地位。
B 匹配非单词边界。
cx 匹配由 x 指明的控制字符。
d 匹配一个数字字符。等价于 [0-9]。
D 匹配一个非数字字符。等价于 4
f 匹配一个换页符。等价于 x0c 和 cL。
n 匹配一个换行符。等价于 x0a 和 cJ。
r 匹配一个回车符。等价于 x0d 和 cM。
s 匹配任何空白字符,包含空格、制表符、换页符等等。等价于[fnrtv]。
S 匹配任何非空白字符。等价于 5
t 匹配一个制表符。等价于 x09 和 cI。
v 匹配一个垂直制表符。等价于 x0b 和 cK。
w 匹配包含下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
W 匹配任何非单词字符。等价于’6’。
xn 匹配 n,其中 n 为十六进制本义值。十六进制本义值必须为确定的两个数字长。
num 匹配 num,其中 num 是一个正整数。对所获取的匹配的援用。
n 标识一个八进制本义值或一个后向援用。如果 n 之前至多 n 个获取的子表达式,则 n 为后向援用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制本义值。
nm 标识一个八进制本义值或一个后向援用。如果 nm 之前至多有 is preceded by at least nm 个获取得子表达式,则 nm 为后向援用。如果 nm 之前至多有 n 个获取,则 n 为一个后跟文字 m 的后向援用。如果后面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 nm 将匹配八进制本义值 nm。nml 如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八.

二、validate 框架中的正则表达式校验规定
通过一个惯例的 Jakarta RegExp 表达式查看字段值。要理解更多对于 RegExp 的信息,请参见 Jakarta RegExp 页。
. 匹配所有的字符 空格 Tab 键
[] 匹配蕴含在其中的单个字符 A[cde]M 匹配 AcM AdM AeM
() 匹配一组表达式,该表达式能够有其它非凡的字符组成 t([aop]a)p 匹配 taap toap tpap
| 或的表达式 t(a|o|pk)p 匹配 tap top tpkp
$ 匹配输出字符串的完结地位 a$
~ 连字符示意一个范畴 0~9 [0~9]{5} 和[0-9]{5}不同
匹配 0 次或屡次, 只对前邻近的字母和一组表达式起作用,ab匹配:a ab abb
+ 匹配 1 次或屡次, 只对前邻近的字母和一组表达式起作用, ab+ 匹配:ab abb abbb
? 匹配 0 次或 1 次 ab? 匹配:a ab
{n}匹配指定的次数,n 是一个数字,只对前邻近的字符和一组表达式起作用 ab{2}c 匹配:abbc 但不匹配 abc
{n,m}匹配指定的次数, 从 n 次到 m 次,只对前邻近的字符和一组表达式起作用
^ 示意匹配所输出字符串的开始地位; 也示意否的表达式,示意不想被匹配的字符,个别和[] 一起应用,a7 d 匹配:add aed 等但不匹配 abd acd
d 等价于 [0-9] 的性能,匹配单个数字
D 等价与4 的性能,不匹配单个数字
w 等价于[A-Z a-z _ 0-9],匹配单个数字和英文字母还蕴含下划线
W 等价于8,不匹配单个数字和英文字母及下划线 ~ 与 - 不同
s 匹配一个空格
示意本义符
例如:
^[a-zA-Z]*$ 示意该值必须只蕴含字母
^d{6}d*$ 示意该值必须是五位数字
^w+$ 示意该值必须是字母和数字
^Aw+M$ 示意开始地位的字符必须是 A,完结地位的字符必须为 M

^(?(d{3}))?[-|]?(d{3})[-|]?(d{4})$ 示意什么意思


  1. x00-xff ↩
  2. xyz ↩
  3. a-z ↩
  4. 0-9 ↩
  5. fnrtv ↩
  6. A-Za-z0-9_ ↩
  7. b^c ↩
  8. A-Z0-9 ↩
退出移动版