关于java:正则表达式

各式各样的正则表达式参考大全（拜访正则表达式实例库）：
^d+$ // 匹配非负整数（正整数 + 0）
// 匹配整数 ^d+(.d+)?$ // 匹配非负浮点数（正浮点数 + 0）
^(([0-9]+.[0-9]1-9)|([0-9]1-9.[0-9]+)|([0-9]1-9))$ // 匹配正浮点数
^((-d+(.d+)?)|(0+(.0+)?))$ // 匹配非正浮点数（负浮点数 + 0）
^(-(([0-9]+.[0-9]1-9)|([0-9]1-9.[0-9]+)|([0-9]1-9)))$ // 匹配负浮点数
^(-?d+)(.d+)?$ // 匹配浮点数
^[A-Za-z]+$ // 匹配由 26 个英文字母组成的字符串
^[A-Z]+$ // 匹配由 26 个英文字母的大写组成的字符串
^[a-z]+$ // 匹配由 26 个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ // 匹配由数字和 26 个英文字母组成的字符串
^w+$ // 匹配由数字、26 个英文字母或者下划线组成的字符串
^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$ // 匹配 email 地址
^[a-zA-z]+:// 匹配 (w+(-w+))(.(w+(-w+)))(?S)?$ // 匹配 url
匹配中文字符的正则表达式：[u4e00-u9fa5]
匹配双字节字符 (包含汉字在内)：¹
匹配空行的正则表达式：n[s|]*r
匹配 HTML 标记的正则表达式：/<(.)>.</>|<(.*) />/
匹配首尾空格的正则表达式：(^s)|(s$)
匹配 Email 地址的正则表达式：w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
匹配网址 URL 的正则表达式：^[a-zA-z]+://(w+(-w+))(.(w+(-w+)))(?S)?$
匹配帐号是否非法 (字母结尾，容许 5 -16 字节，容许字母数字下划线)：^a-zA-Z{4,15}$
匹配国内电话号码：(d{3}-|d{4}-)?(d{8}|d{7})?
匹配腾讯 QQ 号：^[1-9]1-9$

下表是元字符及其在正则表达式上下文中的行为的一个残缺列表，具体到每个正则表达式符号：
将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向援用、或一个八进制本义符。
^ 匹配输出字符串的开始地位。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配’n’或’r’之后的地位。
$ 匹配输出字符串的完结地位。如果设置了 RegExp 对象的 Multiline 属性，$ 也匹配’n’或’r’之前的地位。

匹配后面的子表达式零次或屡次。
匹配后面的子表达式一次或屡次。+ 等价于 {1,}。

? 匹配后面的子表达式零次或一次。? 等价于 {0,1}。
{n} n 是一个非负整数，匹配确定的 n 次。
{n,} n 是一个非负整数，至多匹配 n 次。
{n,m} m 和 n 均为非负整数，其中 n <= m。起码匹配 n 次且最多匹配 m 次。在逗号和两个数之间不能有空格。
? 当该字符紧跟在任何一个其余限制符 (*, +, ?, {n}, {n,}, {n,m}) 前面时，匹配模式是非贪心的。非贪心模式尽可能少的匹配所搜寻的字符串，而默认的贪心模式则尽可能多的匹配所搜寻的字符串。
. 匹配除 “n” 之外的任何单个字符。要匹配包含’n’在内的任何字符，请应用象’[.n]’的模式。
(pattern) 匹配 pattern 并获取这一匹配。(?:pattern) 匹配 pattern 但不获取匹配后果，也就是说这是一个非获取匹配，不进行存储供当前应用。(?=pattern) 正向预查，在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不须要获取供当前应用。(?!pattern) 负向预查，与 (?=pattern) 作用相同 x|y 匹配 x 或 y。
[xyz] 字符汇合。
² 负值字符汇合。
[a-z] 字符范畴，匹配指定范畴内的任意字符。
³ 负值字符范畴，匹配任何不在指定范畴内的任意字符。
b 匹配一个单词边界，也就是指单词和空格间的地位。
B 匹配非单词边界。
cx 匹配由 x 指明的控制字符。
d 匹配一个数字字符。等价于 [0-9]。
D 匹配一个非数字字符。等价于 ⁴。
f 匹配一个换页符。等价于 x0c 和 cL。
n 匹配一个换行符。等价于 x0a 和 cJ。
r 匹配一个回车符。等价于 x0d 和 cM。
s 匹配任何空白字符，包含空格、制表符、换页符等等。等价于[fnrtv]。
S 匹配任何非空白字符。等价于 ⁵。
t 匹配一个制表符。等价于 x09 和 cI。
v 匹配一个垂直制表符。等价于 x0b 和 cK。
w 匹配包含下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
W 匹配任何非单词字符。等价于’⁶’。
xn 匹配 n，其中 n 为十六进制本义值。十六进制本义值必须为确定的两个数字长。
num 匹配 num，其中 num 是一个正整数。对所获取的匹配的援用。
n 标识一个八进制本义值或一个后向援用。如果 n 之前至多 n 个获取的子表达式，则 n 为后向援用。否则，如果 n 为八进制数字 (0-7)，则 n 为一个八进制本义值。
nm 标识一个八进制本义值或一个后向援用。如果 nm 之前至多有 is preceded by at least nm 个获取得子表达式，则 nm 为后向援用。如果 nm 之前至多有 n 个获取，则 n 为一个后跟文字 m 的后向援用。如果后面的条件都不满足，若 n 和 m 均为八进制数字 (0-7)，则 nm 将匹配八进制本义值 nm。nml 如果 n 为八进制数字 (0-3)，且 m 和 l 均为八进制数字 (0-7)，则匹配八.

二、validate 框架中的正则表达式校验规定
通过一个惯例的 Jakarta RegExp 表达式查看字段值。要理解更多对于 RegExp 的信息，请参见 Jakarta RegExp 页。
. 匹配所有的字符空格 Tab 键
[] 匹配蕴含在其中的单个字符 A[cde]M 匹配 AcM AdM AeM
() 匹配一组表达式，该表达式能够有其它非凡的字符组成 t([aop]a)p 匹配 taap toap tpap
| 或的表达式 t(a|o|pk)p 匹配 tap top tpkp
$ 匹配输出字符串的完结地位 a$
~ 连字符示意一个范畴 0~9 [0~9]{5} 和[0-9]{5}不同
匹配 0 次或屡次, 只对前邻近的字母和一组表达式起作用，ab匹配:a ab abb
+ 匹配 1 次或屡次, 只对前邻近的字母和一组表达式起作用, ab+ 匹配:ab abb abbb
? 匹配 0 次或 1 次 ab? 匹配:a ab
{n}匹配指定的次数，n 是一个数字，只对前邻近的字符和一组表达式起作用 ab{2}c 匹配:abbc 但不匹配 abc
{n,m}匹配指定的次数, 从 n 次到 m 次，只对前邻近的字符和一组表达式起作用
^ 示意匹配所输出字符串的开始地位; 也示意否的表达式，示意不想被匹配的字符，个别和[] 一起应用,a⁷ d 匹配：add aed 等但不匹配 abd acd
d 等价于 [0-9] 的性能，匹配单个数字
D 等价与⁴ 的性能，不匹配单个数字
w 等价于[A-Z a-z _ 0-9]，匹配单个数字和英文字母还蕴含下划线
W 等价于⁸，不匹配单个数字和英文字母及下划线 ~ 与 - 不同
s 匹配一个空格
示意本义符
例如：
^[a-zA-Z]*$ 示意该值必须只蕴含字母
^d{6}d*$ 示意该值必须是五位数字
^w+$ 示意该值必须是字母和数字
^Aw+M$ 示意开始地位的字符必须是 A，完结地位的字符必须为 M

^(?(d{3}))?[-|]?(d{3})[-|]?(d{4})$ 示意什么意思

x00-xff ↩
xyz ↩
a-z ↩
0-9 ↩
fnrtv ↩
A-Za-z0-9_ ↩
b^c ↩
A-Z0-9 ↩