相关文章推荐
豪情万千的松鼠  ·  javax.validation.Unexp ...·  5 月前    · 
潇洒的书签  ·  lua ...·  1 年前    · 
爱旅游的煎饼果子  ·  javascript - ...·  2 年前    · 
愉快的电池  ·  idea Unexpected end ...·  2 年前    · 

一、正则表达式的转义字符\(特殊的两个反斜杠,你闹心不!)

java中正则表达式要有两个\\,才能达到转义。我写的这个命令是查找以http|ftp|https|file://开头,或是../..开头,或是../开头的所有字符,

正确是这样的((^(http|ftp|https|file)(://))|^(\\.\\./\\.\\./)|^(\\.\\./)).*

^(XXX)是表示以XXX开头的字符串。

正则表达式中表示数字是“\d”,实际在内存中就是两个字符\和d, 但在java中\就得写成\\,因此在写程序时就是\\d。

正则表达式一个\表示转义字符,与后面的字符共同组成一个字符集表示项,如\d表示数字。而要输出一个\,就需要两个,将\自身转义为普通字符。

而输出成“\\”,实际在内存中就是两个字符“\和\”,java中就要分别表示这两个\,每个都必须写成"\\",因此要写成"\\\\"。实际上先要将"\\\\"转换成一个字符串"\\"再交给正则表达式,正则表达式转义一次就刚好匹配一个"\"。

(java中的存在的转义序列值为“\b、\t、\n、\f、\r、\"、\'、\\”)

(正则表达式中的元字符:“(、[、{、\、^、-、$、|、}、]、)、?、+、*、+、.”)

(变态的不包含[^XXX])

[^0-9a-z] 条件限制在非小写0 to 9或a to z范围中一个字符

[^0-9[a-z]] 条件限制在非小写0 to 9或a to z范围中一个字符(交集)

我做了一个测试:[0-9a-z]和[0-9[a-z]]是一个样的,而[^0-9a-z]与[^0-9[a-z]]不同

先说一下[0-9a-z]和[0-9[a-z]]这两个正则表达式的效果是一样的,

String regEx = "[0-9[a-z]]";

//       String regEx = "[0-9a-z]";

Pattern p = Pattern.compile(regEx);

Matcher m = p.matcher(str);

if (m.matches())

System.out.println("true");

System.out.println("incorrect");

测试字符效果都是一样的。

但是[^0-9a-z] 和[^0-9[a-z]]两个是不同的。

[^0-9a-z]表的是0到9或是a到z的字符都是不要的,而[^0-9[a-z]]测试结果显示,0到9的字符是incorrect,但a到z却是true。

可以看出两个是有区别的。

这个博主讲到很好:http://www.cnblogs.com/kkcheng/archive/2010/02/03/1662821.html

原理性的东西,讲的全面细致:

这篇实用性较强,尤其是group,split,replaceall,append,replacement,start,end等函数的使用,注意,后面讲的非常详细:

二、细说正则^和$(开头和结尾)

正则表达式中,^表示作为开头,$表示结尾。

如匹配以bao开头的字符串为"^bao(.*)";而"(.*)bao$"匹配以bao结尾。

但要注意,二者单独使用是全文匹配。

^bao匹配bao开头的字符串,但正则表达式"^bao"只能匹配字符串bao,而其他字符串baotou、baoqingtian都匹配不了。

如果要匹配bao开头字符串baoXXX…,要用

Stringregex = "^bao";

if("baotou".matches(regex)) {

System.out.println("全文匹配1");

Stringall_regex = "^baotou";

if("baotou".matches(all_regex)) {

System.out.println("全文匹配2");

输出为:全文匹配2。可见只能全文匹配。$结尾标示符也一样,单独用全文匹配。所以"baotou"和"^baotou$"、"baotou$"以及"^baotou"这个四个效果一样,都是全文匹配。

另外,"^$"和"^"会匹配空字符"",

给出一个综合的例子

publicstatic void main(String[] args) {

String[]filename = { "baotou", "shanghai", "beijing","shenzhen" };

Stringregex = "^bao";

if(filename[0].matches(regex)) {

System.out.println("全文匹配1");

Stringall_regex = "^bao(.*)";

if(filename[0].matches(all_regex)) {

System.out.println("全文匹配2");

Stringteststring = "ttbaotou";

Stringregex2 = "(.*)bao(.*)";

if(teststring.matches(regex2)) {

System.out.println("匹配开头1");

Stringregex3 = "(.*)^bao(.*)";

if(teststring.matches(regex3)) {

System.out.println("匹配开头2");

Stringregex4 = "(.*)^bao(.*)";

if("baotou".matches(regex4)) {

System.out.println("匹配开头3");

String regex5 = "(.*)bao(.*)";

if("baotou".matches(regex4)) {

System.out.println("匹配开头4");

全文匹配2

匹配开头1

匹配开头3

匹配开头4

从例子中可以看出"^bao(.*)"匹配开头,"bao(.*)$"匹配结尾;

"(.*)^bao(.*)"其实违法,但可以用,和"^bao(.*)"一样。$有类型功能。

三、正则表达式的使用方法

从上例子中可以看到正则表达式使用方法:

1用Pattern类的complie加载正则表达式StringregEx;

2用Pattern类的Matcher函数加载要匹配的目标字符串;

3返回的Matcher m执行m.matches()进行实际匹配,匹配上返回真,否则假。

String regEx ="^(\\.\\./\\.\\.).*";

Pattern p =Pattern.compile(regEx);

Matcher m =p.matcher("http://,sdkjf,adfa,jjo,lo");

if (m.matches())

System.out.println("true");

System.out.println("incorrect");

而String类自身就有字符串匹配函数matches,如"baotou".matches("(.*)bao(.*)"),可以直接使用,来验证自身匹配一个正则表达式。

String all_regex = "^bao(.*)";

if ("baotou".matches(all_regex)) {

System.out.println("全文匹配2");

另外,String类可以直接用两个函数startsWith()和endsWith()检验字符串开头和结尾

"baotou".endsWith(suffix);

"baotou".startsWith(prefix);

而"baotou".equals(anObject);用来验证相等。

一、正则表达式的转义字符\(特殊的两个反斜杠,你闹心不!)java中正则表达式要有两个\\,才能达到转义。我写的这个命令是查找以http|ftp|https|file://开头,或是../..开头,或是../开头的所有字符,正确是这样的((^(http|ftp|https|file)(://))|^(\\.\\./\\.\\./)|^(\\.\\./)).*^(XXX)是表示以XXX开头的字符串。...
正则表达式 大全( java ,js) 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$ 6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7} 7 身份证号: 15或18位身份证:^\d{15}|\d{18}$ 15位身份证:^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$ 18位身份证:^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$ 8 短身份证号码(数字、字母x 结尾 ):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-
在Sun的 Java JDK 1.40版本中, Java 自带了支持 正则表达式 的包,本文就抛砖引玉地介绍了如何使用 java .util.regex包。   可粗略估计一下,除了偶尔用Linux的外,其他Linu x用户都会遇到 正则表达式 正则表达式 是个极端强大工具,而且在字符串模式-匹配和字符串模式-替换方面富有弹性。在Unix世界里, 正则表达式 几乎没有什么限制,可肯定的是,它应用非常之广泛。