正则表达式 – 匹配规则

基本模式匹配

一切从最基本的开始。模式，是正则表达式最基本的元素，它们是一组描述字符串特征的字符。模式可以很简单，由普通的字符串组成，也可以非常复杂，往往用特殊的字符表示一个范围内的字符、重复出现，或表示上下文。例如：

^once

这个模式包含一个特殊的字符 ^ ，表示该模式只匹配那些以 once 开头的字符串。例如该模式与字符串 "once upon a time" 匹配，与 "There once was a man from NewYork" 不匹配。正如如 ^ 符号表示开头一样， $ 符号用来匹配那些以给定模式结尾的字符串。

bucket$

这个模式与 "Who kept all of this cash in a bucket" 匹配，与 "buckets" 不匹配。字符 ^ 和 $ 同时使用时，表示精确匹配（字符串与模式一样）。例如：

^bucket$

只匹配字符串 "bucket" 。如果一个模式不包括 ^ 和 $ ，那么它与任何包含该模式的字符串匹配。例如模式：

There once was a man from NewYork
Who kept all of his cash in a bucket.
是匹配的。
在该模式中的字母 (o-n-c-e) 是字面的字符，也就是说，他们表示该字母本身，数字也是一样的。其他一些稍微复杂的字符，如标点符号和白字符（空格、制表符等），要用到转义序列。所有的转义序列都用反斜杠 \ 打头。制表符的转义序列是 \t。所以如果我们要检测一个字符串是否以制表符开头，可以用这个模式：
类似的，用 \n 表示"新行"，\r 表示回车。其他的特殊符号，可以用在前面加上反斜杠，如反斜杠本身用 \\ 表示，句号 . 用 \. 表示，以此类推。
在 INTERNET 的程序中，正则表达式通常用来验证用户的输入。当用户提交一个 FORM 以后，要判断输入的电话号码、地址、EMAIL 地址、信用卡号码等是否有效，用普通的基于字面的字符是不够的。
所以要用一种更自由的描述我们要的模式的办法，它就是字符簇。要建立一个表示所有元音字符的字符簇，就把所有的元音字符放在一个方括号里：
[AaEeIiOoUu]
这个模式与任何元音字符匹配，但只能表示一个字符。用连字号可以表示一个字符的范围，如：
[a-z] // 匹配所有的小写字母 
[A-Z] // 匹配所有的大写字母 
[a-zA-Z] // 匹配所有的字母 
[0-9] // 匹配所有的数字 
[0-9\.\-] // 匹配所有的数字，句号和减号 
[ \f\r\t\n] // 匹配所有的白字符
同样的，这些也只表示一个字符，这是一个非常重要的。如果要匹配一个由一个小写字母和一位数字组成的字符串，比如 "z2"、"t6" 或 "g7"，但不是 "ab2"、"r2d3" 或 "b52" 的话，用这个模式：
^[a-z][0-9]$
尽管 [a-z] 代表 26 个字母的范围，但在这里它只能与第一个字符是小写字母的字符串匹配。
前面曾经提到^表示字符串的开头，但它还有另外一个含义。当在一组方括号里使用 ^ 时，它表示"非"或"排除"的意思，常常用来剔除某个字符。还用前面的例子，我们要求第一个字符不能是数字：
^[^0-9][0-9]$
这个模式与 "&5"、"g7"及"-2" 是匹配的，但与 "12"、"66" 是不匹配的。下面是几个排除特定字符的例子：
[^a-z] //除了小写字母以外的所有字符 
[^\\\/\^] //除了(\)(/)(^)之外的所有字符 
[^\"\'] //除了双引号(")和单引号(')之外的所有字符
特殊字符 .(点，句号)在正则表达式中用来表示除了"新行"之外的所有字符。所以模式 ^.5$ 与任何两个字符的、以数字5结尾和以其他非"新行"字符开头的字符串匹配。模式 . 可以匹配任何字符串，换行符（\n、\r）除外。
PHP的正则表达式有一些内置的通用字符簇，列表如下：
	[[:alpha:]]
	[[:digit:]]
	[[:alnum:]]
    任何字母和数字
	[[:space:]]
    任何空白字符
	[[:upper:]]
    任何大写字母
	[[:lower:]]
    任何小写字母
	[[:punct:]]
    任何标点符号
	[[:xdigit:]]
    任何16进制的数字，相当于[0-9a-fA-F]
确定重复出现
到现在为止，你已经知道如何去匹配一个字母或数字，但更多的情况下，可能要匹配一个单词或一组数字。一个单词有若干个字母组成，一组数字有若干个单数组成。跟在字符或字符簇后面的花括号({})用来确定前面的内容的重复出现的次数。
	^[a-zA-Z_]$
    所有的字母和下划线
	^[[:alpha:]]{3}$
    所有的3个字母的单词
	^a{4}$
	^a{2,4}$
    aa,aaa或aaaa
	^a{1,3}$
    a,aa或aaa
	^a{2,}$
    包含多于两个a的字符串
	^a{2,}
    如：aardvark和aaab，但apple不行
	a{2,}
    如：baad和aaa，但Nantucket不行
	\t{2}
    两个制表符
    所有的两个字符
这些例子描述了花括号的三种不同的用法。一个数字 {x} 的意思是前面的字符或字符簇只出现x次 ；一个数字加逗号 {x,} 的意思是前面的内容出现x或更多的次数 ；两个数字用逗号分隔的数字 {x,y} 表示 前面的内容至少出现x次，但不超过y次。我们可以把模式扩展到更多的单词或数字：
^[a-zA-Z0-9_]{1,}$      // 所有包含一个以上的字母、数字或下划线的字符串 
^[1-9][0-9]{0,}$        // 所有的正整数 
^\-{0,1}[0-9]{1,}$      // 所有的整数 
^[-]?[0-9]+\.?[0-9]+$   // 所有的浮点数
最后一个例子不太好理解，是吗？这么看吧：以一个可选的负号 ([-]?) 开头 (^)、跟着1个或更多的数字([0-9]+)、和一个小数点(\.)再跟上1个或多个数字([0-9]+)，并且后面没有其他任何东西($)。下面你将知道能够使用的更为简单的方法。
特殊字符 ? 与 {0,1} 是相等的，它们都代表着： 0个或1个前面的内容 或 前面的内容是可选的 。所以刚才的例子可以简化为：
^\-?[0-9]{1,}\.?[0-9]{1,}$
特殊字符 * 与 {0,} 是相等的，它们都代表着 0 个或多个前面的内容 。最后，字符 + 与 {1,} 是相等的，表示 1 个或多个前面的内容 ，所以上面的4个例子可以写成：
^[a-zA-Z0-9_]+$      // 所有包含一个以上的字母、数字或下划线的字符串 
^[1-9][0-9]*$        // 所有的正整数 
^\-?[0-9]+$          // 所有的整数 
^[-]?[0-9]+(\.[0-9]+)?$ // 所有的浮点数
当然这并不能从技术上降低正则表达式的复杂性，但可以使它们更容易阅读。
			
		#0   JUSTABANANA
  529***425@qq.com
 32
^[-]?[0-9]+(\.[0-9]+)?$

上面这个正则会匹配到 0000.1111 这样的数，为了让它精准匹配 0.111 这样的数，可以改成：
^[-]?(0{1}|[1-9]+)(\.[0-9]+)?$JUSTABANANA   JUSTABANANA
  529***425@qq.com
4年前 (2019-01-03)

#0   Herschel
  145***6442@qq.com
 69
楼上的正式表达式会匹配到 101.11 是失败的，可以改成：

/^[-]?(0{1}|[1-9]+[0-9]*)(\.[0-9]+)?$/Herschel   Herschel
  145***6442@qq.com
4年前 (2019-01-17)

#0   zlg
  116***5518@qq.com
 39
^\-?[0-9]+(\.[0-9])?$

上面这个正则表达式会匹配到 0000.1111 这样的数，精确不到 0.1111，是失败的。
^[-]{0,1}(0{1}|[1-9]{1,})(\.[0-9])?$
如果改成上面这样，会匹配不到 101.11，也是失败的，可以改成如下形式：
^\-?(0{1}|[1-9]+[0-9]*)(\.[0-9]+)?$
zlg   zlg
  116***5518@qq.com
4年前 (2019-01-20)

#0   Breeze
  578***426@qq.com
   参考地址
 103
正则表达式中 [] 和 () 的区别

圆括号 () 是组，主要应用在限制多选结构的范围/分组/捕获文本/环视/特殊模式处理。
1、(abc|bcd|cde)：表示这一段是abc、bcd、cde三者之一均可，顺序也必须一致。

2、(abc)?：表示这一组要么一起出现，要么不出现，出现则按此组内的顺序出现。

3、(?:abc)：表示找到这样abc这样一组，但不记录，不保存到$变量中，否则可以通过$x取第几个括号所匹配到的项，比如：(aaa)(bbb)(ccc)(?:ddd)(eee)，可以用 $1 获取 (aaa) 匹配到的内容，而 $3 则获取到了 (ccc) 匹配到的内容，而 $4 则获取的是由 (eee) 匹配到的内容，因为前一对括号没有保存变量。

4、a(?=bbb)：顺序环视 表示 a 后面必须紧跟 3 个连续的 b。

5、(?i:xxxx)：不区分大小写 (?s:.*) 跨行匹配.可以匹配回车符。

方括号 [] 是单个匹配，字符集/排除字符集/命名字符集。
1、[0-3]：表示找到这一个位置上的字符只能是 0 到 3 这四个数字，与 (abc|bcd|cde) 的作用比较类似，但圆括号可以匹配多个连续的字符，而一对方括号只能匹配单个字符。
2、[^0-3]：表示找到这一个位置上的字符只能是除了 0 到 3 之外的所有字符。
() 和 [] 有本质的区别
() 内的内容表示的是一个子表达式，() 本身不匹配任何东西，也不限制匹配任何东西，只是把括号内的内容作为同一个表达式来处理，例如 (ab){1,3}，就表示 ab 一起连续出现最少 1 次，最多 3 次。如果没有括号的话，ab{1,3} 就表示 a，后面紧跟的 b 出现最少 1 次，最多 3 次。另外，括号在匹配模式中也很重要。这个就不延伸了，有兴趣可以自己查查。
[] 表示匹配的字符在 [] 中，并且只能出现一次，并且特殊字符写在 [] 会被当成普通字符来匹配。例如 [(a)]，会匹配 (、a、)、这三个字符。
所以 ()、[] 无论是作用还是表示的含义，都有天壤之别。Breeze   Breeze
  578***426@qq.com
   参考地址
4年前 (2019-08-02)

             HTML / CSSHTML 教程
HTML5 教程
CSS 教程
CSS3 教程
Bootstrap3 教程
Bootstrap4 教程
Bootstrap5 教程
Font Awesome 教程
Foundation 教程
 JavaScriptJavaScript 教程
HTML DOM 教程
jQuery 教程
AngularJS 教程
AngularJS2 教程
Vue.js 教程
Vue3 教程
React 教程
TypeScript 教程
jQuery UI 教程
jQuery EasyUI 教程
Node.js 教程
AJAX 教程
JSON 教程
Echarts 教程
Chart.js 教程
Highcharts 教程
Google 地图 教程
 服务端Python 教程
Python2.x 教程
Linux 教程
Docker 教程
Ruby 教程
Java 教程
C 教程
C++ 教程
Perl 教程
Servlet 教程
JSP 教程
Lua 教程
Rust 教程
Scala 教程
Go 教程
PHP 教程
数据结构与算法
Django 教程
Zookeeper 教程
设计模式
正则表达式
Maven 教程
Verilog 教程
ASP 教程
AppML 教程
VBScript 教程
 数据库SQL 教程
MySQL 教程
PostgreSQL 教程
SQLite 教程
MongoDB 教程
Redis 教程
Memcached 教程
 数据分析Python 教程
NumPy 教程
Pandas 教程
Matplotlib 教程
Scipy 教程
R 教程
Julia 教程
 移动端Android 教程
Swift 教程
jQuery Mobile 教程
ionic 教程
Kotlin 教程
 XML 教程XML 教程
DTD 教程
XML DOM 教程
XSLT 教程
XPath 教程
XQuery 教程
XLink 教程
XPointer 教程
XML Schema 教程
XSL-FO 教程
SVG 教程
 ASP.NETASP.NET 教程
C# 教程
Web Pages 教程
Razor 教程
MVC 教程
Web Forms 教程
 Web ServiceWeb Service 教程
WSDL 教程
SOAP 教程
RSS 教程
RDF 教程
 开发工具Eclipse 教程
Git 教程
Svn 教程
Markdown 教程
 网站建设HTTP 教程
网站建设指南
浏览器信息
网站主机教程
TCP/IP 教程
W3C 教程
网站品质