正则表达式是什么?
简单的说就是,用一小段简单的各种字符的组合,即叫做 正则表达式,去实现复杂的: 字符串匹配,查找你到你所需要的内容,以便后期提取出来你所要的内容。
这个听起来很简单,但是很多现实的应用中,所要处理的字符串有千千万万种,各种复杂的字符,而且每个人的需求有无穷尽种,需要提取出的内容也是无穷多。而如果手动处理,写普通的if else语句去一点点判断字符串是否相等,则是无法实现的。
而用正则,就可以实现如此多的,繁杂的,极度复杂的,各种需求。
首先来两段代码。
* 判断邮箱名称是否有效
cPattern="^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$"
Regex = Createobject("NewXing.RegExp")
?Regex.Test("abc@abc.com",cPattern)
*--判断手机号输入是否有效
cPattern="^1(3[0-9]|5[0-3,5-9]|7[1-3,5-8]|8[0-9])\d{8}$"
Regex = Createobject("NewXing.RegExp")
?Regex.Test("18910011001",cPattern)
本组件用的是DEELX 正则引擎封装的com组件。所以VFP可用,其它语言也都可以用。
特点: 1、完全兼容VBScript.RegExp 正则组件的各种属性与方法 2、支持与 Perl 兼容的正则表达式语法。 3、支持 Ignorecase, Singleline, Multiline… 等常见匹配模式。 4、支持命名分组,条件表达式,递归表达式,零宽断言…等多种高级特性。
一、NewXing.RegExp 对象
属性 |
描述 |
---|---|
Global |
是否全局匹配,默认值False,即只会匹配一次,如要匹配所有需将它的值设置为True |
IgnoreCase |
匹配时是否忽略大小写,默认是区分大小的。值:(True/False) |
Pattern |
用于设置正则表达式。值:字符串 |
Multiline |
多行模式。使 ^ 符号除了能够匹配字符串开始位置外,还能匹配换行符(\n)之后的位置;使 $ 符号除了能够匹配字符串结束位置外,还能匹配换行符之前的位置。默认情况下, ^ 符号只能匹配字符串开始位置, $ 符号只能匹配字符串结束位置。SINGLELINE 和 MULTILINE 虽然听起来相互矛盾,但却是作用在不同的地方。因此它们是可以组合使用的。在指定了 MULTILINE 之后,如果需要仅匹配字符串开始和结束位置,可以使用 \A 和 \Z。 |
Singleline * |
单行模式。使小数点 "." 可以匹配包含换行符(\n)在内的任意字符。默认情况下,小数点只匹配换行符以外的任意字符,不匹配换行符。 |
RightToLeft * |
从右向左的进行匹配。从被匹配字符串的结束位置向前进行查找匹配,同时,在表达式中也是右侧的表达式先进行匹配。 |
Extended * |
忽略表达式中的空白字符,并且把从 # 开始到该行行末的内容视为注释。默认情况下,正则表达式中的空格,换行等字符将可以匹配相应的字符。指定了 EXTENDED 模式后,如果要在正则表达式中表示空白字符比如空格符号(space)时,应该用 \x20 表示,如果要在表达式中表示 # 符号,应该用 \# 表示。不管是否指定了 EXTENDED 模式,括号内以 ?# 号开始时,比如(?# xxx ),那么这一对括号以及包含的内容都始终作为注释而被忽略。 |
提示:IgnoreCase、Singleline、Global、Multiline、RightToLeft、Extended 这几个属性可用flags参数来设置(后面会讲到),也可以说这几个属性是多余的,只是为了兼容VBScript.RegExp 正则的语法而增加了。
方法 |
描述 |
---|---|
Execute |
该方法用来查找字符串,找到的字符串将通过MatchCollection集合返回。 |
Replace |
这个方法用于替换在正则表达式搜索中找到的文本。 |
Test |
Test方法对字符串执行正则表达式搜索,并返回一个布尔值说明匹配是否成功。 |
Split * |
按照指定的表达式字符串对目标字符串进行分割并返回一维数组。 |
二、NewXing.MatchCollection 对象
MatchCollection 是集合对象,包含有关匹配字符串的信息,该对象包含每个成功匹配的 Match 对象。
属性 |
描述 |
---|---|
Count |
匹配对象的总数。 |
Item |
匹配对象的索引。 |
三、NewXing.Match 对象
Match 是成功匹配的对象。
属性 |
描述 |
---|---|
FirstIndex |
匹配对象所匹配字符串的起始位置。 |
Length |
匹配对象所匹配字符串的字符长度。 |
SubMatches |
匹配对象所匹配结果的子项,返回SubMatches集合。通过该集合可以获取匹配到的各个命名分组结果。 |
Value |
匹配对象所匹配的值。 |
Named * |
通过命名分组的名字来获取匹配到的结果。 |
四、NewXing.SubMatches 对象
SubMatches 得到当次匹配到的所有“分组”结果集合。
属性 |
描述 |
---|---|
Count |
分组总数 |
Item |
匹配到的结果索引。 |
五、最后说一下NewXing.RegExp 对象的4个方法的相关参数与作用。
语法:
- Execute
Execute (sourceString As String, [pattern As String], [flags As String], [start As Long] = -1) As MatchCollection
- Replace
Replace (sourceString As String, replaceVar As String, [pattern As String], [flags As String], [start As Long] = -1, [times As Long] = -1) As String
- Test
Test (sourceString As String, [pattern As String], [flags As String], [start As Long] = -1) As Boolean
- Split
Split (sourceString As String, [pattern As String], [flags As String], [start As Long] = -1, [times As Long] = -1) As Object