匹配文件后缀名的正则表达式_正则表达式匹配文件名_耶耶as的博客

相关文章推荐

害羞的小熊猫 · iOS和iPadOS 16 Beta ...· 8 月前 ·

傻傻的针织衫 · 三方开源大语言模型_大模型服务平台-阿里云帮助中心· 1 年前 ·

逼格高的李子 · 【泡泡点云时空】利用三维正态分布变换（3D- ...· 1 年前 ·

安静的春卷 · PHP数组定义写法和数组赋值以及数组的循环- ...· 1 年前 ·

激动的警车 · oracle sql like concat-掘金· 1 年前 ·

之前没怎么了解过正则表达式的，最近项目中有了需求所以认真地学习了一边。下面简单介绍一下正则表达式，不太清楚的同胞们可以初步了解一下
可以在菜鸟教程上进行学习哦 ~ 菜鸟教程

正则表达式是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式，该模式描述在搜索文本时要匹配的一个或多个字符串。
下面演示一下文件后缀名的正则表达式怎么匹配：

^\w*\.(pdf|png|jpeg|jpg|docx|xlsx|pjpg|svg)$ 
这个是一些常见的文件后缀名
 这些在文件名是英文名时会正常匹配的，但文件名是中文名的话 会有问题的，那下面我没解决一些这个问题： 
^[\s\S]*\.(pdf|png|jpeg|jpg|docx|xlsx|pjpg|svg)$
这样就可以实现了，问题也解决了 
有空可以看一下一些常用的正则表达式： 
常用的正则表达式
 
一、校验数字的表达式
 
数字：1*$
n位的数字：^\d{n}$
至少n位的数字：^\d{n,}$
m-n位的数字：^\d{m,n}$
零和非零开头的数字：^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数：^(-)?\d+(.\d{1,2})$
正数、负数、和小数：^(-|+)?\d+(.\d+)?$
有两位小数的正实数：²+(.[0-9]{2})?$
有1~3位小数的正实数：³+(.[0-9]{1,3})?$
非零的正整数：⁴\d*$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
非零的负整数：^-[1-9][]0-9"$ 或 ^-[1-9]\d$
非负整数：^\d+$ 或 ⁵\d*|0$
非正整数：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非负浮点数：^\d+(.\d+)?$ 或 ⁶\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$
非正浮点数：^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$
正浮点数：⁷\d*.\d*|0.\d*[1-9]\d*$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数：^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数：^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$ 
二、校验字符的表达式
 
汉字：8{0,}$
英文和数字：⁹+$ 或 ¹⁰{4,40}$
长度为3-20的所有字符：^.{3,20}$
由26个英文字母组成的字符串：¹¹+$
由26个大写英文字母组成的字符串：¹²+$
由26个小写英文字母组成的字符串：¹³+$
由数字和26个英文字母组成的字符串：¹⁴+$
由数字、26个英文字母或者下划线组成的字符串：^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线：¹⁵+$
中文、英文、数字但不包括下划线等符号：¹⁶+$ 或 ¹⁷{2,20}$
可以输入含有^%&',;=? $KaTeX parse error: Can't use function '\"' in math mode at position 1: \̲"̲等字符：**[^%&',;=?$ \x22]+**
禁止输入含有_{的字符：**[^}]+** 
三、特殊需求表达式
 
Email地址：^\w+([-+.]\w+)*@\w+([-.]\w+)*.\w+([-.]\w+)*$
域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+.?
InternetURL：[a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码：^(13[0-9]|14[5|7]|15[0|1|2|3|4|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
电话号码(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXX-XXXXXXXX”、"XXXXXXX"和"XXXXXXXX)：^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-4405222、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7}
电话号码正则表达式（支持手机号码，3-4位区号，7-8位直播号码，1－4位分机号）: ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份证号(15位、18位数字)，最后一位是校验位，可能为数字或字符X：(^{\d{15}$)|(^\d{18}$)|(}\d{17}(\d|X|x)$)帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：18[a-zA-Z0-9_]{4,15}$
密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线)：¹⁹\w{5,17}$
强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在 8-10 之间)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
强密码(必须包含大小写字母和数字的组合，可以使用特殊字符，长度在8-10之间)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
日期格式：^\d{4}-\d{1,2}-\d{1,2}
一年的12个月(01～09和1～12)：^(0?[1-9]|1[0-2])$
一个月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式： 
  有四种钱的表示形式我们可以接受:“10000.00” 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000”：²⁰[0-9]*$
这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式：^(0|[1-9][0-9]*)$
一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号：^(0|-?[1-9][0-9]*)$
这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧。下面我们要加的是说明可能的小数部分：²¹+(.[0-9]+)?$
必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 “10” 和 “10.2” 是通过的：²²+(.[0-9]{2})?$
这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样：²³+(.[0-9]{1,2})?$
这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样：²⁴{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须：^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
备注：这就是最终结果了,别忘了"+“可以用”*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
 
xml文件：^([a-zA-Z]±?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
中文字符的正则表达式：[\u4e00-\u9fa5]
双字节字符：[^\x00-\xff] (包括汉字在内，可以用来计算字符串的长度(一个双字节字符长度计2，ASCII字符计1))
空白行的正则表达式：\n\s*\r (可以用来删除空白行)
HTML标记的正则表达式：<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正则表达式：^\s*|\s* $KaTeX parse error: Undefined control sequence: \s at position 4: 或(^\̲s̲\*)|(\s\*$ ) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式)
腾讯QQ号：[1-9][0-9]{4,} (腾讯QQ号从10000开始)
中国邮政编码：[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
IPv4地址：((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})){3} 
 0-9 ↩︎
 
0-9 ↩︎
 
0-9 ↩︎
 
1-9 ↩︎
 
1-9 ↩︎
 
1-9 ↩︎
 
1-9 ↩︎
 
\u4e00-\u9fa5 ↩︎
 
A-Za-z0-9 ↩︎
 
A-Za-z0-9 ↩︎
 
A-Za-z ↩︎
 
A-Z ↩︎
 
a-z ↩︎
 
A-Za-z0-9 ↩︎
 
\u4E00-\u9FA5A-Za-z0-9_ ↩︎
 
\u4E00-\u9FA5A-Za-z0-9 ↩︎
 
\u4E00-\u9FA5A-Za-z0-9 ↩︎
 
a-zA-Z ↩︎
 
a-zA-Z ↩︎
 
1-9 ↩︎
 
0-9 ↩︎
 
0-9 ↩︎
 
0-9 ↩︎
 
0-9 ↩︎
  
 	……	String reg = "([^<>/\\\\|:\"\"\\*\\?]+)\\.\\w+$+";
        Matcher m = Pattern.compile(reg).matcher(uri); //uri为需要匹配的路径	Sring filename =  null;
                                           今天把手机里的图片通过qq发送到电脑上，发现文件多了后缀“.gif.JPG”。手动改因为图片太多了，就用java代码给文件去掉多余的后缀。        要迭代所有的文件夹下的所有文件，并判断当前文件是否存在多余后缀public static void main(String[] args) {
        //创建文件路径
//        String string = "...
                                    1) . : 匹配任意单ASCII 字符,可以为字母，或为数字。2) 举例: ..XC..匹配deXC1t、23XCdf等，.w..w..w.匹配rwxrw-rw-行首以^匹配字符串或字符序列1) ^ : 允许在一行的开始匹配字符或单词。2) 举例: ^.01 匹配0011cx4、c01sdf 等，^d匹配drwxr-xr-x、drw-r--r--等行尾以$匹配字符串或字符1) $ : 在行尾匹配...
public class ValidateFile {
    public static void main(String[] args) throws Exception {
        validateFilenameSuffix();
    public static void validateFilenameSuffix()
 var extRegex = require ( 'ext-regex' ) ;
'a/b/c.min.js' . match ( extRegex ( ) ) ;
//=> ['.min.js', '.js', 'js'];
'a/b/c/.gitignore' . match ( extRegex ( ) ) ;
//=> ['.gitignore', '.gitignore', 'gitignore']
'a/b/c' . match ( extRegex ( ) ) ;
//=> null
'a/b/c.js' . test ( extRegex ( ) ) ;
//=> true
安装开发依赖： 
                                    上述代码中，利用re.match()函数对每个文件名进行正则匹配，其中正则表达式为’.*‘+file_suffix+’$'，表示以任意字符开头，后接指定的后缀名并以字符串结尾，也就是匹配以指定后缀名结尾的文件名。在进行文件操作时，有时需要快速查找需要的文件，这时可以使用Python提供的正则表达式来快速筛选出符合要求的文件。接下来，使用os模块的listdir()函数获取目标目录下的所有文件列表，并对每一个文件名进行正则匹配。通过上述代码，可以快速地寻找指定后缀名的文件并进行相应的操作，提高了编程效率。
                                    在系统中处理文件或者文件夹时，都需要对正则表达式有一定的理解。正则表达式是用来定义模式的字符，模式可以用来搜索文本文件或者列出文件和文件夹。
正则表达式的各个部分有很多方法来进行区分，为了便于理解，我们将它分成较多的几个部分，使每个部分尽可能的简单。
正则表达式有以下几个部分：
1）Characters and Groups
2）Anchors
3）Class/Range
4）Q...
                                    正则表达式用来在文件中匹配符合条件的字符串，正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。通配符用来匹配符合条件的文件名，通配符是完全匹配的。ls、find、cp这些命令不支持正则表达式，所以只能使用Shell自己的通配符来进行匹配了。
                                    一．正则表达式匹配，其中：* ~ 为区分大小写匹配* ~* 为不区分大小写匹配* !~和!~*分别为区分大小写不匹配及不区分大小写不匹配二．文件及目录匹配，其中：* -f和!-f用来判断是否存在文件* -d和!-d用来判断是否存在目录* -e和!-e用来判断是否存在文件或目录* -x和!-x用来判断文件是否可执行三．rewrite指令的最后一项参数为flag标记，flag标记有：1.last ...