网站首页 > java教程 正文
需求:给定文件命名格式,给定目录,列出其下所有满足格式的文件。格式:YYYYMMDD_单号_USER_XXXX.xlsx
为了做到通用性,计划用正则表达式去匹配。
^2[0-9]{7}_(.*){1,}_USER_[0-9]{4}.(xls|xlsx)$
目录下都满足条件还好,很快匹配上了。
20200512_0011_USER_0001.xls
20200512_0011_USER_0002.xls
20200512_0011_USER_0003.xls
但是运行一段时间,发现应用卡住半小时才执行完文件名匹配任务。
发现目录下还有其他文件,为啥会这么耗时呢?
sysout测试一下,发现条件不匹配正则表达式时,程序卡住不动了!!
顺便推荐个插件:devutils
base64编解码,Regex匹配,DigestUtil各种MD5/sha算法加密,URLCodec,socketClient,socketServer创建等
System.out.println("20200530_m-12321300111M-123_PROD_0001.xlsx"
.matches("^2[0-9]{7}_(.*){1,}_USER_[0-9]{4}.(xls|xlsx)#34;));
网上搜了半天,有人说正则表达式的效率较低,但是不用正则还有什么办法呢?!
试着把正则表达式写得不要那么严格点,效率正常了。
##原来的正则表达式
^2[0-9]{7}_(.*){1,}_USER_[0-9]{4}.(xls|xlsx)$
##新的正则表达式
^2[0-9]{7}_[\\w|-]{1,}_USER_[0-9]{4}.(xls|xlsx)$
通过比对,发现第二段匹配单号条件写为(.*),在文件名不匹配的时候,单号越长,匹配效率越差。
在明确写为[\\w|-]之后,只匹配字母/数字/减号,效率提高很多。
看来针对不匹配模式,如果字符串复杂度或者长度越长,表达式越模糊,执行效率越差。
猜你喜欢
- 2024-11-16 String.replaceAll方法,正则妙用
- 2024-11-16 348.C# 中的正则表达式断言:精确匹配的秘诀
- 2024-11-16 《MySQL 入门教程》第 09 篇 字符串模式匹配
- 2024-11-16 mysql正则匹配中文时存在的问题(mysql 正则匹配)
- 2024-11-16 技术趣讲 | 60 分钟搞懂「正则表达式」
- 2024-11-16 PHP 正则表达式匹配中文问题(php正则表达式匹配字符串)
- 2024-11-16 JZ-052-正则表达式匹配(正则表达式 匹配?)
- 2024-11-16 Nginx Location深入了解匹配优先级的秘密#java面试
- 2024-11-16 PHP正则表达式核心技术完全详解 第7节 数组元素正则匹配
- 2024-11-16 你知道python正则表达式如何跨行匹配吗?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)