用正则表达式获取文件名和路径

关注 mb5fdb0f93c5ca2

用正则表达式获取文件名和路径

转载

mb5fdb0f93c5ca2 2013-08-22 18:10:00

文章标签 斜杠文件名路径和正则表达式 perl 文章分类 MySQL 数据库

一个文件中包括文件的路径和文件名，用正则表达式来分割路径和文件名

$WholePath = "/usr/lib/file.txt";
$leadPath = "";
$fileName = "";
if ($WholePath =~ m!^(.*)/([^/]*)$!) {

	#能够匹配 $1 和 $2都合法
	
	$leadPath = $1;
	$fileName = $2
} else {

	#无法匹配， 文件名中不含'/'
	$leadPath = ".";
	$fileName = $WholePath;
}

print "leadPath: ".$leadPath."\n";
print "fileName: ".$fileName."\n"

效果为：

leadPath: /usr/lib
fileName: file.txt

使用语言：perl

这里用了两个括号来匹配路径和文件名，perl是使用的传统的NFA（非确定有限自动机），讲一下原理;

NFA使用是深度搜索回溯的方法，所以在写正则表达式的时候，需要考虑的正则表达式的效率问题，

如前面的例子:

!^(.*)/([^/]*)$! ——这里使用叹号“!”是因为里面有斜杠"/"

在NFA中如： “ .* ” 这样的式子，有用点号"."可以匹配任意字符，所以两个字符的组合第一次直接把字符串给匹配完了

接着后面出现了一个斜杠，但此时已经匹配到末尾了，所以匹配会回溯，直到第一个斜杠，然后这里匹配成功，接着

是所有的非斜杠字符，那这当然是文件名了，然后匹配结束。

这里需要注意几点：

一，应该使用脱字符号"^"因为匹配重第一个字符开始，匹配到最后，如果变量$WholePath中没有斜杠，

匹配会一直回溯到第一个字符，此时匹配不成功，然而，因为没有脱字符，匹配会尝试重第二个字符

开始匹配，并回溯到第二个字符，然后是第三个....直到最后一个字符，这只是一个小的字符串，如果

是一个很长的文本，那么就会很费时了，所以，写正则的时候，应考虑到脱字符，这样加上后，当第一次

回溯到第一个字符时，就匹配失败了，这样时间就快了很多。

二，使用“.*”时，匹配是直接匹配的一行的结束，然后才回溯匹配的，一般来说深度搜索的效率比较低，所以

应该尽可能的减少多余的回溯

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：[置顶] 有关ListIterator接口的add与remove方法探究

下一篇：[置顶] java web 动态服务器

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册