去除标点符号java 去除标点符号的软件_正则匹配限制数字范围


在古籍文献的制作中,经常需要手工删掉标点符号,面对许多比较冗长文件的时候,有些有些同学会失去耐心,除了删除标点,有时会连同文章的有些正文也一起删掉,给后期的工作造成不必要麻烦。

其实这点小事儿,在InDesign中根本不是个事儿。略微掌握一点查找/替换功能,我们就可以做到一键删除所有的标点符号。一个不剩,一个不留,而且不会伤及无辜。具体怎么操作,我们看下面的步骤

其实,我们这里主要是用到InDesign的grep这个功能,这个功能在“查找/更改”之中,相当于InDesign的正则,说起正则大家可以比较高冷,这个东西一般多用在写代码之中,我们接触的比较少,但是如果你能把这个东西掌握好,将好比是手中有了手榴弹,可以非常轻松的解决文章中批量要解决的困难,而且要以嵌入“段落样式”之中,做到需要时体现,不需要时不起作用。今天我们主要说grep功能中的posix功能,正则我们以后会逐步的进行介绍。


去除标点符号java 去除标点符号的软件_正则匹配所有的汉字不匹配标点_02


去除标点符号java 去除标点符号的软件_正则匹配限制数字范围_03


当然除了查找/更改“”字符,还可以对它的格式进行限制,对具体符合要求的内容进行更改。这个与“段落样式”有关,可通过它对要查找的对象进行具体的限制,


去除标点符号java 去除标点符号的软件_正则匹配所有的汉字不匹配标点_04


另外有些同学说找不到“posix”时,那是因为许多人在“文本”这个选项中去找了。“posix”是在“grep”这个选项中使用的,“文本”选项只是普通文字类的查找/替换,它没有这种正则功能。


去除标点符号java 去除标点符号的软件_正则_05


在posix中,有几个经常使用的元素也告诉大家

[[:alnum:]],等价于字母+数字

[[:alpha:]],等价于字母

[[:digit:]],等价于数字

[[:lower:]],等价于小写字母

[[:punct:]],等价于标点符号

下面的几个,大家可以自已试验,以便熟练掌握。

另外,如果你在使用中,需要匹配汉字,照下图操作就可以了。


去除标点符号java 去除标点符号的软件_正则除了几个汉字的其它汉字_06


下面,我们就演示一下,如何一键去除所有的标点符号,当然在“查找”中选择“[[:punct:]]”,因为是要删除,所以“更改为”这里为空,什么都不选,这样这里所有的标点符号就全部删除干净了。


去除标点符号java 去除标点符号的软件_去除标点符号java_07


如果对内容有条件限制,可以在“搜索”中更改范围,如果你不进行选择具体的字符,这里面就是“文档”或“全部文档”。但是当你选择字符,这里会多出来三个内容,以对应你的选择。


去除标点符号java 去除标点符号的软件_正则匹配限制数字范围_08