这几天重拾Java写代码,须要操做文本文件中的内容。正则表达式

最终,要把内容里的空行和多余的连续空格移除,使用String里的replace或者replaceAll,试了不少次都没有成功。spa

最后发现须要使用正则表达式Regex。先把解决方案共享以下。rem

1. 移除多余的连续空格,只留下一个空格。字符串

string.replaceAll("\\s{2,}", " ");

string

比较简单\\s表明空格,使用贪婪表达式,若是是2个或多个空格,则替换为空格。方法

续,实践中发现不工做原来\\s不光表明空格,是等于[ \t\n\x0B\f\r]tab

\\p{Blank}{2,} 则是A space or a tab

跨平台

更简单的 string.replaceAll("[ ]+", " ");文件

2. 移除空行解决方案

string.replaceAll("(?m)^\\s*$"+System.lineSeparator(), "");

?m开启多行模式,^是行开始,\\s*表明任意个空格,$表明行结束,System.lineSeparator()则是为了跨平台的换行符。

故全部空行包括只含有空格的空行都会被替换为空字符串,即被移除。

考虑到不一样平台的文件存在混用的状况,能够改进为 string..replaceAll("(?m)^\\s*$(\\n|\\r\\n)", "");

3. 替换字符串中的惟一子字符串,若是子字符串含有正则表达式字符,则替换不成功。

能够考虑本身写一个方法实现。

public String removeString(String str, String old) {
int i = str.indexOf(old);
if (i >= 0) {
return str.substring(0, i) + str.substring(i + old.length());
}
return str;
}

综上, 但愿能够帮到你们。