java 如何获取两个字符串之间的汉字

原创

mob64ca12f6aae1 2023-08-06 21:25:41 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12f6aae1的原创作品，请联系作者获取转载授权，否则将追究法律责任

Java中获取两个字符串之间的汉字，可以通过正则表达式和循环遍历的方式实现。以下是一个示例代码：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ChineseCharacterExtractor {
    public static void main(String[] args) {
        String str = "abc你好def世界";
        String chineseCharacters = getChineseCharacters(str);
        System.out.println(chineseCharacters);
    }

    public static String getChineseCharacters(String str) {
        StringBuilder chineseCharacters = new StringBuilder();
        String regex = "[\\u4e00-\\u9fa5]"; // Unicode编码中的汉字范围
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        
        while (matcher.find()) {
            chineseCharacters.append(matcher.group());
        }
        
        return chineseCharacters.toString();
    }
}

代码解释如下：

创建一个ChineseCharacterExtractor类，并在main方法中定义一个输入字符串str。
调用getChineseCharacters方法，将输入字符串作为参数传入，并将返回值赋给chineseCharacters变量。
在getChineseCharacters方法中，通过正则表达式[\\u4e00-\\u9fa5]来匹配汉字。其中\\u4e00和\\u9fa5分别表示Unicode编码中汉字的起始和结束位置。
创建一个Pattern对象，并使用compile方法将正则表达式作为参数传入。
创建一个Matcher对象，并使用pattern.matcher方法将待匹配的字符串传入。
使用find方法在字符串中查找匹配的汉字，如果找到，则使用append方法将其追加到chineseCharacters变量中。
最后，返回chineseCharacters变量中的汉字字符串。