统计单词出现的次数java

原创

mob649e816209c2 2024-07-27 09:19:42 ©著作权

©著作权归作者所有：来自51CTO博客作者mob649e816209c2的原创作品，请联系作者获取转载授权，否则将追究法律责任

统计单词出现的次数（Java）

在处理文本数据时，我们经常需要统计单词出现的次数。在Java中，我们可以通过一些简单的步骤来实现这个功能。本文将介绍如何使用Java编程语言来统计单词出现的次数，并提供一个简单的代码示例。

流程图

首先，我们可以通过以下流程图来理解整个处理过程：

flowchart TD
    A[开始] --> B[读取文本]
    B --> C[分割文本为单词]
    C --> D[初始化单词计数器]
    D --> E[遍历单词]
    E --> F[更新单词计数]
    F --> G[输出单词及其计数]
    G --> H[结束]

代码示例

下面是一个简单的Java代码示例，用于统计单词出现的次数：

import java.util.*;

public class WordCount {
    public static void main(String[] args) {
        String text = "This is a sample text. This text is for testing.";

        // 将文本分割为单词
        String[] words = text.split("\\s+");

        // 初始化单词计数器
        Map<String, Integer> wordCount = new HashMap<>();

        // 遍历单词并更新计数
        for (String word : words) {
            word = word.toLowerCase(); // 转换为小写以忽略大小写
            word = word.replaceAll("[^a-zA-Z0-9]", ""); // 移除标点符号

            if (word.isEmpty()) {
                continue;
            }

            wordCount.put(word, wordCount.getOrDefault(word, 0) + 1);
        }

        // 输出单词及其计数
        for (Map.Entry<String, Integer> entry : wordCount.entrySet()) {
            System.out.println(entry.getKey() + ": " + entry.getValue());
        }
    }
}