java 统计英文单词

原创

mob64ca12da2d62 2023-08-07 04:52:47 ©著作权

文章标签 java 文本文件 Java 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12da2d62的原创作品，请联系作者获取转载授权，否则将追究法律责任

Java统计英文单词

作为一名经验丰富的开发者，我将向你介绍如何使用Java统计英文单词。以下是整个过程的步骤：

读取文本文件
将文本文件中的内容分割成单词
统计每个单词的出现次数
排序并输出结果

接下来，我将详细解释每个步骤以及需要使用的代码。

1. 读取文本文件

首先，我们需要读取一个文本文件。可以使用Java的File类和Scanner类来实现。以下是读取文本文件的代码：

import java.io.File;
import java.io.FileNotFoundException;
import java.util.Scanner;

public class WordCount {
    public static void main(String[] args) {
        try {
            File file = new File("input.txt"); // 替换为你的文本文件路径
            Scanner scanner = new Scanner(file);

            // 逐行读取文本文件内容
            while (scanner.hasNextLine()) {
                String line = scanner.nextLine();
                // 处理每一行的代码
            }

            scanner.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
    }
}

在上面的代码中，我们使用File类来表示要读取的文件，并使用Scanner类来逐行读取文件内容。你需要将input.txt替换为你要统计的文本文件的路径。

2. 将文本文件中的内容分割成单词

接下来，我们需要将文本文件中的内容分割成单词。可以使用正则表达式来实现。以下是分割单词的代码：

import java.io.File;
import java.io.FileNotFoundException;
import java.util.Scanner;

public class WordCount {
    public static void main(String[] args) {
        try {
            File file = new File("input.txt"); // 替换为你的文本文件路径
            Scanner scanner = new Scanner(file);

            while (scanner.hasNextLine()) {
                String line = scanner.nextLine();
                String[] words = line.split("\\s+"); // 使用空格分割单词

                // 处理每个单词的代码
            }

            scanner.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
    }
}

在上面的代码中，我们使用split("\\s+")方法将每一行的内容按照空格进行分割，得到一个单词数组words。

3. 统计每个单词的出现次数

现在，我们需要统计每个单词的出现次数。可以使用HashMap来存储每个单词及其出现次数。以下是统计单词出现次数的代码：

import java.io.File;
import java.io.FileNotFoundException;
import java.util.HashMap;
import java.util.Map;
import java.util.Scanner;

public class WordCount {
    public static void main(String[] args) {
        try {
            File file = new File("input.txt"); // 替换为你的文本文件路径
            Scanner scanner = new Scanner(file);

            Map<String, Integer> wordCount = new HashMap<>();

            while (scanner.hasNextLine()) {
                String line = scanner.nextLine();
                String[] words = line.split("\\s+");

                for (String word : words) {
                    if (wordCount.containsKey(word)) {
                        wordCount.put(word, wordCount.get(word) + 1); // 单词已存在，增加计数
                    } else {
                        wordCount.put(word, 1); // 单词不存在，计数初始化为1
                    }
                }
            }

            scanner.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
    }
}

在上面的代码中，我们使用HashMap来存储每个单词及其出现次数。对于每个单词，我们检查它是否已存在于HashMap中。如果存在，则增加计数；如果不存在，则将单词作为键，计数初始化为1。

4. 排序并输出结果

最后，我们需要对单词按照出现次数进行排序，并将结果输出。可以使用Java 8中的Stream API来实现。以下是排序和输出结果的代码：

import java.io.File;
import java.io.FileNotFoundException;
import java.util.*;

public class WordCount {
    public static void main(String[] args) {
        try {
            File file = new File("input.txt"); // 替换为你的文本文件路径
            Scanner scanner = new Scanner(file);

            Map<String, Integer> wordCount = new HashMap<>();

            while (scanner