csv文件的介绍

以下是来自百度百科的介绍

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本来开启,再则先另存新档后用EXCEL开启,也是方法之一。

csv文件的读取方式

1、java原生方式

当读取的是一个简单的csv文件,即文件的列字段中不包含分隔符时,可以使用BufferedReader或者Scanner类去读取

BufferedReader方式

// 创建 reader
try (BufferedReader br = Files.newBufferedReader(Paths.get("users.csv"))) {
    // CSV文件的分隔符
    String DELIMITER = ",";
    // 按行读取
    String line;
    while ((line = br.readLine()) != null) {
        // 分割
        String[] columns = line.split(DELIMITER);
        // 打印行
        System.out.println("User["+ String.join(", ", columns) +"]");
    }
} catch (IOException ex) {
    ex.printStackTrace();
}

输出

User[1, John Doe, john@example.com, AE]
User[2, Alex Jones, alex@example.com, DE]
User[3, Jovan Lee, jovan@example.com, FR]
User[4, Greg Hover, greg@example.com, US]

Scanner方式 

// 创建scanner
try (Scanner scanner = new Scanner(Paths.get("users.csv").toFile())) {
    // CSV文件分隔符
    String DELIMITER = ",";
    // 设置分隔符
    scanner.useDelimiter(DELIMITER);
    // 读取
    while (scanner.hasNext()) {
        System.out.print(scanner.next() + " ");
    }
} catch (IOException ex) {
    ex.printStackTrace();
}

输出

1 John Doe john@example.com AE
2 Alex Jones alex@example.com DE
3 Jovan Lee jovan@example.com FR
4 Greg Hover greg@example.com US

 2、第三方库

第三方库提供更加丰富且成熟的功能,可以更加方便的读和写,版本号可以使用最新版

OpenCSV

pom中引入以下jar

<dependency>
    <groupId>com.opencsv</groupId>
    <artifactId>opencsv</artifactId>
    <version>5.0</version>
</dependency>

读文件:

try (Reader reader = Files.newBufferedReader(Paths.get("users.csv"));
     CSVReader csvReader = new CSVReader(reader)) {

    String[] record;
    while ((record = csvReader.readNext()) != null) {
        System.out.println("User["+ String.join(", ", record) +"]");
    }
} catch (IOException | CsvValidationException ex) {
    ex.printStackTrace();
}

Apache Commons CSV

pom中引入以下jar

<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-csv</artifactId>
    <version>1.7</version>
</dependency>

读文件:

try (Reader reader = Files.newBufferedReader(Paths.get("users.csv"))) {
    Iterable<CSVRecord> records = CSVFormat.DEFAULT.parse(reader);
    for (CSVRecord record : records) {
        System.out.println("Record #: " + record.getRecordNumber());
        System.out.println("ID: " + record.get(0));
        System.out.println("Name: " + record.get(1));
        System.out.println("Email: " + record.get(2));
        System.out.println("Country: " + record.get(3));
    }
} catch (IOException ex) {
    ex.printStackTrace();
}

javacsv

个人使用的是这种方法,可以查看API手册,其实也不用单独查看,在使用中学习即可,pom中引入以下jar

<dependency>
  <groupId>net.sourceforge.javacsv</groupId>
  <artifactId>javacsv</artifactId>
  <version>2.0</version>
</dependency>

读文件:

public static void read() throws IOException {

        // 第一参数:读取文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
        CsvReader csvReader = new CsvReader("F:/demo.csv", ',', Charset.forName("UTF-8"));

        // 如果你的文件没有表头,这行不用执行
        // 这行不要是为了从表头的下一行读,也就是过滤表头
        csvReader.readHeaders();

        // 读取每行的内容
        while (csvReader.readRecord()) {
            // 获取内容的两种方式
            // 1. 通过下标获取
            System.out.print(csvReader.get(0));

            // 2. 通过表头的文字获取
            System.out.println(" " + csvReader.get("年龄"));
        }
    }

写文件:

public static void writer() throws IOException {

        // 第一参数:新生成文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
        CsvWriter csvWriter = new CsvWriter("F:/demo.csv", ',', Charset.forName("UTF-8"));

        // 表头和内容
        String[]  headers = {"姓名", "年龄", "性别"};
        String[] content = {"张三", "18", "男"};

        // 写表头和内容,因为csv文件中区分没有那么明确,所以都使用同一函数,写成功就行
        csvWriter.writeRecord(headers);
        csvWriter.writeRecord(content);

        // 关闭csvWriter
        csvWriter.close();

    }