python打印输出文件的行数

原创

mob649e815ecee0 2023-08-19 08:06:05 ©著作权

文章标签 读取文件生成器执行时间 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e815ecee0的原创作品，请联系作者获取转载授权，否则将追究法律责任

python打印输出文件的行数

概述

在处理文本文件时，我们经常需要统计文件中的行数。这对于分析数据、处理日志文件或者统计代码行数等任务来说非常有用。Python提供了多种方法来实现这个功能。本文将介绍几种常用的方法，并提供相应的代码示例。

方法一：使用`len()`函数

最简单的方法是使用len()函数来获取文件的行数。我们可以逐行读取文件内容，然后使用len()函数统计行数。下面是一个示例代码：

def count_lines(filename):
    with open(filename, 'r') as file:
        lines = file.readlines()
    return len(lines)

filename = 'example.txt'
line_count = count_lines(filename)
print(f"The file '{filename}' has {line_count} lines.")

上述代码定义了一个count_lines()函数，该函数接受一个文件名作为参数，并返回文件的行数。在函数内部，我们使用open()函数打开文件，并使用readlines()方法读取文件的所有内容。读取完毕后，我们使用len()函数统计行数，并将结果返回。

在代码的最后，我们调用count_lines()函数，并输出行数。

这种方法的优点是简单易懂，并且适用于任意大小的文件。然而，它需要一次性读取整个文件，对于大型文件来说可能会消耗大量内存。

方法二：遍历文件内容

如果我们不想一次性读取整个文件，可以使用一个循环逐行读取文件内容，并计算行数。下面是示例代码：

def count_lines(filename):
    count = 0
    with open(filename, 'r') as file:
        for line in file:
            count += 1
    return count

filename = 'example.txt'
line_count = count_lines(filename)
print(f"The file '{filename}' has {line_count} lines.")

上述代码中，我们使用open()函数打开文件，并在for循环中逐行读取文件内容。每次循环时，我们将计数器count加一。最后，我们返回计数器的值作为文件的行数。

这种方法的优点是对内存消耗较小，适用于处理大型文件。然而，它可能需要更长的执行时间，特别是对于非常大的文件来说。

方法三：使用生成器

如果我们对内存消耗非常敏感，可以使用生成器来逐行读取文件内容，并计算行数。生成器是一种特殊类型的函数，它可以在迭代过程中逐个生成值。下面是示例代码：

def count_lines(filename):
    with open(filename, 'r') as file:
        for line in file:
            yield line
    return

filename = 'example.txt'
line_count = sum(1 for _ in count_lines(filename))
print(f"The file '{filename}' has {line_count} lines.")

上述代码中，我们定义了一个生成器函数count_lines()。在函数内部，我们使用open()函数打开文件，并在for循环中逐行读取文件内容。通过使用yield关键字，我们可以将每一行作为生成器的值返回。最后，我们使用内置的sum()函数来计算生成器的元素个数，即文件的行数。

这种方法的优点是对内存消耗非常小，适用于处理大型文件。它的执行时间通常比方法二要快，但与方法一相比可能更慢。

性能比较

为了比较不同方法的性能，我们创建了一个包含10000行文本的示例文件。然后，我们使用这些方法来计算文件的行数，并记录执行时间。

下图是使用序列图表示的测试流程：

sequenceDiagram
    participant User
    participant Program
    User->>Program: Run program
    Program->>Program: Read file
    Program->>Program: Count lines
    Program->>Program: Print result
    Program-->>User: Display result

下表是不同方法的执行时间和内存消耗的比较结果：