《Python 性能优化：从代码层面（循环优化）到工具层面（cProfile 分析），提升运行速度》

原创

步步为莹 2025-10-13 08:01:59 ©著作权

文章标签 Python 全局变量局部变量 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者步步为莹的原创作品，请联系作者获取转载授权，否则将追究法律责任

在 Python 开发过程中，性能优化是不可忽视的环节。虽然 Python 提供了简洁的语法和丰富的库，但它的执行速度相比于其他语言（如 C 或 Java）通常较慢。因此，优化 Python 代码的执行效率，尤其是在性能瓶颈明显的场景中，显得尤为重要。

本文将提供从 代码优化 到 性能分析 的一系列实用方法，帮助你在开发中提高 Python 程序的运行速度，避免无谓的性能浪费。

1. 循环优化：减少不必要的操作

循环是程序中常见的性能瓶颈之一。通过减少循环中的不必要操作，可以显著提升程序的效率。以下是几种常见的循环优化策略：

1.1 列表推导式替代普通 for 循环

在 Python 中，列表推导式通常比普通的 for 循环更高效，因为它在内存中创建列表时比 for 循环更加优化。

优化前：

result = []
for i in range(1000000):
    result.append(i * 2)

优化后：

result = [i * 2 for i in range(1000000)]

通过将 for 循环转换为列表推导式，我们能够减少 append() 方法的调用次数，并且 Python 会在底层做一些优化来提升执行效率。

1.2 使用内置函数代替循环

Python 提供了许多内置函数（如 map()、filter()、sum() 等），它们通常比手动写的 for 循环更高效，尤其是对于大规模数据的处理。

优化前：

result = []
for i in range(1000000):
    result.append(i * 2)

优化后：

result = list(map(lambda x: x * 2, range(1000000)))

map() 函数通常比 for 循环更快，因为它直接在 C 层进行操作，而无需 Python 层的循环迭代。

1.3 使用生成器代替列表

如果循环操作生成的数据只需要一次使用（即不需要存储整个列表），可以使用生成器来减少内存的消耗。

优化前：

result = [i * 2 for i in range(1000000)]

优化后：

result = (i * 2 for i in range(1000000))

生成器通过惰性求值（lazy evaluation）按需生成数据，这样能有效节省内存开销，尤其是在处理大数据时。

1.4 避免在循环中做重复计算

如果在循环中有一些操作是重复的，应该将其提取到循环外部，避免不必要的重复计算。

优化前：

result = []
for i in range(1000000):
    result.append(i * 2 + 1)

优化后：

result = []
offset = 1
for i in range(1000000):
    result.append(i * 2 + offset)

2. 变量作用域优化：局部变量比全局变量更高效

在 Python 中，访问 局部变量 比访问 全局变量 快得多。因此，在函数内部尽量使用局部变量，避免不必要的全局变量调用。

2.1 使用局部变量替代全局变量

优化前：

x = 10  # 全局变量
def my_func():
    result = 0
    for i in range(1000000):
        result += x  # 访问全局变量
    return result

优化后：

def my_func():
    x = 10  # 局部变量
    result = 0
    for i in range(1000000):
        result += x  # 使用局部变量
    return result

在优化后的代码中，局部变量 x 的访问速度会比全局变量更快，尤其是在函数被多次调用时，差异会更加明显。

3. 使用 cProfile 工具进行性能分析

尽管我们可以在代码层面进行优化，但许多情况下，性能瓶颈并不容易发现。Python 提供了一个强大的性能分析工具 cProfile，它能够帮助我们定位代码中的瓶颈，并提供执行时间、调用次数等详细信息。

3.1 使用 cProfile 分析代码性能

示例代码：

import cProfile

def slow_function():
    result = []
    for i in range(1000000):
        result.append(i * 2)

cProfile.run('slow_function()')

输出示例：

4 function calls in 0.062 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.062    0.062 <ipython-input-1-bc47c617c227>:1(slow_function)
        1    0.000    0.000    0.062    0.062 <string>:1(<module>)
        1    0.000    0.000    0.062    0.062 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

在上述输出中，tottime 表示函数体内的执行时间，cumtime 表示函数的总执行时间，ncalls 表示函数被调用的次数。通过这些数据，我们可以看到哪部分代码的执行时间较长，从而进行进一步的优化。

3.2 使用 cProfile 进行函数调用分析

我们可以在代码中嵌入 cProfile 来分析更复杂的函数调用：

import cProfile

def optimized_function():
    result = []
    for i in range(1000000):
        result.append(i * 2)
    return result

def another_function():
    result = []
    for i in range(1000000):
        result.append(i * 3)
    return result

cProfile.run('optimized_function()')
cProfile.run('another_function()')

3.3 优化前后对比

通过使用 cProfile，我们能够直观地比较优化前后的执行时间和函数调用差异。比如，我们可以使用优化后的列表推导式与 for 循环进行对比，看看性能提升了多少。

4. 总结

循环优化：通过使用列表推导式、生成器、内置函数等方式，显著减少了循环中的冗余操作，提升了性能。
变量作用域优化：尽量避免在函数内部访问全局变量，使用局部变量可以提高访问速度。
性能分析工具（cProfile）：通过使用 cProfile 工具，能够准确定位代码中的瓶颈，为优化提供数据支持。

通过这篇文章提供的优化思路和实战技巧，你可以在日常开发中有效提升 Python 程序的性能，优化关键部分的执行速度，提升整体应用的响应能力。

询问 ChatGPT

上一篇：《用 Python 做简单的机器学习：Scikit-learn 入门，10 行代码实现鸢尾花分类》

下一篇：《Python 操作数据库：SQLAlchemy ORM 入门，告别原生 SQL，代码更易维护》

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯