Python是一种广泛使用的高级编程语言,以简洁易读的语法和强大的功能而著称。它支持面向对象、函数式和过程式编程,并允许开发者用少量代码表达想法。Python的库和框架非常丰富,适用于Web开发、数据分析、机器学习、科学计算和自动化运维等多个领域。此外,Python具有跨平台特性,能在Windows、Linux和Mac OS等操作系统上运行。由于其易用性和高效性,Python已成为许多开发者和数据科学家的首选语言。

Python常用的模块有很多,这些模块提供了丰富的功能和工具,帮助开发者更高效地编写代码。系统上讲其主要分为内置模块和第三方模块两大类,且不同模块应用场景不同又可以分为文本类、数据结构类、数学运算类、文件系统类、爬虫类、网络通讯类等多个类型。

常用的内置模块比如:math、re、datetime、urllib、os、random等,第三方模块比如pandas、numpy、requests、matplotlib等。

什么是Python模块?

模块是将复杂的、同一应用领域的功能代码进行封装,你只需要调用接口,输入相应参数,便可以轻松拿到结果,类似瑞士军刀、万能工具箱

常用内置模块,约200多个

内置模块,顾名思义就是Python软件内嵌的模块,无需额外安装。

想要了解详细的内置模块,最好去Python官网看,挺详细的

https://docs.python.org/zh-cn/3/library/index.html

你也可以在代码行输入print(help(modules)),会显示全部的内置模块

这里举几个常用的内置模块,并附上代码:

math 模块 - 用来进行数学计算,它提供了很多数学方面的专业函数,适合科研、算法

import math

# 计算平方根
sqrt_value = math.sqrt(25)
print("Square Root:", sqrt_value)

# 计算正弦值
sin_value = math.sin(math.radians(30))
print("Sine Value:", sin_value)

re 模块 - 正则表达式在Python中的扩展实现,该模块能支持正则表达式几乎所有语法,对于文本处理来说必不可少

import re

# 查找匹配的字符串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)

datetime 模块 - 用于处理日期和时间,这个模块非常实用!!!

import datetime

# 获取当前日期和时间
current_datetime = datetime.datetime.now()
print("Current Date and Time:", current_datetime)

# 格式化日期时间
formatted_datetime = current_datetime.strftime("%Y-%m-%d %H:%M:%S")
print("Formatted Date and Time:", formatted_datetime)

urllib 模块 - 用于进行网络请求,获取网页HTML,所谓的爬虫就是这个模块

import urllib.request

# 发起HTTP GET请求
response = urllib.request.urlopen("https://www.example.com")
html = response.read()
print("HTML Content:", html[:100])

os 模块 - 提供了与操作系统交互的功能,比如文件和目录操作

import os

# 获取当前工作目录
current_dir = os.getcwd()
print("Current Directory:", current_dir)

# 列出目录中的文件和子目录
files_and_dirs = os.listdir(current_dir)
print("Files and Directories:", files_and_dirs)

random 模块 - 用于生成伪随机数

import random

# 生成随机整数
random_integer = random.randint(1, 10)
print("Random Integer:", random_integer)

# 从列表中随机选择元素
random_element = random.choice(["apple", "banana", "cherry"])
print("Random Element:", random_element)

json 模块 - 专门用来处理 JSON 格式数据

import json

# 将字典转换为 JSON 格式的字符串
data = {"name": "Alice", "age": 25}
json_string = json.dumps(data)
print("JSON String:", json_string)

# 将 JSON 格式的字符串转换为字典
parsed_data = json.loads(json_string)
print("Parsed Data:", parsed_data)

collections 模块 - 提供了一些除list、dict之外有用的数据容器,比如 defaultdict、Counter 等

from collections import defaultdict, Counter

# 创建默认字典
word_counts = defaultdict(int)
words = ["apple", "banana", "apple", "cherry", "banana", "apple"]
for word in words:
    word_counts[word] += 1
print("Word Counts:", word_counts)

# 统计元素出现的次数
element_counts = Counter(words)
print("Element Counts:", element_counts)

csv 模块 - 专门用于处理逗号分隔值(CSV)文件

import re

# 查找匹配的字符串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)

sys 模块 - 提供了与Python解释器交互的功能,例如访问命令行参数

import sys

# 获取命令行参数
arguments = sys.argv
print("Command-line Arguments:", arguments)

常用的第三方模块非常多

Python之所以这么受欢迎,很大一部分原因得益于强大的第三方工具生态,几乎各个领域都有对应的模块可以使用。

比如数据科学领域:pandas、numpy、scipy、sympy

可视化领域:matplotlib、seaborn、plotly、bokeh、pyecharts

机器学习领域:scikit-learn、keras、Tensorflow

大数据领域:pyspark、pyflink

爬虫领域:requests、scrapy、bs4

金融量化领域:ta-lib、zipline、pyfolio

其他各领域都有相应的模块可以使用,需大家多去了解