8.1 模块

在前面我们脚本是用 Python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了。

为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。

模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。

8.1.1 什么是模块

对比

容器

数据的封装

函数

语句的封装


方法和属性的封装

模块

程序文件

8.1.2 命名空间

命名空间因为对象的不同,也有所区别,可以分为如下几种:

  1. 内置命名空间(Built-in Namespaces):Python 运行起来,它们就存在了。内置函数的命名空间都属于内置命名空间,所以,我们可以在任何程序中直接运行它们,比如id(),不需要做什么操作,拿过来就直接使用了。
  2. 全局命名空间(Module:Global Namespaces):每个模块创建它自己所拥有的全局命名空间,不同模块的全局命名空间彼此独立,不同模块中相同名称的命名空间,也会因为模块的不同而不相互干扰。
  3. 本地命名空间(Function & Class:Local Namespaces):模块中有函数或者类,每个函数或者类所定义的命名空间就是本地命名空间。如果函数返回了结果或者抛出异常,则本地命名空间也结束了。

程序在查询上述三种命名空间的时候,就按照从里到外的顺序,即:Local Namespaces --> Global Namesspaces --> Built-in Namesspaces。

8.1.3 导入模块

导入一个模块有三种方式:

  • import module
  • from module import function
  • import module as xx

8.1.4 if __name__ == '__main__'

对于很多编程语言来说,程序都必须要有一个入口,而 Python 则不同,它属于脚本语言,不像编译型语言那样先将程序编译成二进制再运行,而是动态的逐行解释运行。也就是从脚本第一行开始运行,没有统一的入口。

__name__是内置变量,用于表示当前模块的名字。如果一个模块被直接运行,其__name__值则为__main__,即模块名为__main__

if __name__ == '__main__'的意思是:当.py文件直接运行时,if __name__ == '__main__'之下的代码块将被运行;当 .py 文件以模块形式被导入时,if __name__ == '__main__'之下的代码块不被运行。

8.1.5 搜索路径

当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。

搜索路径是由一系列目录名组成的,Python 解释器就依次从这些目录中去寻找所引入的模块。

这看起来很像环境变量,事实上,也可以通过定义环境变量的方式来确定搜索路径。

搜索路径是在 Python 编译或安装的时候确定的,安装新的库应该也会修改。搜索路径被存储在sys模块中的path变量中。

8.1.6 包(package)

包是一种管理 Python 模块命名空间的形式,采用"点模块名称"。

创建包分为三个步骤:

  1. 创建一个文件夹,用于存放相关的模块,文件夹的名字即包的名字。
  2. 在文件夹中创建一个__init__.py的模块文件,内容可以为空。
  3. 将相关的模块放入文件夹中。

假设你想设计一套统一处理声音文件和数据的模块(或者称之为一个"包")。

现存很多种不同的音频文件格式(基本上都是通过后缀名区分的,例如: .wav,.aiff,.au),所以你需要有一组不断增加的模块,用来在不同的格式之间转换。

并且针对这些音频数据,还有很多不同的操作(比如混音,添加回声,增加均衡器功能,创建人造立体声效果),所以你还需要一组怎么也写不完的模块来处理这些操作。

这里给出了一种可能的包结构(在分层的文件系统中):

sound/                          顶层包
      __init__.py               初始化 sound 包
      formats/                  文件格式转换子包
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  声音效果子包
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  filters 子包
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...

在导入一个包的时候,Python 会根据sys.path中的目录来寻找这个包中包含的子目录。

目录只有包含一个叫做__init__.py的文件才会被认作是一个包,最简单的情况,放一个空的__init__.py就可以了。

  1. 导入模块
import sound.effects.echo

这将会导入子模块sound.effects.echo。 他必须使用全名去访问:

sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
  1. 还有一种导入子模块的方法是:
from sound.effects import echo

这同样会导入子模块: echo,并且他不需要那些冗长的前缀,所以他可以这样使用:

echo.echofilter(input, output, delay=0.7, atten=4)
  1. 还有一种变化就是直接导入一个函数或者变量:
from sound.effects.echo import echofilter

同样的,这种方法会导入子模块: echo,并且可以直接使用他的 echofilter() 函数:

echofilter(input, output, delay=0.7, atten=4)

from package import item对应的 item 既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。

from sound.effects import *会使 Python 进入文件系统,找到这个包里面所有的子模块,一个一个的把它们都导入进来。

导入语句的规则:如果模块定义文件__init__.py存在一个叫做__all__的列表变量,那么在使用from package import *的时候就把这个列表中的所有名字作为包内容导入。
【例子】在sounds/effects/__init__.py中包含如下代码

__all__ = ["echo", "surround", "reverse"]

这样使用from sound.effects import *时,只会导入上面三个子模块。

如果__all__没有定义,from sound.effects import *不会导入sound.effects中的任何子模块。仅仅把模块sound.effects和其中定义的内容导入(可能运行__init__.py里定义的初始化代码)。

这会把__init__.py里面定义的所有名字导入进来。并且他不会破坏掉我们在这句话之前导入的所有明确指定的模块。

通常并不主张使用*这种方法来导入模块,因为这种方法经常会导致代码的可读性降低。


练习题:

  1. 怎么查出通过 from xx import xx导入的可以直接调用的方法?
    答:dir()
  2. 了解Collection模块,编写程序以查询给定列表中最常见的元素。
    题目说明:

输入:language = [‘PHP’, ‘PHP’, ‘Python’, ‘PHP’, ‘Python’, ‘JS’, ‘Python’, ‘Python’,‘PHP’, ‘Python’]

输出:Python

"""
Input file
language = ['PHP', 'PHP', 'Python', 'PHP', 'Python', 'JS', 'Python', 'Python','PHP', 'Python']
   
Output file
Python
"""
def most_element(language):
    """ Return a list of lines after inserting a word in a specific line. """
   
    # your code here

8.2 datetime模块

datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类:datetime、date、time 和 timedelta。

8.2.1 datetime类

class datetime(date):
    def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo)
        pass
    def now(cls, tz=None):
        pass
    def timestamp(self):
        pass
    def fromtimestamp(cls, t, tz=None):
        pass
    def date(self):
        pass
    def time(self):
        pass
    def year(self):
        pass
    def month(self):
        pass
    def day(self):
        pass
    def hour(self):
        pass
    def minute(self):
        pass
    def second(self):
        pass
    def isoweekday(self):
        pass
    def strftime(self, fmt):
        pass
    def combine(cls, date, time, tzinfo=True):
        pass
  • datetime.now(tz=None)获取当前的日期时间,输出顺序为:年、月、日、时、分、秒、微秒。
  • datetime.timestamp()获取以 1970年1月1日为起点记录的秒数。
  • datetime.fromtimestamp(tz=None)使用unixtimestamp创建一个datetime

创建datetime对象的方式

  1. datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59)
  2. dt = datetime.datetime.fromtimestamp(1593055439.0)括号内为时间戳
  3. dt = datetime.datetime.now()
  • datetime.strftime(fmt)格式化datetime对象

符号

说明

%a

本地简化星期名称(如星期一,返回 Mon)

%A

本地完整星期名称(如星期一,返回 Monday)

%b

本地简化的月份名称(如一月,返回 Jan)

%B

本地完整的月份名称(如一月,返回 January)

%c

本地相应的日期表示和时间表示

%d

月内中的一天(0-31)

%H

24小时制小时数(0-23)

%I

12小时制小时数(01-12)

%j

年内的一天(001-366)

%m

月份(01-12)

%M

分钟数(00-59)

%p

本地A.M.或P.M.的等价符

%S

秒(00-59)

%U

一年中的星期数(00-53)星期天为星期的开始

%w

星期(0-6),星期天为星期的开始

%W

一年中的星期数(00-53)星期一为星期的开始

%x

本地相应的日期表示

%X

本地相应的时间表示

%y

两位数的年份表示(00-99)

%Y

四位数的年份表示(0000-9999)

%Z

当前时区的名称(如果是本地时间,返回空字符串)

%%

%号本身

【例子】将 datetime 对象转换为任意格式的日期

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
s = dt.strftime("'%Y/%m/%d %H:%M:%S")
print(s)  # '2020/06/25 11:51:49

s = dt.strftime('%d %B, %Y, %A')
print(s)  # 25 June, 2020, Thursday

【例子】datetime 对象包含很多与日期时间相关的实用功能。

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
print(dt.date())  # 2020-06-25
print(type(dt.date()))  # <class 'datetime.date'>
print(dt.time())  # 11:51:49
print(type(dt.time()))  # <class 'datetime.time'>
print(dt.year)  # 2020
print(dt.month)  # 6
print(dt.day)  # 25
print(dt.hour)  # 11
print(dt.minute)  # 51
print(dt.second)  # 49
print(dt.isoweekday())  # 4

在处理含有字符串日期的数据集或表格时,我们需要一种自动解析字符串的方法,无论它是什么格式的,都可以将其转化为datetime对象。这时,就要使用到dateutil中的parser模块。

  • parser.parse(timestr, parserinfo=None, **kwargs) 【例子】如何在 python 中将字符串解析为 datetime对象?
from dateutil import parser

s = '2020-06-25'
dt = parser.parse(s)
print(dt)  # 2020-06-25 00:00:00
print(type(dt))  # <class 'datetime.datetime'>

s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt)  # 2010-03-31 22:51:00
print(type(dt))  # <class 'datetime.datetime'>

8.2.2 date类

class date:
    def __init__(self, year, month, day):
        pass
    def today(cls):
        pass
  • date.today()获取当前日期信息

【练习】如何统计两个日期之间有多少个星期六?

import datetime

d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday())  # 6
print(dt // 7 + 1)  # 40

8.2.3 time类

class time:
    def __init__(self, hour, minute, second, microsecond, tzinfo):
        pass

【例子】如何使用 datetime.time() 类?

import datetime

t = datetime.time(12, 9, 23, 12980)
print(t)  # 12:09:23.012980
print(type(t))  # <class 'datetime.time'>

8.2.4 timedelta类

class timedelta(SupportsAbs[timedelta]):
    def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,):
        pass
    def days(self):
        pass
    def total_seconds(self):
        pass

timedelta表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。

它常常被用来从datetime对象中添加或移除一段特定的时间。

如果将两个datetime对象相减,就会得到表示该时间间隔的timedelta对象。

同样地,将两个时间间隔相减,可以得到另一个 timedelta对象。

练习题:

1、假设你获取了用户输入的日期和时间如2020-1-21 9:01:30,以及一个时区信息如UTC+5:00,均是str,请编写一个函数将其转换为timestamp

"""
   
Input file
example1: dt_str='2020-6-1 08:10:30', tz_str='UTC+7:00'
example2: dt_str='2020-5-31 16:10:30', tz_str='UTC-09:00'
   
Output file
result1: 1590973830.0
result2: 1590973830.0
"""
   
   
def to_timestamp(dt_str, tz_str):
    # your code here
        pass

2、编写Python程序以选择指定年份的所有星期日。

题目说明:

"""
   
Input file
   2020
   
Output file
   2020-01-05                         
   2020-01-12              
   2020-01-19                
   2020-01-26               
   2020-02-02     
   -----
   2020-12-06               
   2020-12-13                
   2020-12-20                
   2020-12-27 
"""
   
def all_sundays(year):
    # your code here