集合中的元素不允许重复,Python集合的内部实现为此做了大量相应的优化,判断集合中是否包含某元素时比列表速度快很多。下面的代码用于返回指定范围内一定数量的不重复数字,使用集合的效率明显优于使用列表。

import random
import time
def RandomNumbers1(number, start, end):
    '''使用列表来生成number个介于start和end之间的不重复随机数'''
    data = []
    while True:
        element = random.randint(start, end)
        if element not in data:
            data.append(element)
        if len(data) == number:
            break
    return data
def RandomNumbers2(number, start, end):
    '''使用集合来生成number个介于start和end之间的不重复随机数'''
    data = set()
    while True:
        element = random.randint(start, end)
        data.add(element)
        if len(data) == number:
            return data
start = time.time()
for i in range(10000):
    d1 = RandomNumbers1(500, 1, 10000)
print('Time used:', time.time()-start)
start = time.time()
for i in range(10000):
    d2 = RandomNumbers2(500, 1, 10000)
print('Time used:', time.time()-start)

运行结果为:

Time used: 41.77738952636719

Time used: 13.330762386322021

上面的代码只是为了展示Python获取不重复元素的原理,如果在项目中需要这样一个功能的时候,还是直接使用下面的方法更好一些,random模块的sample()方法可以直接从指定序列中选取指定数量个不重复的元素

>>> import random

>>> random.sample(range(1000), 20)

[61, 538, 873, 815, 708, 609, 995, 64, 7, 719, 922, 859, 807, 464, 789, 651, 31, 702, 504, 25]

留个思考题:我给学生讲这段代码的时候,有同学修改参数进行调用,例如RandomNumbers2(500, 1, 100),结果导致死循环。你能想到原因吗?