bisect
- bisect主要用来管理有序序列,注意:一定是“有序”,bisect可以对有序序列进行快速的查找和插入。bisect模块主要包含两个函数:
- bisect:用来搜索元素位置(元素插入位置)
- insort:用来插入新元素
- 这两个函数都是使用二分查找算法在有序序列中查找或插入元素,所以执行效率非常高
- 下面将通过一些例子来对比说明bisect的高效率:
- 现在有一个场景:如果我需要插入一个值到一个有序列表中,然后依然保证这个列表的有序,那么如何快速获取需要插入值的位置索引?
import bisect
from time import perf_counter
from decimal import Decimal
ordered_list = [i for i in range(0, 10000000, 2)] # 定义一个0-9999999的升序偶数列表
insert_value = 9966666 # 需要插入的值
def loop_traversal_search():
"""用传统循环遍历方式进行搜索"""
start_time = perf_counter() # 开始时间
for i, value in enumerate(ordered_list):
if insert_value <= value:
print('插入元素{}的索引值应为: {}'.format(insert_value, i))
break
end_time = perf_counter() # 结束时间
duration_time = end_time - start_time # 搜索时间计算
print("循环遍历方式搜索耗时: {}秒".format(Decimal(str(duration_time))))
def bisect_search():
"""用bisect搜索"""
start_time = perf_counter() # 开始时间
position = bisect.bisect_left(ordered_list, insert_value)
print('插入元素{}的索引值应为: {}'.format(insert_value, position))
end_time = perf_counter() # 结束时间
duration_time = end_time - start_time # 搜索时间计算
print("bisect搜索耗时: {}秒".format(Decimal(str(duration_time))))
if __name__ == '__main__':
loop_traversal_search()
print('---------------------------------------------------')
bisect_search()
- 运行结果为:
插入元素9966666的索引值应为: 4983333
循环遍历方式搜索耗时: 0.3305077秒
---------------------------------------------------
插入元素9966666的索引值应为: 4983333
bisect搜索耗时: 0.000009599999999998499秒
- 对比搜索时间,我们可以得出结论:bisect通过二分法进行搜索的速度比循环遍历快得多。
- 注意:在上面的例子中,bisect搜索时用的函数时bisect_left,其实还有一个对应的bisect_right。bisect_left和bisect_right的区别就在于:如果需要插入的值是在有序列表中已经存在,那么bisect_left将返回这个已存在值的索引(这意味着如果新的值从这个位置插入,将会在原来已经存在的值的前面),bisect_left将返回这个已存在值的下一个位置的索引(这意味着如果新的值从这个位置插入,将会在原来已经存在的值的后面),bisect_right通常简写为bisect。
- 当我们得到需要插入的位置索引后,就可以用insert进行元素插入了。
insort
- bisect还提供了一种快速插入的方法,insort,insort也区分insort_left和insort_right,insort_right简写为insort。
import bisect
from time import perf_counter
from decimal import Decimal
def bisect_search_and_insert(ordered_list, insert_value):
"""用bisect搜索并且insert插入"""
start_time = perf_counter() # 开始时间
position = bisect.bisect(ordered_list, insert_value)
ordered_list.insert(position, insert_value)
end_time = perf_counter() # 结束时间
duration_time = end_time - start_time # 搜索并插入时间计算
print("bisect搜索并插入耗时: {}秒".format(Decimal(str(duration_time))))
def bisect_insort_value(ordered_list, insert_value):
""""用insort插入"""
start_time = perf_counter()
bisect.insort(ordered_list, insert_value)
end_time = perf_counter()
duration_time = end_time - start_time # 搜索并插入时间计算
print("insort插入耗时: {}秒".format(Decimal(str(duration_time))))
if __name__ == '__main__':
bisect_search_and_insert([i for i in range(0, 10000000, 2)], 9696969)
print('----------------------------------------------------------')
bisect_insort_value([i for i in range(0, 10000000, 2)], 9696969)
- 运行结果:
bisect搜索并插入耗时: 0.0002004秒
----------------------------------------------------------
insort插入耗时: 0.000128000000000017秒
- 经过测试:用insort插入元素并且保持列表有序的速度更快一些
- 其他应用延伸:bisect还可以用来在有序序列中快速搜索某个元素的所在位置索引