目录

1.遗传算法简要介绍

2.tsp问题简要介绍

3.遗传算法解决tsp问题的几个特殊点

4.源码

1.遗传算法简要介绍

        简单来说,遗传算法是用于解决最优化问题的一种搜索算法。其核心基于自然界种群进化的规律,即初始种群进行交配,在基因层面上,其中会发生交叉互换、基因突变等变异,产生新一批的种群,在种群不断繁衍的过程中,“适者生存,不适者灭亡”,更符合环境要求的个体的基因保留下来的可能性更大,不适应环境的个体的基因往往不会延续下去。漫长的时间后,会筛选出一批最适应环境的种群。

        基于此,当我们在解决最优化问题时,采取上述思想,将问题的解看作是“个体”,这些个体组成一个抽象的“种群”,这些解被映射成为相应的编码,于是我们就能得到由各种编码组成的“种群”。这些编码可以进行片段的交叉互换,或者其中某些数字发生“基因突变”,从而进行种群的更新。那么如何筛选更合适的个体呢?根据实际的需要与限制,我们基于编码,通过特定的函数,计算出每个个体的“适应度”,适应度更大的个体的基因(编码)被选中并保留下来的概率更大。这样经过上百次迭代后,就能得到一个接近最优解的一个种群。

        详细的介绍大家可以参照这篇文章遗传算法详解 附python代码实现_重学CS的博客_python遗传算法 ,文章作者将一般公式的最优化讲解到令人发指的详细与通俗易懂。如果能将这篇文章掌握,基本上可以通过遗传算法,求任何公式(n元n次方程)的最值。其中的内涵是将解从十进制数字映射成为二进制串,这其中的编码与解码过程很重要。

        在这里就不展开叙述更多细节了,上面那篇文章讲的很清楚,本篇重点在于解决tsp问题。

2.tsp问题简要介绍

        根据百度百科的介绍,t旅行商问题,即TSP问题(Traveling Salesman Problem)又译为旅行推销员问题、货郎担问题,是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路径的限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。

3.遗传算法解决tsp问题的几个特殊点

这也是本篇的重点

3.1如何编码

首先要明白我们解的形式是什么,我们需要得到一条距离最短的路径。因此将这些城市编码(0、1、2........n),以10座城市为例,我们希望得到的解或许是3 5 4 8 6 7 9 0 2 1,因此,在遗传算法中,每个个体的形式就应该是10个不重复数字的排列。好消息是这样一来不需要进行二进制编码解码了。

#初始化种群
def generate_population(self):
    path=np.array(range(self.num))
    self.pop=[]
    for i in range(self.size_pop):
        x=path.copy()
        np.random.shuffle(x)    #随机洗牌
        self.pop.append(x)

3.2距离矩阵的建立

我们该如何评价一个解的适应度?显然我们希望每个个体的路径距离越小越好,所以我们需要先得到每座城市之间的距离,将其记录在一个矩阵当中,当后续需要求一条完整路径的距离时,任意两点的距离可以直接转化为坐标(比如说,(2,6))从这个矩阵中取出。

3.3交叉互换

如果直接确定一条染色体上的一个位置,将父本母本从这个位置开始直接交叉互换,这显然是不合理的,假如父本是 1 3 2 4,母本是 2 4 1 3,两者正好在中点切割进行交叉互换后的子代分别是1 3 1 3和 2 4 2 4,这显然是错误的!旅行商每座城市只能经过一次!所以在交换染色体片段的时候,必须要经过一个操作,就是去除重复碱基对。

TSP、MTSP问题遗传算法详细解读及python实现,这篇文章的博主给出了tsp问题遗传算法交叉互换的三种方式,这里我们选择第二种

Order Crossover(顺序交叉)

python遗传算法解决分配问题 遗传算法求解tsp问题python_python

 

3.4基因突变

在二进制编码的情况下,要想完成基因突变,只需要将选中的染色体随机替换掉一个碱基对即可。但是在tsp问题中,如果这样做,一定会导致被选中染色体碱基对的重复!因此我们需要做的是将被选中染色体的任意两碱基对进行互换,这样就避免了重复

3.5适应度计算

我们该如何评价一个个体的基因是否适合被遗传下来呢?这就需要计算个体的适应度,适应度越高的个体,被选择的概率就越大。在tsp问题中,我们希望一个个体的路径长度越短越好,即路径越短,适应度越大,在这里,采用文章基于遗传算法求解TSP问题(旅游路径规划,Python实现,超详细,可视化,结果分析中的适应度公式来计算适应度

python遗传算法解决分配问题 遗传算法求解tsp问题python_numpy_02


 

 适应度越大的个体被选中的可能性越大,用numpy.choice来实现

idx = np.random.choice(np.arange(self.size_pop), size=self.size_pop, replace=True,
                       p=(self.fitness)/(fitness_sum) )

4.源码


import numpy as np

class TSP:

    def __init__(self, citys, maxgen=500,
                 size_pop=200, cross_rate=0.8,
                 muta_rate=0.005
                 ):
        self.maxgen = maxgen            # 最大进化次数
        self.size_pop = size_pop        # 种群大小(染色体个数)
        self.cross_rate = cross_rate    # 交叉概率
        self.muta_rate = muta_rate    # 变异概率
        self.citys = citys       # 城市的坐标数据
        self.num = citys.shape[0]    # 城市的个数(染色体长度)
     
     #获得距离矩阵
    def matrix_distance(self):
        self.distance_m=np.zeros((self.num,self.num))
        for i in range(self.num):
            for j in range(self.num):
                self.distance_m[i][j]=np.sqrt((self.citys[i][0]-self.citys[j][0])**2+(self.citys[i][1]-self.citys[j][1])**2)

     #计算某条路径的距离
    def get_total_distance(self,one_path):
        distance=0
        for i in range(self.num-1):
            distance +=self.distance_m[one_path[i]][one_path[i+1]]
        distance += self.distance_m[one_path[-1]][one_path[0]]
        return distance

     #初始化种群
    def generate_population(self):
        path=np.array(range(self.num))
        self.pop=[]
        for i in range(self.size_pop):
            x=path.copy()
            np.random.shuffle(x)    #随机洗牌
            self.pop.append(x)
        
    #交叉互换
    def crossover(self):
        self.new_pop=[]
        for father in self.pop:
            child=father   #初步让子代获得父本染色体
            if np.random.rand()<self.cross_rate:
                #随机选择一个染色体作为母本
                mother_index = np.random.randint(0, self.size_pop)
                mother=self.pop[mother_index]  
                #确定切割点     
                left = np.random.randint(0, self.num-2)
                right = np.random.randint(left + 1, self.num-1)
                mother=mother.tolist()
                father=father.tolist()
                #切割片段
                gene = mother[left:right]
                child1_c = father[right:]+father[:right]
                child1 = child1_c.copy()
                #去除重复基因
                for o in gene:
                    child1_c.remove(o)
                child1[left:right] = gene
                child1[right:] = child1_c[0:len(child1) - right]
                child1[:left] = child1_c[(len(child1) - right):]
                child=np.array(child1)
 
            self.new_pop.append(child)
        self.pop=self.new_pop

    #变异
    def mutation(self):
        for i in range(self.size_pop):
            if np.random.rand() < self.muta_rate:
                child = self.pop[i]
                u = np.random.randint(0,self.num - 2)
                v = np.random.randint(u+1,self.num- 1)
                child_x = child[u+1:v]
                child_x=child_x[::-1]        
                child = np.concatenate((child[0:u+1] , child_x , child[v:]))
                self.pop[i]=child


     #自然选择,种群根据适应度进行更新
    def select(self):
        #计算每条路径的长度,放入列表
        self.dis=[]
        for i in range(self.size_pop):
            self.dis.append(self.get_total_distance(one_path=self.pop[i]))
        #根据路径长度计算每个个体的适应度
        self.fitness=[]
        for i in range(self.size_pop):
            self.fitness.append(1/(self.dis[i]**15))
        #适应度总和
        fitness_sum=0
        for i in range(self.size_pop):
            fitness_sum+=self.fitness[i]
        #根据适应度进行选择,适应度大的被选择概率大
        idx = np.random.choice(np.arange(self.size_pop), size=self.size_pop, replace=True,
                           p=(self.fitness)/(fitness_sum) )
        self.new_pop=[]
        for i in idx:
            self.new_pop.append(self.pop[i])
        self.pop=self.new_pop
        
     #输出当前种群中最优路径
    def result_path(self):
        self.index=np.argmax(self.fitness)
        a="the shortest path is:"
        for i in range(self.num-1):
            a+=str(self.pop[self.index][i])
            a+="-->"
        a+=str(self.pop[self.index][-1])
        print(a)
        print("the total distance is",self.dis[self.index])
        

#主函数进行迭代

def main(citys):
    
    SL=TSP(citys)
    SL.matrix_distance()
    SL.generate_population()
    for i in range (SL.maxgen):
        SL.crossover()
        SL.mutation()
        SL.select()
    SL.result_path()


if __name__ == '__main__':
    citys = np.array([[16.47, 96.10],[16.47, 94.44], [20.09, 92.54],
                     [22.39, 93.37], [25.23, 97.24], [22.00, 96.05], [20.47, 97.02],
                     [17.20, 96.29], [16.30, 97.38], [14.05, 98.12], [16.53, 97.38],
                     [21.52, 95.59], [19.41, 97.13], [20.09, 92.55]])
    main(citys)


结果分析

python遗传算法解决分配问题 遗传算法求解tsp问题python_python_03

如果每一次迭代都输出结果,可以清楚地看到路径最终都收敛。事实上,每次收敛的结果与种群大小size_pop息息相关,一开始我将种群大小设置为 200,结果每次运行虽然收敛,但是得到的结果各不相同,基本上毫无关联,说明结果陷入了局部最优解,而非全局最优解。解决方法就是把size_pop设置为500,才使得结果误差较小,趋近于全局最优解。

事实上,要想使结果更直观,最好用坐标图使结果可视化,将路线显示出来。本文仅仅展示了数字结果,这样有两个问题,一是可能起始城市不同,如8 2 3 6 和 2 3 6 8,二是顺序不同,如8 2 3 6和 6 3 2 8,其实结果的路线本质是一样的,但直观看上去不利于结果统计。