基于哈里斯鹰算法的极限学习机(ELM)分类算法


文章目录

  • 基于哈里斯鹰算法的极限学习机(ELM)分类算法
  • 1.极限学习机原理概述
  • 2.ELM学习算法
  • 3.分类问题
  • 4.基于哈里斯鹰算法优化的ELM
  • 5.测试结果
  • 6.参考文献
  • 7.Matlab代码



摘要:本文利用哈里斯鹰算法对极限学习机进行优化,并用于分类问题

1.极限学习机原理概述

典型的单隐含层前馈神经网络结构如图1 所示,由输入层、隐含层和输出层组成,输 入层与隐含层、隐含层与输出层神经元间全连接。其中,输入层有 n 个神经元,对应 n 个输入变量, 隐含层有 l个神经元;输出层有 m 个神经元 ,对应 m 个输出变量 。 为不失一般性,设输 入层与隐含层间的连接权值 w 为:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_机器学习
其中,基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_机器学习_02表示输入层第基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类_03个神经元与隐含层第基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_算法_04个神经元间的连接权值。

基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_算法_05

设隐含层与输出层间的连接权值 , 为基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类算法_06:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类_07
其中,自基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类_08表示隐含层第 j 个神经元与输出层第 k个神经元间的连接权值。

设隐含层神经元的阈值值 b 为:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_权值_09
设具有 Q 个样本的训练集输入矩阵 X 和输出矩阵 Y 分别为
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类算法_10

KaTeX parse error: Undefined control sequence: \matrix at position 11: Y =\left[\̲m̲a̲t̲r̲i̲x̲{y_{11},y_{12},…

设隐含层神经元的激活函数为 g(x),则由图1 可得, 网络的输出 T 为:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类算法_11
式(6)可表示为:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_算法_12
其中, T’为矩阵 T 的转置; H 称为神经网络的隐含层输出矩阵 , 具体形式如下 :
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_机器学习_13

2.ELM学习算法

由前文分析可知,ELM在训练之前可以随机产生 w 和 b , 只需确定隐含层神经元个数及隐含层和神经元的激活函数(无限可微) , 即可计算出基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类算法_06

(1)确定隐含层神经元个数,随机设定输入层与隐含层间的连接权值 w 和隐含层神经元的偏置 b ;

(2) 选择一个无限可微的函数作为隐含层神经元的激活函数,进而计算隐含层输出矩 阵 H ;

(3)计算输出层权值:基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类_15

值得一提的是,相关研究结果表明,在 ELM 中不仅许多非线性激活函数都可以使用(如 S 型函数、正弦函数和复合函数等),还可以使用不可微函数,甚至可以使用不连续的函数作为激 活函数。

3.分类问题

本文对乳腺肿瘤数据进行分类。采用随机法产生训练集和测试集,其中训练集包含 500 个样本,测试集包含 69 个样本 。

4.基于哈里斯鹰算法优化的ELM

 

由前文可知,ELM的初始权值和阈值都是随机产生。每次产生的初始权值和阈值具有满目性。本文利用哈里斯鹰算法对初始权值和阈值进行优化。适应度函数设计为训练集的错误率与测试集的错误率的和,以期望使训练得到的网络在测试集和训练集上均有较好的结果:
基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_分类算法_16

5.测试结果

哈里斯鹰算法相关参数如下:

%训练数据相关尺寸
R = size(Pn_train,1);
S = size(Tn_train,1);
N = 20;%隐含层个数
%% 定义哈里斯鹰优化参数
pop=20; %种群数量
Max_iteration=50; %  设定最大迭代次数
dim = N*R + N*S;%维度,即权值与阈值的个数
lb = [-1.*ones(1,N*R),zeros(1,N*S)];%下边界
ub = [ones(1,N*R),ones(1,N*S)];%上边界

将经过哈里斯鹰优化后的SSA-ELM与基础ELM进行对比。

预测结果如下图

哈里斯鹰收敛曲线如下:

基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码_机器学习_17

数据结果如下:

哈里斯鹰优化ELM结果展示:----------------
训练集正确率Accuracy = 98.2%(491/500)
测试集正确率Accuracy = 100%(69/69)
病例总数:569 良性:357 恶性:212
训练集病例总数:500 良性:316 恶性:184
测试集病例总数:69 良性:41 恶性:28
良性乳腺肿瘤确诊:41 误诊:0 确诊率p1=100%
恶性乳腺肿瘤确诊:28 误诊:0 确诊率p2=100%
传统ELM结果展示:----------------
训练集正确率Accuracy = 90.2%(451/500)
测试集正确率Accuracy = 84.058%(58/69)
病例总数:569 良性:357 恶性:212
训练集病例总数:500 良性:316 恶性:184
测试集病例总数:69 良性:41 恶性:28
良性乳腺肿瘤确诊:37 误诊:4 确诊率p1=90.2439%
恶性乳腺肿瘤确诊:21 误诊:7 确诊率p2=75%

从上述数据可以看出,哈里斯鹰-ELM训练得到的网络,无论是在测试集和训练集上的正确率均高于基础ELM训练得到的网络。哈里斯鹰-ELM具有较好的性能。

6.参考文献

书籍《MATLAB神经网络43个案例分析》

7.Matlab代码