目录

前言

课题背景和意义

实现技术思路

一、遥感图像分类基础

二、常用遥感图像分类方法

三、集成学习分类技术

四、半监督学习分类

五、主动学习

六、半监督与主动学习集成

七、多视图学习

实现效果图样例

最后


前言

    📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

🚀对毕设有任何疑问都可以问学长哦!

选题指导:

大家好,这里是海浪学长毕设专题,本次分享的课题是

🎯基于机器学习的遥感图像分类研究

课题背景和意义

一直以来,从遥感数据进行信息提取是一个长期的遥感科学难题。遥感图像分类是遥感图像信息处理中最基本的问题之一,其分类技术是遥感应用系统中的关键技术,遥感图像分类方法的精度直接影响着遥感技术的应用发展。通在遥感图像分类处理的实际应用中,要获得高精度的分类结果,需要大量的训练数据,标记这些训练数据需要大量的人力和物力,而且还很费时。另一方面,在遥感领域,现代高分辨率传感器技术的采用,使从影像获得大量的未标记数据成为可能,收集未标记数据是比较容易和经济的。如何在少标记训练样本下,充分利用大量的未标记样本来提高遥感图像分类的精度是研究的重点。随着髙空间分辨率遥感数据越来越多,如何综合运用各类信息提取技术,集成多尺度信息提取的结果,更好地从各类遥感数据提取定量信息,是值得关注并开展研究的科学问题。遥感技术很多方面的应用都涉及遥感图像分类问题的研究,因此,遥感图像分类方法的提高直接影响着遥感技术的应用发展。无论是专题信息提取、变化监测,还是专题地图制作、遥感数据库的建立都离不开遥感图像分类技术

实现技术思路

一、遥感图像分类基础

地物电磁波福射的多段测量值构成地物的光谱特征,常作为遥感图像分类的特征向量,反映图像的空间分布信息和结构信息的纹理特征可以作为遥感图像分类特征空间的有益补充。

遥感图像分类概述

1)遥感图像的光谱特征

遥感图像分类主要依据不同类别的地物在图像上具有不同光谱特征和空间特征。根据像元的特征相似性,将其划分为不同的类别。遥感图像的光谱特征通常是以地物在多高光谱图像上的灰度(或反射率)体现出来的。

BP遥感图像分类CSDN 遥感图像分类流程_分类

2)遥感图像的纹理特征

纹理被定义为在图像的某一区域,相邻像素的灰度空间分布,该分布具有统计规律和周期性,是一个区域中像素灰度级的空间分布属性。两个灰度像素同时出现的联合概率密度定义为:

BP遥感图像分类CSDN 遥感图像分类流程_BP遥感图像分类CSDN_02

二、常用遥感图像分类方法

1)BP神经网络遥感图像分类

① 网络结构

BP神经网络的结构一般包括输入层、隐层和输出层。隐层可以为层或多层,而各隐层的神经元个数需要根据实际问题的复杂度而决定。图是最简单最常用的三层BP结构。

BP遥感图像分类CSDN 遥感图像分类流程_分类_03

 

②BP神经网络遥感分类模型

模式识别中,输入层的神经元个数等于输入的特征个数,输出层的神经元个数等于需要分类的类别数。BP网络训练实质就是不断输入训练样本,根据网络输出与期望输出的差值,对权值进行调整,直到误差小于某一阈值;当网络对所有的训练样本基本都满足时,则可用于对未知样本进行分类。

BP遥感图像分类CSDN 遥感图像分类流程_课程设计_04

RBF神经网络遥感图像分类

径向基函数神经网络RBFNN是一种前向神经网络模型。RBFNN神经网络由三层结构组成,输入层、RBFNN层和输出层。输入层中间层是特征空间中按照一定密度分布的中心点,样本输入分别对应各中心点,通过一非线性径向基函数得到中间层的输出。

每层的节点数具体为:输入层节点数为所选择的波段数;RBF层和输出层的节点数为所要分类的类别数。遥感影像分类流程如图:

BP遥感图像分类CSDN 遥感图像分类流程_分类_05

决策树遥感图像分类

决策树分类器(是一种多级分类方法。对于分类决策而言,决策树按照自顶向下的原则构建,将数据按树形结构生成若干分支,每个数据分支包含划分为某类别的特征属性。分类的规则包含各个分支中提取有用信息。

①决策树分类的基本原理

决策树由一个根节点、一系列内部节点分支及终极节点组成,每一节点只有一个父节点和两个或多个子节点。

②决策树的构建

构建一个决策树分类器通常分为两步:树的生成和剪枝

决策树的生成

决策树生成的基本过程为:将训练样本集作为树的根节点,根据某种分类规则,选择某一属性作为划分依据,根据该属性的不同取值,将当前节点分为若干个分支子节点,其中处于某一子节点的样本具有同一属性值。对每个分支子节点重复上述划分过程,直至叶子节点中的样本是同一类别。

剪枝

剪枝就是采用新的测试数据对决策树生成过程中产生的分类规则进行检验,剪去影响预测准确率的分支或那些不会增大树的错误预测率的分支。经过剪枝,不仅能有效地克服噪声,还能简化决策树。

 支持向量机 SVM分类
支持向量机SVM(SupportVector Machine)是建立在统计学习的 VC维理论和结构风险最小化(Structural Risk Minimization.SRM)基础上的机器学习方法(Vapnik,1998)。根据有限的样本信息,在使样本误差最小的同时,也使模型泛化误差的上界最小。
SVM的基本数学公式:

BP遥感图像分类CSDN 遥感图像分类流程_课程设计_06

约束条件:

BP遥感图像分类CSDN 遥感图像分类流程_课程设计_07

三、集成学习分类技术

集成学习(ensemble learning)理论和算法的研究一直是机器学习领域的一个焦点,国际机器学习界的权威学者 Dietterich(1997)将集成学习列为机器学习领域的四大研究方向之首。它是将多个分类器组合生成一个分类器,也称为多分类器(MCS:MultipleClassifier Svstem)或分类器集成(classifier ensemble)(Zhou ZH2012)。目前,集成学习技术的研究和应用已成为当前遥感图像分类的一个研究热点。

①集成学习概述
集成学习是一种机器学习范式,它训练得到不同的基分类器,然后根据规则组合这些分类器来解决同一个问题,可以显著提高学习系统的泛化能力。集成学习算法设计的三个步骤(Zhang et al..2012):第一基分类器的生成,主要通过处理原始数据集来产生差异性的数据子集,在具有差异性的数据子集上训练得到具有差异性的基分类器;第二基分类器的选择,将生成的一系列基分类器按照某种度量标准或策略选择最优的参与集成分类;第三基分类器的集成(组合)。

② 集成学习的方法
基于训练样本操作的多分类器组合中,最具有代表性和应用最多的是 Bagging和 Boosting 算法。根据样本数据分布的规律性,对初始的训练样本再抽样获取多个不同的训练样本子集,采用学习器分别对每个训练子集构建一个分类器。
Bagging 算法
Bagging 算法(Breiman,1996)是 Breiman于1996年提出的,算法通过对训练集应用重采样技术来实现了集成学习的差异性以此来提高分类器的泛化性。

 Boosting算法
Boosting 算法基本思想是对容易分错的训练样本加强学习,通过学习误差来修改训练集的分布,集中学习其中难以学习的部分,经过多次迭代,最终产生多个学习器。

BP遥感图像分类CSDN 遥感图像分类流程_深度学习_08

③RandomForests 随机森林
集成学习的另一类方法是通过分类属性特征或特征子集而产生的集成学习方法。代表性的方法就是随机子空间法(Random Subspace)(Ho,1998)随机森林RandomForest(RF)是Bagging算法的扩展,是在Bagging算法的思想上融合了随机特征选择。

BP遥感图像分类CSDN 遥感图像分类流程_BP遥感图像分类CSDN_09

随机森林由不同的训练集所产生的模型之间存在差异性来保证分类的效果。经过有限次数的模型训练,产生一组的分类模型序列,随机森林的多类模型就是由这些序列组合而成,以多数投票法决定最终结果。

BP遥感图像分类CSDN 遥感图像分类流程_分类_10

四、半监督学习分类

半监督学习概述
半监督学习是在训练学习的过程中结合样本集中的已标记样本和未标记样本进行的,从未标记样本中提取有用的信息来提高学习的性能。

半监督协同训练方法
1)自训练算法
自训练算法是在半监督分类中经常使用的一种算法,在算法的执行过程中,首先利用已有的少量已标记数据集合L训练基分类器。然后,利用该基分类器对大量的未标记数据预测类别,从所有预测的类别中选取可信度较高的数据。

BP遥感图像分类CSDN 遥感图像分类流程_课程设计_11

2) Tri-Training 算法
利用三个分类器进行协同训练来提高学习性能。在分类器模型构建过程中,利用其中两个分类器来对未标记样本进行分类预测,若两个分类器投票结果一致并且标记的置信度高于设定的阈值,将该未标记样本连同标记一起添加到第三个分类器的训练集中。

BP遥感图像分类CSDN 遥感图像分类流程_BP遥感图像分类CSDN_12

五、主动学习

在监督学习分类中,需使用标记样本训练建立分类模型,分类器分类的效果受到标记样本质量和数量的影响。但是,获取大量的具有代表性并能完整地表示所含类型的统计属性的训练数据,不仅费时、费力,而且训练集包含的冗余样本。为了尽量减少获取训练集及标记成本,在机器学习领域的主动学习方法,提供了解决的途径,来优化分类模型。

BP遥感图像分类CSDN 遥感图像分类流程_分类_13

主动学习算法的描述如下表所示:

BP遥感图像分类CSDN 遥感图像分类流程_深度学习_14

六、半监督与主动学习集成

与半监督分类一致,主动学习也是利用未标记样本集中挖掘出“有价值”的样本,利用它们辅助少量的已标记训练集来提高分类的性能。

七、多视图学习

传统的机器学习算法,如支持向量机,判别式分析和神经网络等,都是将多个方面的特征(视图)连接为独立的一组特征向量(视图)来训练学习。即一个学习器通过一组特征集作为训练整体集合。

多视图学习的原则
多视图与单视图之间最大的区别在于对同一输入数据,要求有冗余的视图,以便学习器能获取丰富的信息。但是,如果学习的方法不能很好地处理多个视图之间的关系,多个视图甚至会降低分类学习的性能。

(1)一致性原则
一致性原则目的在于最大化多个不同视图之间的一致性。

BP遥感图像分类CSDN 遥感图像分类流程_人工智能_15

(2)互补原则
万补原则表述的是在多视图下,每个视图中的数据都包含有其他视图没有的信息,因此,多个视图能综合正确的描述数据。

多视图的构建
在实际应用中,研究对象可以从多个角度获取描述的信息,从而构成不同的视图。但是,由于某种程度的限制,不可能直接得到研究数据的多个视图。

(1)随机方法
通过随机方法,从元数据构建多视图。即随机分解初始数据的特征空间为多个互异的特征子集,由此依次构建视图。

(2)重构法
Wang et al.(2011)提出了一种新的方法构建多视图,就是将向量表示的单视图重构为矩阵表示的多视图。

BP遥感图像分类CSDN 遥感图像分类流程_分类_16

 (3)特征分解法
特征分解法(PMC,Pseudo Multi-view Co-training),自动地将单视图数据集的特征分解为两个相互独立的子集。

实现效果图样例

基于深度学习遥感图像分类:

BP遥感图像分类CSDN 遥感图像分类流程_BP遥感图像分类CSDN_17

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

最后