目录
前言
课题背景和意义
实现技术思路
实现效果图样例
前言
📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。
🚀对毕设有任何疑问都可以问学长哦!
大家好,这里是海浪学长毕设专题,本次分享的课题是
🎯BP神经网络的房地产价值评估研究
课题背景和意义
随着城市化发展,我国房地产市场发展迅速,出现了大量的消费、投资等交易
活动。其中,住宅类房地产是房地产市场的热点,占据了最大的开发投资比重。房
价的快速上涨引发的种种矛盾引起了社会各界的广泛关注,要求对房地产价格进行
客观准确的评估,从而使人们准确把握房地产价格及其走势。然而传统的房地产评
估方法耗费大量人力物力,速度慢、主观性强,无法满足房地产市场中大量的交易
与价格评估需求,此外,由于房地产自身所固有的特殊属性,影响房地产价格的特
征因素数据信息很繁杂,不仅包括定性数据因素,还包括定量数据因素。要对这些
发生交易的房地产的数据信息进行有效的利用,必须要对它们进行搜集、整理以及
有效的存储。因此,对传统的方法进行改进,或寻找更加科学的评估方法来研究房
地产价值评估具有重要的理论意义和实践意义。
BP 神经网络是一种功能强大、应用广泛的机器学习算法,它的自适应性、非线
性和大规模并行处理能力使其能够大量减少人力物力,高效率地处理非线性问题,
降低主观随意性,从而能够在房地产评估中发挥有效作用。基于 BP 神经网络的房地
产价值评估主要是在传统方法的理论基础上,通过计算机来搜集处理大量的数据信
息,找到房地产评估与其影响因素之间的客观规律,从而对房地产进行估值,提高
评估的效率与客观性。同时,在商品房房价超过家庭支付能力,越来越多的家庭选
择购买二手房的情况下,二手房交易也为房地产的价值评估提供了大量的样本数据。
为了完善房地产市场评估方法,提高房地产评估的客观性与准确性,本文在传
统的房地产评估方法的基础上,引入 BP 神经网络原理,利用 BP 神经网络的自主
学习能力以及能够大规模并行处理和存储数据的能力对传统的房地产评估方法进
行了改进。
实现技术思路
BP 神经网络的基本概念与特点
人工神经网络简称为神经网络,它是一个具有复杂特性的非线性自组织动态学
习系统,其组成是由数量庞杂、但相对较为简化的子单元(即神经元)相互连接而
来的,它模仿了人类神经系统运作方式,以及并行处理信息的多元连接模型,神经
网络从科学的角度反映了诸如自学习、自组织、自适应等人脑所具备的基本功能特
征。仿生学的出现,使得人们将众多生物机能运用到数学、生物学等领域,例如蚁
群算法、蜂群算法等,其中对神经元的研究产生了神经元数学模型,它是由众多相
似的神经元共同组成的神经网络,其中单个神经元的功能结构都比较简单,但其组
成的非线性动态复杂系统就变得极为复杂,通过对环境变化的学习,掌握输入输出
信息之间的关系,进行比较准确的预测,此种方法可以为我们解释世界的各类实际
现象。
BP 神经网络是人工神经网络中应用最广的机器算法模型,是由非线性普通变
化单元组成的多层前馈网络,它充分利用信号正向传播和误差反向调节的学习机
制,不断反复进行训练或称迭代学习,从而完整建立了智能化网络模型,以处理多
类型非线性信息。
数据搜集与处理
首先确定学区房所在的区域,再根据所在区位选择小区,并从小区中随机选择
同一交易时点的学区房。
北京市包括东城区、西城区、朝阳区、海淀区、大兴区、通州区、宣武区、顺
义区等 16 个区县,其中有 67% 的学区房主要分布在东城、西城、海淀和朝阳四个区
县,我们根据相关教育网站以及走访调查,分别从东城区、西城区、朝阳区和海淀
区选取了综合排名前 5 的中小学,一共选取了 20 所中学、 20 所小学,如表 5-1 所示,
这些学校附近的学区房都是房地产市场的热门。
根据地图选点,本文分别从这四个区县选取了 5 个小区,然后从房地产交易平
台上分别从各个小区中收集了用途类似、区位条件相当、交易时间相近、交易情况
正常的 10 个样本,组成了 200 个样本数据。
数据分析与处理
对样本数据量化后,需要进一步对数据进行归一化、同趋势化处理。
经过量化后的样本数据,一部分要用来对 BP 神经网络模型进行学习与训练,从
而得出合格的评估模型,另一部分要用来检测该模型的准确性与可靠性。我们从 200
份样本数据中,随机选择了 160 份作为训练集( train ),将其量化后的各指标数据及
价格导入 BP 神经网络,设置初始学习目标与函数,让其进行自我学习与训练,剩余
40 份作为测试集( test ),待模型达到设定的精度后,用来测试模型的准确性与可靠
性。
输入变量为每个样本数据的量化指标值,输出变量为 2016 年学区房的价格。因
为我们最终选取的指标数据有 13 个,因此输入层有 13 个输入信号(不包括额外的
阈值),输出变量为 1 个。
模型的初步训练
( 1 )设置初始参数
根据第四章基于 BP 神经网络的房地产评估模型构建,本文利用 MATLAB 中的
newff 指令初步建立模型,其他参数配置先釆用默认值。
(2)模型效果
在对模型初步训练之后,我们运行神经网络,发现模型在 14 次迭代之后网络输
出误差达到设定的训练精度,而且耗时非常短,误差也很小,这说明网络学习状态
良好。
模型的检验
对模型的检验主要从两方面着手,有效性检验和准确性检验,顾名思义,有效
性检验就是检验模型的合理性,比如网络收敛是否合理,模型结果是否可靠,准确
性检验是模型的正确程度,常常通过误差率来衡量.
模型优化
隐含层数的优化
隐含层节点数的优化
传递函数的优化
指标体系优化
模型结果
五折交叉检验
为了判断基于 BP 神经网络的房地产评估模型是否比其他的评估方法更优越,
本文采用了五折交叉检验的方法来对比 BP 神经网络和随机森林的效果。
实现效果图样例
我是海浪学长