摘要:
目前我国正在推动发展太阳能光伏发电,该项目预测技术的研究仍处于广泛研究阶段。准确的光伏发电量预测对于保障高比例光伏接入后系统的安全稳定与经济运行具有重要意义。基于此,本文将对光伏电站发电量预测进展开实验,结合已有的研究报告,推出LSTM-Attention模型,并基于2018年DataFountain比赛数据进行研究。本文首先会指出研究问题的难点,其次介绍数据集及预处理过程,紧接着在阐述核心模型原理后对模型进行检验评估,最后会对实验进行总结并提出改进建议。
- 研究问题
太阳能,作为世界第一大清洁能源相对煤炭石油等能源来说是可再生、无污染的。只要有太阳就有太阳能,所以太阳能的利用被很多国家列为重点开发项目,同样我国也尤为重视该项目。2018年,国家电力投资集团为贯彻落实国家科技创新发展战略,依据相关政策策划了“光伏电站人工智能运维大数据处理分析”大赛,鼓励参赛队伍在分析光伏发电原理的基础上,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量。该比赛成立以后,一直有不少学者研究光伏发电的预测问题,因为准确的预测光伏发电功率可以使电力调度部门及时调整调度计划,提高电网运行的经济性和稳定性,促进新能源消纳。
1.1问题特点
间歇性和波动性是光伏发电的特点。光伏发电是一个连续不断的过程,其数据作为一个典型的时间序列,不仅是非线性的,而且具有时间相关性。因此光伏发电功率每时刻的变化不仅取决于当前时刻,还取决于过去时刻。此外光伏发电功率还会受到自然因素影响。由于光伏电站独特的地理空间位置,光伏发电功率也具有空间相关性。对于邻近地区的多个光伏电站而言,由于地理条件相近,且在相似的天气、气温等气象条件作用下,光伏电站输出功率呈现一定程度的相似性。为此,能够准确预测光伏发电功率对于电网的调度具有十分重要的意义。
1.2问题难点
预测精度和数据处理是目前光伏发电预估的难点。一方面光伏发电受太阳能影响,具有波动、间歇和较强的随机性,而一般的学习模型的学习能力不足,无法从历史数据中学习到光伏发电量和气象数据间的关系;另一方面,光伏发电功率预测技术多围绕气象条件和历史数据建模,这类数据存在数据不全面、时间滞后性等问题,会存在一定的误差。此外数据处理也是问题的棘手之处。在数据预处理环节,如何确保输入数据的有效性和可信度,如何筛选出重要的特征指标,如何量化分析每种主要因素对预测结果的影响,每一步都非常关键。
- 研究数据
2.1数据来源
本次光伏发电预测数据来源于DataFountain上光伏发电比赛数据。但是由于比赛已经结束,目前数据可以从GitHub上下载(github.com/eastlong/competition_diantou_2018/tree/master/data)
2.2数据集介绍
本次数据集分为训练集和测试集,由于测试集中没有发电量指标数据,因此本次处理只选择训练数据集,共有样本光伏发电设备采集信息9000条。其中包含21列变量信息,包括光伏板运行状态参数和气象参数。
表1 数据基本信息 | |||||
字段 | 含义 | 字段 | 含义 | 字段 | 含义 |
ID | 当前记录条数 | 电压A | 为数据采集点A处汇流箱电压值 | 功率B | 为采集点B处的功率Pb,P=UI |
板温 | 光伏电池板背测温度 | 电压B | 为数据采集点B处汇流箱电压值 | 功率C | 为采集点C处的功率Pb,P=UI |
现场温度 | 光伏电站现场温度 | 电压C | 为数据采集点C处汇流箱电压值 | 平均功率 | 为A、B、C三点功率的平均值 |
转换效率 | 为计算得到的平均转换效率 | 电流A | 为采集点A处汇流箱电流值 | 风速 | 为光伏电厂现场风速测量值 |
转换效率A | 数据采集点A处的光伏板转换效率 | 电流B | 为采集点B处汇流箱电流值 | 风向 | 为光伏电厂现场风的来向 |
转换效率B | 数据采集点B处的光伏板转换效率 | 电流C | 为采集点C处汇流箱电流值 | 光照强度 | 太阳光的照射强度 |
转换效率C | 数据采集点C处的光伏板转换效率 | 功率A | 采集点A处的功率Pa,P=UI | 发电量 | 基于统计与计算 |