机器学习和数据驱动算法在智慧发电系统中的应用 - 副本.docx
-
资源ID:1429988
资源大小:63.72KB
全文页数:15页
- 资源格式: DOCX
下载积分:5金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
机器学习和数据驱动算法在智慧发电系统中的应用 - 副本.docx
一、引言几十年来,火力发电是造成环境污染和碳排放的主要因素之一。据报道,2018年发电行业的碳排放占碳排放增长的近三分之二,其中燃煤发电所占比重最大(约占总排放量的30%)O考虑到日益严重的气候变化问题,世界主要国家被迫确定“将全球平均气温的上升幅度控制在工业化前水平以上低于2。C之内的目标。为了实现这一目标,需要对发电行业进行改革,具体包括优化目前流行的火力发电的效率,扩大可持续能源(包括水电、太阳能和风能)的比例。控制和优化发电系统对于其高效和安全运行至关重要。由于发电系统中各部分存在多时间尺度的特征,发电系统通常采用分层控制框架,以完成各层的主要任务,如图1所示。在最低的测量过程层,必须保证重要变量测量和监控的可见性。根据这些变量,将调节控制器放置在现场,以使每个单回路(如温度、压力和水位)控制在上级监控层指定的工作点上。基于此,本文将调节控制水平的性能称为“机动性,它描述了目标回路在需要时如何快速和稳定地行动。监控层采用先进的控制算法,在满足操作约束的同时,通过考虑多变量耦合,最大限度地提高许多交互回路的灵活性。在最高级别的经济规划中,制定和优化总体效率或利润指标,为较低层次的动态控制提供稳态工作点。除了自下而上的控制水平外,故障检测和诊断(FDD)对于安全运行和维持更长的发电厂寿命至关重要。图1中的层次结构可用于管理完整的发电系统(如燃料电池单元)或子系统(如燃煤发电厂的锅炉燃烧炉)。ProfitabilrtyFlexibilityManeuverabilityVisibilrtySafetyEnvironmentuncertaintyModeluncertaintyDstufbareuncertaintyStocast>cuncertaintyDeviceuncertainty图1发电系统或子系统的分层结构,用于监测、控制、优化和故障检测。一般图1中的每个层级都有一个精确的模型,这对于实现多个目标至关重要。监控层的内部变量通常由状态观测器或基于状态空间(SS)模型的卡尔曼滤波器实现,如电池芯温度估计。用于调节层的则是广泛使用的比例-积分-微分(PID)控制器一一通常需要一个参数整定的过程模型。就灵活性层级而言,模型预测控制(MPC)占监控算法的最大份额。MPC采用基于模型的输出预测,将多变量约束优化问题转化为一个滚动时域二次优化框架。展示了在太阳能联合循环电厂中的MPC的典型应用。对于经济规划层,动态规划是一种非常流行的算法,用于调度不同电源之间的能量流需求,通常以每小时运行成本来计算,如复杂第三代发电厂的能量成本优化或混合发电厂的运行成本优化。故障检测通常使用的是先验模型,就像最近在燃料电池空气供给系统中的应用一样。近年来一个重要的发展趋势是基于经济模型预测控制(EMPC)框架,将经济性规划与监控水平结合形成集成EMPCo该框架能够根据系统模型和各种约束条件直接制定经济指标,同时实现经济优化和动态运行。己有研究表明,可以利用EMPC减少锅炉-汽轮机机组的节流损失以及提高建筑物热电联产系统的舒适性。传统的基于模型的方法虽然有效,但其终将无法处理规模不断增长且具有各种不确定性的能源系统。本文总结了图1中每个层级上通常遇到的几种典型不确定性。这些不确定性将在下一节中逐一讨论。21世纪是机器学习(M1.)和数据科学蓬勃发展的时代;机器学习和数据科学的发展可能是解决可扩展性和不确定性方面困难的关键。在这个大数据时代,许多学科,如粒子物理学、材料学和过程系统工程,已经逐渐产生了研究方法从基于模型的分析到机器学习和基于数据驱动(DD)研究的巨大转变。机器学习和基于数据驱动的研究技术彻底改变了现代能源系统的监测、控制和优化的方法,包括传统化石燃料发电厂和可再生能源系统。常见的机器学习算法包括无监督学习、监督学习和强化学习(R1.),每一种算法都被应用于不同层次的能源系统,以解决不同的问题。数据驱动技术通常使用实时或历史数据直接控制过程,包括迭代反馈调节(IFT)、迭代学习控制(I1.C)和自抗扰控制(ADRC)。数据驱动方法通常比机器学习方法具有更大的适用范围和更快的运行速度,它能满足监管控制层级的高实时性要求,应用广泛。本文并不试图对所有能源系统应用中的每种方法进行全面的讨论,相反,本文旨在展示如何适当运用机器学习和基于数据驱动的方法,以提高发电系统的可见性、机动性、灵活性、经济性和安全性(简称五性),来应对各个层级所出现的不确定性挑战。根据图1,“五性可定义如下:可见性一一可测量变量的测量和传输以及内部不可测量变量的估计。机动性一一底层调节控制响应的快速性和准确性,主要是在单回路过程中。 灵活性一一多变量协调在监督控制水平上可以达到的程度。 经济性一一整个系统或重要子系统的经济成本或效益。 安全性一一系统的FDD,防止对发电系统造成危险。在智慧发电中,可见性层级是其他层级的基础,因为它涉及感知用于控制、优化和诊断的内部参数。强大的机动性级别是实现灵活性和经济性的有力保证,而安全级别是保护整个系统安全的基本保障。本文全面回顾了机器学习和数据驱动方法在电力行业的应用:从传统火力发电到新兴的可再生能源领域;从确定性场景到不确定性场景;从整个运行管理框架的底层到顶层。本文选择不确定性处理视角的原因如下: 不确定性广泛存在于发电系统的各个层面。正如RogerBrOCkett所说,"如果系统、控制或环境中没有不确定性,那么反馈控制在很大程度上是不必要的J 不确定性的性质在不同层级上有所不同,所以需要各个层级单独考虑。例如,应估计并抵消灵活性层级上的干扰不确定性,而经济性上的环境不确定性应建模为随机过程,然后将其考虑在内在经济优化过程中。本文侧重于发电方面,将不讨论电网方面的文献。本文的其余部分组织如下:第2节讨论了底层可见性和机动性,其中数据驱动和机器学习算法必须快速响应监管要求;第3节回顾了基于数据驱动模型的预测控制、在能源系统规划层面的监管灵活性以及各种无监管和R1.方法,计算时间从数分钟到数小时不等;第4节对发电系统的数据驱动的FDD方法进行了回顾,并与基于模型的方法进行了比较;第5节总结了调查结果,并阐述了智慧发电的未来研究方向。二、可见性和机动性可见性要求涉及变量测量、定量过程表征和隐藏变量软测量。测量信号中不可避免的随机噪声是在这一层级上的主要的不确定性。机动性是基于过程识别和可见性层级的测量或估计信号实现的,主要目标是抑制不确定性干扰。(一)动态特性系统辨识是一种用于动态系统的经典数据驱动的方法。由于物理建模的困难,它通常被视为一个黑箱。自20世纪60年代以来,该学科受到了广泛关注并取得了巨大成功,甚至早于机器学习的兴盛。通过将某些激励作为控制输入,用于辨识发电过程输入/输出数据背后的基本结构和参数。基于经典阶跃响应的传递函数识别是发电厂中最常用的方法。阶跃响应识别在能源系统中的应用包括再热器中的水位控制、燃料电池的温度控制和多变量流化床燃烧室控制。己有研窕表明,经典的阶跃响应方法无法辨识存在测量噪声的高阶过程。为了缓解这一问题,参考文献33针对换热器(能源系统中常见的高阶设备)开发了一种混合时域和频域的辨识方法。传感器噪声是现代系统辨识方法需要解决的核心问题。加性高斯白噪声(AWGN)主要来源于热噪声,是发电系统中最常见的传感器噪声。目前已经开发出多种成熟的数据驱动的方法来解决能源系统中的AWGN,最常用的方法是使用最小标准,如平方误差。对于单输入单输出系统(SISO),参考文献35给出了一个示例,其中使用自适应递归最小二乘法(AR1.)实时识别燃料电池混合系统模型的回归参数,即具有AWGN的线性差分方程或具有额外输入的自回归(ARX)模型。该ARX模型基于递归最小二乘法(R1.S)识别方法,是几乎所有发电行业最常用的抵消AWGN的方法之一,包括风力发电行业、太阳能发电行业、火力发电行业和储能系统行业。而对于非高斯有色噪声,参考文献42中的电池参数识别研究引入了一种辅助变量方法,该方法改进了最小二乘识别方法,优于传统R1.So当涉及SS模型描述的多状态系统时,噪声问题变得更加棘手。对于具有未知参数(即灰盒)的SS物理模型,Cramer-RaO界分析用于电池和混合储能系统的参数识别,以处理电池电压测量中的AWGN。为了避免理论解中的分析困难,启发式优化方法被广泛用于识别能源系统,如燃料电池、太阳能电池和水轮的SS模型参数。对于没有任何物理机制和SS模型的黑箱系统,通常采用子空间识别(SID)。此类系统的示例包括燃料电池、电厂再热器和流化床燃烧器。上述系统识别方法通常需要特定类型的输入激励信号,并且主要作用于线性系统。随着机器学习方法的发展,这一惯例发生了变化,机器学习方法能够识别基于大量数据记录的复杂非线性系统。浅层神经网络(NN)是能源系统中最常用的方法之一,如燃料电池的动态建模、锅炉-涡轮机组和太阳能发电。为了降低结构风险,支持向量机(SVM)也广泛用于能源系统识别。在过去10年中,随着深度学习的重新兴起,长短期记忆网络(1.STM)变得越来越普遍,因为它能更好地处理发电系统的时间序列数据。(二)软测量由于能源系统中的一些关键变量可能无法直接测量,软测量技术,包括基于模型的状态估计和数据驱动的相关算法,可以有效地观测系统内部的情况,并为控制层提供反馈信号。基于模型的状态估计通常存在随机噪声的不确定性和传感器的不精确性等问题。一些数据驱动的方法己被用来弥补这一不足,如基于状态增强和反馈校正的电池芯温度估计。基于数据驱动代数相关的软测量方法旨在通过测量次要变量来估计不可测量变量(也称为主要变量)。虽然在系统运行时无法直接测量,但主要变量可以脱机测量和(或)间歇性访问,每个样本的成本很高。所以,软测量的基本任务是根据有限的观测数据,确定主要变量和次要变量之间的关系。为此,可以使用回归或曲线拟合。例如,学习证据回归模型,将其作为软传感器来监测磨煤机中的粉末浓度;训练偏最小二乘(P1.S)回归来预测100OMW级发电厂中NOX的排放。(三)监管控制为了实现强大的灵活性,许多反馈控制器被部署在调节控制层级。该层级接收来自可见性层级的信号和来自上层的参考命令。其主要目标是减轻不可测量和不确定性干扰的影响。对每个回路进行建模和设计单独的反馈控制器既十分耗时又很昂贵。因此,数据驱动的控制方法在工业调节控制中起着核心作用。本文回顾了PID控制、自抗扰控制和I1.C在一些典型扰动中的应用。PID控制仍然是发电系统中的主要控制器,因为它易于使用,在要求快速反应的环境中,计算时间可以忽略不计。PID控制使用比例、积分和实时误差数据推导的组合,而不是物理模型,来调整执行器并在最佳条件下保持设备运行。困难通常在于调整控制器参数。工程师有时采用机器学习技术来提高性能,如神经网络增强PID控制在火力发电厂、燃料电池、太阳能发电厂和风力涡轮机中的应用。此外,模糊逻辑在风力涡轮机、燃料电池、太阳能发电和联合循环发电厂中非常流行,用于在线调整PID参数。为了能充分利用历史数据的潜力,还对IFT进行了研究,以调整锅炉-汽轮机机组的PID参数。IFT是一种有趣的方法,通过学习以前任务的性能来迭代地提高控制性能。由于PID控制在处理非线性和模型不确定性方面的局限性,自抗扰控制正在成为一种突破性的数据驱动控制技术。与PID控制相同,自抗扰控制器的设计不需要物理模型。与PID控制相比,自抗扰控制的主要优点在于它具有两个自由度,在设定点跟踪和干扰抑制方面都能产生令人满意的性能。自抗扰控制的数据驱动补偿机制如图2所示。首先设计一个扩展状态观测器来估计未知动态和外部干扰,然后通过分析输入和输出数据直接补偿控制输入中的未知动态和外部干扰。增强型设备,即图2中的灰色块,可以作为串级积分器过程进行近似补偿,从而可以容易地设计外环控制器。参考文献29表明,自抗扰控制器具有抗积分饱和能力,适用于100oMW级发电厂的再热器。通过锅炉炉膛控制中的实验应用,讨论了自抗扰控制器的整定。通过引入串级自抗扰控制结构,电厂过热温度的波动显著降低。最近,自抗扰控制器还被引入风力涡轮机、光伏发电和燃料电池的监管控制中。图2自抗扰控制器数据驱动干扰补偿结构。公:比例增益:e:反馈误差;do:过程增益;ESO:扩展状态观测器。I1.C专门用于解决周期性干扰,尽管在发电系统中的应用相对有限,但仍然得到了控制界的广泛关注。通过学习前面序列中相应的时间步,I1.C在每个时间步逐步修改控制动作。发电系统中典型的周期性扰动和探索性I1.C应用包括燃料电池阳极净化过程和风力涡轮机峰值负荷。三、灵活性和经济性灵活性是指监控级别协调多个回路之间操作的能力,构成了盈利能力的基础。为了寻求最大利润和最小成本,盈利水平计算中间层过程变量的最佳条件。因此,更大的灵活性使高度互动的能源系统能更容易、更安全地在选定的几个操作条件下得到维护,并具有最大的经济效益。(一)灵活性系统灵活性的监控层级主要负责两个基本监管回路的协调。更灵活的多变量控制器设计策略使系统在任何干扰后能快速地转换回经济性最优的状态。多变量模型仍然很重要,目前在监控应用(包括发电应用)中发挥着基本作用。由于发电过程中严格的安全要求,纯数据驱动控制的研究和应用受到一定限制。没有模型,通常很难保证多变量控制系统的稳定性。然而,基于模型的控制的主要挑战是在条件转换、设备老化和环境变化期间的模型不确定性。为此,机器学习和数据驱动技术可以提高系统对模型不确定性的鲁棒性。对于计算资源有限的传统监控应用,通常使用模糊逻辑调整参数以提高性能。通过识别电厂主蒸汽压力的一组线性模型,使用模糊逻辑在线调整解耦PID控制器的参数,以适应磨煤机的不确定条件。同样,为光伏/燃料电池发电厂开发了基于平滑度的智能模糊逻辑控制器,以实现对电力系统的快速稳定响应。开发了一种混合经典和模糊控制方法,用于控制电厂锅炉的蒸汽温度和水位。模型信息可用于增强多变量自抗扰控制器的数据驱动控制性能,如水箱中的多变量控制应用和火力发电厂的直接能量平衡控制。鉴于工业计算能力的快速发展,上述监控方法有些过时,这使得先进的、算力需求较大的控制算法(如MPC)得以应用。当缺少物理模型时,通常使用SlD方法为MPC开发数据驱动模型。参考文献中提出了模糊聚类与SID组合的方法,以便在MPC框架下制定和处理锅炉-汽轮机机组的多变量耦合和运行约束。对于没有完全在线测量所有输出变量的燃料电池系统,SID方法直接嵌入MPC,以实现完全数据驱动控制。最近,数据驱动增强型MPC被用于燃煤发电厂的污染控制和碳捕获控制。除了数据驱动方法外,机器学习方法还与MPC相结合。神经网络用于训练MPC模型,并在动态能量管理系统中取得了成功。此外,最小二乘支持向量机(1.S-SVM)和偏最小二乘支持向量机分别用于识别燃料电池系统,在此基础上部署MPC,以实现对工作温度有约束的快速功率跟踪。参考文献96中针对核电厂过热蒸汽供应系统提出了一种基于多层感知的MPCo基于机器学习的MPC的主要缺点是通常无法保证闭环稳定性。(二)经济性经济性规划是发电系统规划的最高水平。它的时间步长通常为小时或天,因此有足够的时间计算较低级别的经济参考。传统上,数据挖掘的方法用于根据历史数据计算最经济的操作。例如,在最近的无监督学习应用中,首先通过主成分分析(PCA)减小电厂脱硫系统的历史数据的量,然后使用模糊C-均值聚类方法得出具有相似操作条件的多个组。因此,运行系统的经济参考可确定为类似组的最低脱硫成本点。换言之,主成分分析和聚类相结合的方法旨在通过将当前工况与其所属组中类似的运行工况进行比较来寻找最佳点。然而,这种方法只能搜索数据库的现有条件,不能保证最优性。这是一种不同于锅炉燃烧优化的方法。基于最小二乘支持向量机,对锅炉燃烧效率和污染物排放量进行了大量的回归分析。然后采用遗传算法优化条件设置,平衡燃烧效率和污染排放。当涉及可再生能源发电系统时,由于不确定环境变量的存在,如风和阳光的周期,以及各种负荷的波动,使得经济规划更加困难。为此,对每个不确定变量的合理预测对于下一步的盈利能力决策至关重要。这可能是发电领域最活跃的研究领域,有大量文献研究了各种机器学习算法。以风电预测为例,各种人工神经网络(ANN)结构,包括前馈、时间序列、递归和深度神经网络,己被用于将不同的天气变量映射到一系列不同时间尺度(如每日、每周和每月)的确定性风电预测值。风力发电的统计特性通过贝叶斯方法进行评估,如稀疏贝叶斯学习、贝叶斯非参数方法和马尔可夫链蒙特卡罗(MCMC)方法,以得出一定范围内的概率分布。最近,开发了一个两层式机器学习模型,以产生确定性和概率性的风电预测,其中天气变量(温度、湿度、压力和风向)通过深度特征选择块进行预处理。如文献所述,最先进的太阳能和负荷预测方法与风能的预测方法相似。随着间歇性可再生能源和不确定负荷的预测,优化混合发电和储能系统的经济规划成为可能。R1.似乎是一个很有前途的数据驱动解决方案,因为它即使没有模型也能处理具有不确定性的优化问题。R1.继承自马尔可夫决策过程(MDP)框架,由环境中的一组代理状态、每个代理的一组可能操作以及控制动态转换、偏好和观察的规则来描述。通过与宿主环境交互(即接收观察和奖励),R1.代理选择适当的操作以最大化奖励。为了克服传统优化方法的分析挑战,无论是否有物理/仿真模型,R1.将极端寻求或经济规划转化为发电系统的纯数据学习问题。一个直观的单代理Q-学习示例来自风能转换系统(WECS)的最大功率点跟踪(MPPT)控制,其中R1.代理是风力涡轮机,过渡状态是转子速度和电功率输出,动作是速度调整命令,奖励定义为电功率输出的增量。针对多电源分布式发电,提出了一种以燃料电池、柴油发电机、电池、海水淡化装置和电解槽等可调节装置的累积期望折扣回馈最大,来减少系统的油耗装置为主体的多智能体模糊学习方法。通过这些可调元件之间的R1.协调行动,可最大化减少耗能,以确保系统可靠性并最大限度地减少化石燃料消耗。深度强化学习(DR1.)被引入,利用神经网络强大的逼近能力来解决复杂的能源网络问题。关于R1.和DR1.在发电系统中应用的进一步示例,可在最近的调查中查阅。四、安全性一一故障检测和诊断通常,智慧发电中用于FDD的方法分为两类:基于模型的方法和基于实例的方法。基于模型的方法寻求设备的输入、状态和输出之间的定量关系,受潜在设备不确定性的影响。计算目标输出和模型预测之间的残差,如果累计残差大于规定阈值,则检测并隔离故障。以某制粉系统为例,利用SS方程建立了基于观测器的FDD模型,用于监测漏煤、堵磨等故障。实验结果表明,基于观测器的FDD方法在标称情况下表现良好。然而,未知干扰或不确定性可能导致基于观测器的FDD模型表现不够好。为防止此类故障,一种数据驱动FDD方法被开发出来。这种方法基于可测过程数据构建鲁棒的残差生成器以检测故障,如应用在存在未知干扰和测量噪声的情况下的风机故障检测与诊断中。此外,数据驱动的FDD方法可能不需要来自工厂的先验信息。在参考文献中可以找到风力涡轮机故障检测的应用,其中比较了神经网络和其他回归方法。数据驱动基于实例的方法还将具有不同故障类型的历史样本视为位于由输入、输出和(或)状态组成的混合特征空间中的模式。然后将新的观测结果与历史模式进行比较,以确定是否存在断层;如果是,则检测到的故障将被分配到已知的最相似的故障类型。数据驱动的方法是基于案例的方法解决分类问题,而基于模型的方法是解决回归问题。换句话说,任何分类算法都可以重新调整用途并部署为FDD模型。类似地,燃料电池FDD基于分类算法进行。参考文献对支持向量机和自适应神经模糊推理系统(ANFIS)分类器进行了研究,以识别汽轮机机组的故障状态。对于基于能源系统分类算法的其他FDD模型,感兴趣的读者可查阅参考文献及其中的文献。普遍存在的不确定性阻碍了FDD在发电系统中的应用。阈值通常由用户确定。事实上,几乎所有的FDD模型都对用户给定的阈值敏感:一个小的阈值会导致许多错误警报。目前还没有一种通用且被广泛接受的方法用于处理不精确性和不确定性,或者在FDD中预设用户给定的阈值。除上述两个问题外,发电厂的安全协议使得获取故障样本(即训练样本)的成本过高。因此,必须根据正常操作数据执行FDD。图3DS理论框架卜.的数据驱动的故障检测和诊断。五、总结机器学习和数据驱动控制方法己被证明是各级智慧发电系统运行中基于传统模型方法的比较有希望的替代方法,尤其是对于不确定性的情况。本文阐述了各层级的目标和主要的不确定性,并回顾了机器学习和数据驱动方法如何帮助提高可见性、机动性、灵活性、经济性和安全性。对于受随机噪声不确定性影响的动态建模,数据驱动系统辨识方法在推导传递函数和SS形式的代数模型方面起着重要作用。此外,当大数据可用时,基于机器学习的回归方法在描述非线性多变量能源系统方面更为有效。除了动态表征外,数据驱动的软测量还可以显著增强内部能量系统的可见性。基于可见度信息,调节控制水平可以通过对特定类型的不确定性干扰使用合适的数据驱动控制方法来提高设备的机动性。基于模型的第一定律方法对于监控多变量控制水平仍然至关重要,但可以将数据驱动方法嵌入MPC框架中,以增强发电系统对模型不确定性的灵活性。经济性规划严重依赖机器学习方法来适应受各种不确定性影响的大规模能源系统优化问题。为了在未知故障情况下提高系统安全性,数据驱动的DS理论只有在正常运行数据可用时,在发电系统故障诊断中显示出巨大的潜力。目前,EMPC仍然严重依赖于过程模型,并且关于将机器学习算法实现为监督和规划级别组合的研究很少。此外,与机器学习和数据科学的蓬勃发展相比,最新的机器学习算法(如深度学习)与当前智慧发电系统中的应用存在很大差距。阻碍EMPC进一步应用的主要困难是在线优化所需的巨大计算时间。EMPC的高效计算是未来研究的一个重要课题。这个被低估但令人兴奋的话题仍处于发展的初级阶段。机器学习和数据驱动方法在提高电力系统效率方面具有巨大潜力,是电力系统实现可持续发展的未来。