工业智能技术加速风电行业智能化建设“三重奏”
原标题:工业智能技术加速风电行业智能化建设“三重奏”
当前,我国新能源产业正在逐渐推进能源生产和消费方式革命,构建清洁低碳、安全高效的能源体系成为我国经济社会转型发展的迫切需要。
“工业智能技术正在加速风电行业智能化建设。”日前,北京天泽智云科技有限公司技术研发副总裁金超博士在接受科技日报记者的采访时表示,风电智能化有三个重要的参考要素。
数据来源与质量管理
金超强调,要结合风电领域知识,对数据的来源跟质量进行管理,选择那些对工业智能建模有作用的数据,才是最有价值的。
“这不仅仅适用于风电,任何一个做智能化转型的行业,采用数据驱动的方式,最终目的都是要将人的决策过程自动化。也就是说,我们所理解的数据驱动的工业智能,是要将‘以前要靠人去不同的数据系统里整合信息、内化成知识、最后形成决策’这样一条链路自动化。”金超说。
除了对数据的量和来源进行管理之外,对数据质量的管理也很重要。金超认为,数据的质量,大概可以分为三类问题:第一类是通用的数据质量问题,比如奇异值、缺失值、超限值等。第二类是跟行业相关的,比如有的工况不满足分析目标,要对工况做修正。第三类是跟建模相关的,如样本不平衡、标签缺乏等。
数据质量对数据驱动的模型效果非常重要,提前获得足量、高质量、能代表所建模型对象行为的数据,是保证模型效果的必要条件。但是,在现场获取的数据的质量,通常都达不到理想状态。而利用数据质量不佳的数据训练得到的模型,效果也不会很好。
金超举例说:“在做发电机轴承温度异常预警功能时,我们并没有大量的有标签的历史数据。根据我们能获取的轴承温度、环境温度、功率、风速等信号,利用能量守恒建立微分方程,通过估计参数来建立‘正常行为’模型,再与当下的状态做比对,根据残差的分布偏移来判断异常,以此来弥补历史数据标签的不足。这就是我们通常采用的一个原则‘数据不够,机理来凑’。当融入机理之后,一是不需要大量的训练数据,原来一个月的训练数据,现在7天就够了;二是对外部环境的敏感度有所降低,受工况影响也变小;三是根据机理设计的被估计参数,让整个模型的可解释性也变得更强。”
模型也需要全生命周期管理
“因此在工业智能建模的时候,模型的选择不一定只用数据驱动的模型。考虑选择什么样的建模方式,应从数据和机理两个角度来考虑。”金超说。
当数据比较少,同时对建模对象理解不够深时,更多依赖于经验或者需要做一些实验。在数据比较少,机理很强时,比如典型旋转类设备的智能诊断,可以基于机理来做分析,并且基于规则来做到预警。对于机理比较弱,但是数据很多的情况,就可以发挥数据驱动的模型优势,去弥补对机理认知的不足。当数据足够,并且机理也很强时,我们更倾向于去做机理跟数据融合的模型,因为往往这样的模型可解释性更强,对于外部环境的变化也更加不敏感。
“通过我们和信通院合作举办的工业大数据创新竞赛来看,也印证了这样的思维方式。在第三届工业大数据创新竞赛的化工设备故障程度预测问题,第一名利用了传统的振动分析,加上LightGBM机器学习,取得了非常高的分数。我们后来得知,第一名的选手是机械工程背景,对旋转类设备的分析很在行。但第二名利用GAN这样的非监督式深度学习方法,也达到了类似的效果。第二名采用的思路尤其引起我们的兴趣:将振动信号的分析转化为类图像问题,利用计算机科学在图像领域的突破性技术和思想,来解决工业里面的非图像数据问题。这个提醒我们,在数据量足够的时候,数据驱动的方法,是可能弥补一些我们对机理了解的不充分的。”金超说,“无论是哪次竞赛,我们发现与我们的经验一致,机理和数据驱动相结合的方式,效果往往都比较好。”