【技术】DTEmpower核心功能技术揭秘(5) – AIAgent模块
在前面《DTEmpower核心功能技术揭秘》系列的文章中,我们提到了机器学习的一个经典理论:数据和特征决定了机器学习模型的上限,而算法则是在不断逼近这个上限。
如前文所述,基于这个经典理论,天洑软件自研了一系列的数据挖掘和探索技术,如HierarchicalStratify分层分类技术、AIOD智能异常点检测等技术,并集成于DTEmpower软件平台之中。这些技术都是针对机器学习模型上限的决定性因素-数据和特征提出的一系列提升方案。
我们在关注数据和特征的同时,需要注意到如何让算法逼近这个上限也是一个需要解决的问题。除了集成市面上常见的训练算法以供用户选择之外,天洑软件还针对工业设计数据的“小数据集”“数据分布不均”等特点,自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。
通过AIAgent模块,用户可以避免机械式的调参过程并节省大量的时间,这为在实际工业应用中落地数据驱动技术扫清了另一障碍,也是DTEmpower软件的另一大功能特色。
如图1所示,AIAgent功能模块配置简单,使用方便,用户根据实际问题简单搭配使用3个按钮,即可得到“最优”模型。
图1 AIAgent模块在使用神经网络(径向基核函数网络)的基础上,根据大量的工程案例总结,引入“正则多项式”组合的形式构建鲁棒性更强的、适用于工业问题的学习算法。同时AIAgent节点配置简单,无需配置过多参数,只需要根据实际问题打开或关闭“超参优化”、“小数据集优化”和“交叉验证”开关,用户即可一键得到“最优”模型
1. 风力机轮毂强度回归分析
① 数据集背景介绍:轮毂是风力发电机组中的关键零部件,在运行过程中可能会承受多种极端载荷的叠加作用,造成轮毂结构的破坏。因此需要对轮毂在不同载荷下的应力情况进行分析,并采用数据训练的手段建立载荷与轮毂应力之间的代理模型,进行快速评估。
② 建模和实验方法:采用图2所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了Random Forest随机森林、GBDT(Gradient Boosting Decision Tree)梯度提升树、多项式拟合和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2和NRMSE指标。
图2 针对风力机轮毂强度数据集,在DTEmpower软件平台上搭建回归分析的建模方案。DTEmpower提供了一站式的数据建模解决方案,通过简单的节点拖拽即可搭建完整的建模流程。其中AIAgent具有非常简单的节点配置属性,用户仅通过“超参优化”、“小数据集优化”和“交叉验证”三个开关的搭配使用即可得到“最优”模型
③ 实验结果:图3所示的实验结果表明,在风力机轮毂强度数据集上,AIAgent算法在5个输出变量上的性能指标均优于其他3种常见算法。
图3-1 采用4种不同的算法对5个输出变量进行回归分析,比较其R2精度指标可以发现蓝色柱子所示的基于AIAgent算法的模型在5个输出变量上的R2指标均在0.99以上,甚至非常逼近于1。而相较于其他3种算法的R2值均在0.99以下,AIAgent算法具有非常明显的优势。
图3-2 针对风力机轮毂强度数据集,采用4种不同的算法算法对5个输出变量进行回归分析,比较其NRMSE指标可以发现基于AIAgent算法的模型在5个变量上的NRMSE误差指标均在0.01以下,而相比于其他3种算法,其NRMSE指标值均在0.02以上,甚至更高。结合图3-1,可以说明AIAgent在风力机轮毂数据集上的优越性
2. 船舶兴波阻力回归分析
① 数据集介绍:本方案中采用的数据集是经SHIPFLOW软件计算兴波阻力的数据集,该数据集输入参数是draft、Halfbeam、Height、Loa、BulbLengthChange,目标参数是兴波阻力eval_CWTWC。
② 建模方法:采用图4所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了CART、Bagging、Adaboost 和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2、MSE、MAPE等指标和在测试集上对目标变量的拟合误差。
图4 基于DTEmpower软件平台的船舶兴波阻力回归分析建模方案。其中AIAgent节点为本次实验中用到的回归训练算法,无需做过多的节点属性配置,用户即可搭建完整的建模流程。
③ 实验结果:通过表1和图5不难发现,在船舶兴波阻力数据集上,AIAgent训练算法的R2、NRMSE、MAPE等指标均优于其他3种训练算法,而在测试集上的拟合误差图也进一步说明了AIAgent训练算法相较于普通训练算法具有优越的泛化性能。
表1 基于AIAgent和其他3个训练算法的船舶兴波阻力回归模型的精度指标,通过表中数据可以看到,基于AIAgent训练算法的模型精度均高于其他算法,这表明了在兴波阻力数据集上AIAgent算法相较于其他3种算法的优越性
图5 基于不同算法的回归模型在测试集上真实值和预测值的预测误差,蓝色曲线代表AIAgent算法的拟合误差,不难发现AIAgent算法的拟合误差基本都在0值上下波动,且波动范围小于其他3种算法的拟合误差,这说明了AIAgent算法对于测试集数据具有强于其他3种算法的泛化能力
数据和特征决定了模型的上限,在如何让算法不断逼近这个上限的问题上,天洑软件针对“小数据集”自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。
在实际工业场景中的应用案例和对比实验,证明了AIAgent功能模块能轻松、有效的提高模型精度。在不同应用场景(如风力机强度回归分析和船舶兴波阻力回归分析)下的实验结果,也说明AIAgent功能模块的通用性和易用性。
DTEmpower不仅提供了一站式的数据建模解决方案,同时借助于AIAgent、异常点检测以及高维可视化等技术的加持,可以帮助用户快速、便捷的深入挖掘数据和特征,为建立高精度的数据模型提供了一条高效可落地的实现路径。
免责声明:
1、本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
2、本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
3、本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
4、侵权违法和不良信息举报 举报邮箱:cnddit@qq.com
还没有评论,来说两句吧...