【技术】DTEmpower核心功能技术揭秘(7) – ROD基于回归分析的异常点检测技术
《DTEmpower核心功能技术揭秘》系列的文章围绕着如何提升机器学习模型的精度,介绍了AIOD、AIAgent、autoML等核心技术。其中AIOD异常点检测技术融合了数十种常见的异常检测算法,用以识别数据集中的异常点;AIAgent和autoML是对训练算法的提升。
本系列的第七篇文章将继续围绕如何让算法逼近模型上限的问题,介绍一种基于回归分析的异常点检测技术-Regression Based Outlier Detection(ROD)技术。不同于传统的异常检测算法,ROD方法是在模型训练的基础上后处理的进行异常点剔除的方法。所以,如何选择合适的异常点剔除个数需要较多的测试,以寻找到最适用于当前测试集的模型。
该技术模块集成于DTEmpower中的每个回归算法节点,能够帮助用户在剔除“潜在异常点”的同时,提高了模型的精度和泛化能力。
图4 随着ROD功能模块不断的删除数据集中的异常点,可以看到3种算法模型的R2指标(越大模型精度越高)呈现出明显的上升趋势,而其MAE指标呈现明显的下降趋势。这表明ROD功能模块在清除异常点、提高模型精度的优秀性能
图5 基于DTEmpower软件平台的风机测点结构应力快速评估建模方案,方案中选取2种常见算法进行模型的训练。DTEmpower提供了一站式的数据建模解决方案,通过简单的节点拖拽即可搭建完整的建模流程,其中ROD功能更是集成于每一个算法节点,帮助用户构建高精度的机器学习模型
③ 实验分析:实验结果如图6所示。
数据和特征决定了模型的上限,数据中的异常点会对模型的精度造成严重的影响。而DTEmpower中的ROD技术直接以提高模型的精度为目标,寻找并剔除样本中的“潜在异常点”。
实际工业场景中的应用案例和对比实验,也证明了ROD功能模块在挖掘工业数据集中的“潜在异常点”方面的优秀性能,可高效地辅助用户构建高精度模型。
DTEmpower软件平台提供的数据挖掘、特征工程和智能的异常点检测等一站式解决方案,不仅可以帮助用户快速、便捷地构建精度较高的数据模型,其技术的创新应用势必会给工业数据研究者持续带来福音。
免责声明:
1、本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
2、本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
3、本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
4、侵权违法和不良信息举报 举报邮箱:cnddit@qq.com
还没有评论,来说两句吧...