<sub id="bz1nl"></sub><sub id="bz1nl"></sub>
        <sub id="bz1nl"></sub>

        <sub id="bz1nl"></sub><sub id="bz1nl"></sub>

          2.793

          2018影响因子

          (CJCR)

          • 中文核心
          • EI
          • 中国科技核心
          • Scopus
          • CSCD
          • 英国科学文摘

          留言板

          尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

          姓名
          邮箱
          手机号码
          标题
          留言内容
          验证码

          基于马氏距离的改进核Fisher化工故障诊断研究

          吕鹏飞 闫云聚 荔越

          吕鹏飞, 闫云聚, 荔越. 基于马氏距离的改进核Fisher化工故障诊断研究. 自动化学报, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          引用本文: 吕鹏飞, 闫云聚, 荔越. 基于马氏距离的改进核Fisher化工故障诊断研究. 自动化学报, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          Lv Peng-Fei, Yan Yun-Ju, Li Yue. Research on fault diagnosis of improved kernel Fisher based on Mahalanobis distance in the field of chemical industry. Acta Automatica Sinica, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          Citation: Lv Peng-Fei, Yan Yun-Ju, Li Yue. Research on fault diagnosis of improved kernel Fisher based on Mahalanobis distance in the field of chemical industry. Acta Automatica Sinica, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635

          基于马氏距离的改进核Fisher化工故障诊断研究


          DOI: 10.16383/j.aas.c190635
          详细信息
            作者简介:

            西北工业大学硕士研究生. 主要研究方向为机器学习与故障诊断.E-mail: 13571807486@163.com

            西北工业大学力学与土木建筑学院教授. 主要研究方向为信息融合与故障智能诊断系统. 本文通信作者.E-mail: yjyan_2895@nwpu.edu.cn

            西北工业大学力学与土木建筑学院博士研究生. 主要研究方向为故障诊断与机器学习.E-mail: christli@mail.nwpu.edu.cn

          • 基金项目:  西北工业大学硕士研究生创新创意种子基金(ZZ2019125), 陕西省自然科学基础研究计划(2019JQ-564)资助

          Research on Fault Diagnosis of Improved Kernel Fisher Based on Mahalanobis Distance in the Field of Chemical Industry

          More Information
          • Fund Project:  Supported by Graduate Innovative and Creative Seed Foundation of Northwest Polytechnical University (ZZ2019125), and Natural Science Basic Research Plan in Shanxi Province of China (2019JQ-564)
          • 摘要: 针对化工故障诊断数据存在非线性分布、 数据类别复杂、数据量大且故障特征不易区分等问题, 本文提出一种基于马氏距离的改进核Fisher故障诊断方法(Mahalanobis distance-based kernel Fisher discrimination, MKFD). 首先, 针对数据非线性分布的特点, 本文将核Fisher判别分析算法改进, 改进后的算法可以有效解决原始样本在投影后出现的因类间距离差异过大、类内距离不够紧凑造成的样本混叠现象. 除此之外, 利用Euclidean距离对类间距做加权处理时, 用组平均距离取代质心距离, 提升了运算效率, 降低了时间复杂度; 其次, 根据高斯径向基核函数(Radial basis function, RBF)在MKFD中所呈现出的诊断精度的规律, 本文采用一种新的核参数选择方法: 区间三分法, 用以取代在实际应用中依靠经验的交叉验证法; 最后, 本文采用马氏距离对故障进行分类, 基于田纳西伊—斯特曼过程(Tennessee-Eastman, TE)数据将本方法与其他改进核Fisher算法进行仿真验证对比. 结果表明新提出MKFD算法不仅可以提高故障诊断的运算效率, 也能有效提高诊断的精度.
          • 图  1  分类准确率变化图

            Fig.  1  Variation of classification accuracy

            图  2  A, B, C的符号

            Fig.  2  Symbols of A, B and C

            图  3  故障诊断准确率与核参数取值折线图

            Fig.  3  Line diagram of the fault diagnosis accuracy and kernel parameter

            图  4  故障诊断准确率与核参数取值折线图

            Fig.  4  Line diagram of the fault diagnosis accuracy and kernel parameter

            图  5  基于KFD算法的投影

            Fig.  5  Projection based on KFD algorithm

            图  6  基于CKFD算法的投影

            Fig.  6  Projection based on CKFD algorithm

            图  7  基于FDGLPP算法的投影

            Fig.  7  Projection based on FDGLPP algorithm

            图  8  基于MKFD算法的投影

            Fig.  8  Projection based on MKFD algorithm

            表  1  故障类型描述

            Table  1  Description of the selected fault sample sets

            Fault NumberFault descriptionFault type
            3物料 D 的温度的异变阶跃
            4反应器冷却水入口温度的异变阶跃
            5泠凝器冷却水入口温度的异变阶跃
            7物料 C 压力下降阶跃
            下载: 导出CSV

            表  2  选取不同核参数σ下故障诊断的准确率 (KFD)

            Table  2  The fault diagnosis accuracy based on different kernel parameter σ(KFD)

            The value of the parameter σTest accuracy (%)The value of the parameter σTest accuracy (%)
            0.1253081.25
            0.230.314080.94
            0.8507053.13
            266.889051.56
            475.6310045
            878.4416043.75
            1079.3818033.44
            下载: 导出CSV

            表  3  利用区间三分法求解最优核参数σ对应的故障诊断的准确率 (KFD)

            Table  3  The accuracy of fault diagnosis of optimal kernel parameter by using the interval three-part method (KFD)

            迭代次数对应区间三分点 1三分点 2三分点 3三分点 4
            ${X_1}$$D({X_1})$${X_2}$$D({X_2})$${X_3}$$D({X_3})$${X_3}$$D({X_4})$
            1[1, 100]150 %3479 %6751 %10045 %
            2[1, 67]150 %2380 %4573.8 %6751 %
            3[1, 45]150 %15.779.4 %30.381.25 %4573.8 %
            4[15.7, 45]15.779.4 %25.580 %35.278.8 %4573.8 %
            5[15.7, 35.2]15.779.4 %22.280.3 %28.780.4 %35.278.8 %
            6[22.2, 35.2]22.280.3 %26.580 %30.981.25 %35.278.8 %
            下载: 导出CSV

            表  4  KFD算法和MKFD算法中不同核参数的故障诊断结果

            Table  4  The fault diagnosis with different kernel parameters in KFD algorithm and MKFD algorithm

            The value of the
            parameter σ in KFD
            Train
            accuracy (%)
            Test
            accuracy (%)
            The value of the
            parameter σ in MKFD
            Train
            accuracy (%)
            Test
            accuracy (%)
            0.1100250.110025
            110050110050
            1099.879.4410076.9
            3099.881.3810099.69
            6070.544.71299.992.5
            9027.725.31699.980.6
            下载: 导出CSV

            表  5  选取不同核参数σ下故障诊断的准确率(按照区间三分法做纵向表)

            Table  5  The fault diagnosis accuracy based on different kernel parameters σ (Make the longitudinal table according to the interval three-part method)

            IonosphereBreast cancer
            The value of the parameter σTest accuracy (%)The value of the parameter σTest accuracy (%)
            178.9131.7
            3491.614995.1
            499222394.9
            5692.424895.4
            5992.829795.4
            6392.833495.4
            6792.434695.4
            689244594.6
            7890.866794
            10086.1100093.2
            下载: 导出CSV

            表  6  区间三分法迭代求解最优核参数σ (MKFD)

            Table  6  The iterative solution of the optimal kernel parameters σ using interval partition method

            迭代次数对应区间三分点 1三分点 2三分点 3三分点 4
            ${X_1}$$D({X_1})$${X_2}$$D({X_2})$${X_3}$$D({X_3})$${X_3}$$D({X_4})$
            1[1, 100]150.9 %3460.6 %6757.5 %10058.1 %
            2[1, 67]150.9 %2376.6 %4558.1 %6757.5 %
            3[1, 45]150 %15.796.3 %30.363.8 %4558.1 %
            4[1, 30.3]150 %10.899.69 %20.584.69 %30.363.8 %
            5[1, 20.5]150 %7.599.38 %1497.81 %20.584.69 %
            6[1, 14]150 %5.381.56 %9.799.69 %1497.81 %
            下载: 导出CSV

            表  7  交叉验证法选取不同核参数σ下故障诊断的准确率(FDGLPP)

            Table  7  The fault diagnosis accuracy based on different kernel parameters σ by cross validation method

            The value of the
            parameter σ
            Test
            accuracy (%)
            The value of the
            parameter σ
            Test
            accuracy (%)
            The value of the
            parameter σ
            Test
            accuracy (%)
            0.1250.568.13355.31
            152.19575.31679.38
            5028.442525.0999.69
            10041.255028.441225.0
            50039.067534.691555.94
            100038.759540.01825.0
            下载: 导出CSV

            表  8  四种模型的故障诊断结果与运行时间

            Table  8  Fault diagnosis results and running time of the four models

            ModelOptimal value of parameter σTest accuracy (%)Test time (s)
            KFD3081.253.90072
            CKFD897.814.14769
            FDGLPP1099.699.30612
            MKFD999.693.86806
            下载: 导出CSV
            七星彩规则
          • [1] 张妮, 车立志, 吴小进. 基于数据驱动的故障诊断技术研究现状及展望. 计算机科学, 2017, 44(S1): 47?52

            Zhang Ni, Che Li-Zhi, Wu Xiao-Jin. Present situation and prospect of data-driven based fault diagnosis technique. Computer Science, 2017, 44(S1): 47?52
            [2] 郭一帆, 唐家银. 基于机器学习算法的寿命预测与故障诊断技术的发展综述. 计算机测量与控制, 2019, 27(3): 13?19

            Guo Yi-Fan, Tang Jia-Yin. A review of the development of life prediction and fault diagnosis technology based on machine learning algorithm. Computer Measurement & Control, 2019, 27(3): 13?19
            [3] Zhang Y, Zhang Y, Zhang J, et al. Collaborative representation cascade for single-image super-resolution. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017: 1?16
            [4] Kock N, Hadaya P. Minimum sample size estimation in PLS‐SEM: The inverse square root and gamma‐exponential methods. Information Systems Journal, 2018, 28(1): 227?261 doi:  10.1111/isj.12131
            [5] Maisinger K, Hobson M P, Lasenby A N. A maximum entropy method for reconstructing interferometer maps of fluctuations in the cosmic microwave background radiation. Monthly Notices of the Royal Astronomical Society, 2018, 290(2): 313?326
            [6] Hwang J S, Noh J T, Lee S H, et al. Experimental verification of modal identification of a high-rise building using independent component analysis. International Journal of Concrete Structures and Materials, 2019, 13(1): 4 doi:  10.1186/s40069-018-0319-7
            [7] 胡志新. 基于深度学习的化工故障诊断方法研究. 杭州电子科技大学, 中国, 2018

            Hu Zhi-Xin. Research on Chemical Fault Diagnosis Methods Based on Deep Learning [Master thesis], Hangzhou Dianzi University, China 2018
            [8] Mika S, Ratsch G, Weston J, et al. Fisher discriminant analysis with kernel. In: Proceedings of the Neural Networks for Signal Processing IX, the 1999 IEEE Signal Processing Society Workshop. Madison, WI, USA: IEEE, 1999: 41?48
            [9] 张曦, 赵旭, 刘振亚, 等. 基于核Fisher子空间特征提取的汽轮发电机组过程监控与故障诊断. 中国电机工程学报, 2007, (20): 1?6 doi:  10.3321/j.issn:0258-8013.2007.20.001

            Zhang Xi, Zhao Xu, Liu Zhen-Ya, et al. Process monitoring and fault diagnosis of turbine generator unit based on feature extraction in kernel Fisher subspace. Proceedings of the CSEE, 2007, (20): 1?6 doi:  10.3321/j.issn:0258-8013.2007.20.001
            [10] 马立玲, 徐发富, 王军政. 一种基于改进核Fisher的故障诊断方法. 化工学报, 2017, 68(3): 1041?1048

            Ma Li-Ling, Xu Fa-Fu, Wang Jun-Zheng. A fault diagnosis method based on improved kernel Fisher. CIESC Journal, 2017, 68(3): 1041?1048
            [11] Chikr-Elmezouar Z, Almanjahie I M, Laksaci A, et al. FDA: strong consistency of the kNN local linear estimation of the functional conditional density and mode. Journal of Nonparametric Statistics, 2019, 31(1): 175?195 doi:  10.1080/10485252.2018.1538450
            [12] 李普煌, 李敏, 范新南, 等. 迭代分析相对密度的高光谱异常检测. 中国图象图形学报, 2018, 23(2): 219?228 doi:  10.11834/jig.170243

            Li Pu-Huang, Li Min, Fan Xin-Nan, et al. Hyperspectral anomaly detection algorithm based on iterative analysis with relative density. Journal of Image and Graphics, 2018, 23(2): 219?228 doi:  10.11834/jig.170243
            [13] 赵忠盖, 刘飞. 基于马氏距离统计监控指标的应用研究. 自动化学报, 2008, 34(4): 493?495

            Zhao Zhong-Gai, Liu Fei. Application research of statistical monitoring index based on Mahalanobis distance. Acta Automatica Sinica, 2008, 34(4): 493?495
            [14] 卫芬. 旋转机械多传感器信息融合智能故障诊断关键技术研究. 哈尔滨工业大学, 中国, 2018

            Wei Fen. Research on Key Technologies of Intelligent Fault Diagnosis Based on Multi-sensor Information Fusion for Rotating machinery [Ph. D. dissertation]. Harbin Institute of Technology, China, 2018
            [15] 杜伟, 房立清, 齐子元. 一种邻域自适应半监督局部Fisher判别分析算法. 计算机应用研究, 2019, 36(1): 105?108

            Du Wei, Fang Li-Qing, Qi Zi-Yuan. Neighborhood adaptive semi-supervised local Fisher discriminant analysis algorithm. Application Research of Computers, 2019, 36(1): 105?108
            [16] 杨武夷, 梁伟, 辛乐, 等. 子空间半监督Fisher判别分析. 自动化学报, 2009, 35(12): 1513?1519 doi:  10.1016/S1874-1029(08)60120-2

            Yang Wu-Yi, Liang Wei, Xin Le, et al. Subspace semi-supervised Fisher discriminant analysis. Acta Automatica Sinica, 2009, 35(12): 1513?1519 doi:  10.1016/S1874-1029(08)60120-2
            [17] 郑建炜, 王万良, 姚晓敏, 等. 张量局部Fisher判别分析的人脸识别. 自动化学报, 2012, 38(9): 1485?1495 doi:  10.3724/SP.J.1004.2012.01485

            Zheng Jian-Wei, Wang Wan-Liang, Yao Xiao-Min, et al. Face recognition using tensor local Fisher discriminant analysis. Acta Automatica Sinica, 2012, 38(9): 1485?1495 doi:  10.3724/SP.J.1004.2012.01485
            [18] 温廷新, 于凤俄. 基于KPCA-Fisher判别分析的煤炭自燃预测研究. 矿业安全与环保, 2018, 45(2): 49?53 doi:  10.3969/j.issn.1008-4495.2018.02.011

            Wen Ting-Xin, Yu Feng-E. Research on prediction of coal spontaneous combustion based on KPCA-Fisher discriminant analysis. Mining Safety & Environmental Protection, 2018, 45(2): 49?53 doi:  10.3969/j.issn.1008-4495.2018.02.011
            [19] Wen T, Jia Y, Huang D, et al. Feature extraction of electronic nose signals using QPSO-based multiple KFDA signal processing. Sensors, 2018, 18(2): 388 doi:  10.3390/s18020388
            [20] 刘廷瑞, 常林. 弯扭耦合风力机叶片的准稳态响应及LLTR控制. 振动与冲击, 2018, 37(13): 123?129

            Liu Ting-Rui, Chang Lin. Quasi-steady response and LLTR control of a wind turbine blade with bending-torsion coupled. Journal of Vibration and Shock, 2018, 37(13): 123?129
            [21] Shi H, Liu J, Wu Y, et al. Fault diagnosis of nonlinear and large-scale processes using novel modified kernel Fisher discriminant analysis approach. International Journal of Systems Science, 2016, 47(5): 1?15
            [22] 郭金玉, 韩建斌, 李元, 等. 基于局部Fisher判别分析的复杂化工过程故障诊断. 计算机应用研究, 2018, 35(4): 1122?1125 doi:  10.3969/j.issn.1001-3695.2018.04.035

            Guo Jin-Yu, Han Jian-Bin, Li Yuan, et al. Fault diagnosis of complex chemical process based on local Fisher discriminant analysis. Application Research of Computers, 2018, 35(4): 1122?1125 doi:  10.3969/j.issn.1001-3695.2018.04.035
            [23] 林信川, 游贵荣. 基于iBeacon的室内定位算法优化研究. 陕西理工大学学报(自然科学版), 2017, 33(3): 67?73

            Lin Xin-Chuan, You Gui-Rong. Study on optimization of indoor location algorithm based on iBeacon. Journal of Shanxi University of Technology (Natural Science Edition), 2017, 33(3): 67?73
            [24] Liu C, Sun Y. The research and application of learning program in adaptive learning system. Applied Mechanics & Materials, 2014, 347-350: 3109?3113
            [25] 孟亚辉. 基于最优特征集和马氏距离KNN分类的机械故障分类方法研究. 机械设计与制造, 2017, (7): 104?108

            Meng Ya-Hui. A method of mechanical fault classification based on optimal feature subset and K-nearest neighbor using mahalanobis distance. Machinery Design & Manufacture, 2017, (7): 104?108
            [26] 林升梁, 刘志. 基于RBF核函数的支持向量机参数选择. 浙江工业大学学报, 2007, 35(2): 163?167 doi:  10.3969/j.issn.1006-4303.2007.02.010

            Lin Sheng-Liang, Liu Zhi. Parameter selection in SVM with RBF kernel function. Journal of Zhejiang University of Technology, 2007, 35(2): 163?167 doi:  10.3969/j.issn.1006-4303.2007.02.010
            [27] 魏国, 刘剑, 孙金玮, 等. 基于LS-SVM的非线性多功能传感器信号重构方法研究. 自动化学报, 2008, 34(8): 869?875

            Wei Guo, Liu Jian, Sun Jin-Wei, et al. Study on nonlinear multifunctional sensor signal reconstruction method based on LS-SVM. Acta Automatica Sinica, 2008, 34(8): 869?875
            [28] 黄心汉, 杜克林, 王敏, 等. 基于阻抗控制的动态装配过程仿真研究. 自动化学报, 2000, 26(2): 169?175

            Huang Xin-Han, Du Ke-Lin, Wang Min, et al. A simulation investigation on dynamic assembly process based on impedance control. Acta Automatica Sinica, 2000, 26(2): 169?175
            [29] 张小云, 刘允才. 高斯核支撑向量机的性能分析. 计算机工程, 2003, 29(8): 22?25 doi:  10.3969/j.issn.1000-3428.2003.08.009

            Zhang Xiao-Yun, Liu Yun-Cai. Performance analysis of support vector machines with Gauss kernel. Computer Engineering, 2003, 29(8): 22?25 doi:  10.3969/j.issn.1000-3428.2003.08.009
            [30] Lawn S D, Kerkhoff A D, Burton R, et al. Diagnostic accuracy, incremental yield and prognostic value of determine TB-LAM for routine diagnostic testing for tuberculosis in HIV-infected patients requiring acute hospital admission in South Africa: A prospective cohort. Bmc Medicine, 2017, 15(1): 67 doi:  10.1186/s12916-017-0822-8
            [31] 彭泽栋, 冯毅萍, 杨胜蓝, 等. 基于多智能体的TE过程扩展仿真系统设计与实现. 高校化学工程学报, 2019, 33(5): 1195?1205 doi:  10.3969/j.issn.1003-9015.2019.05.022

            Peng Ze-Dong, Feng Yi-Ping, Yang Sheng-Lan, et al. Design and implementation of extended TE process simulation system based on multi-agent. Journal of Chemical Engineering of Chinese Universities, 2019, 33(5): 1195?1205 doi:  10.3969/j.issn.1003-9015.2019.05.022
            [32] Tang Q, Chai Y, Xu J, Fang X. Tang Q, Chai Y, Qu J, et al. Industrial process monitoring based on Fisher discriminant global-local preserving projection. Journal of Process Control, 2019, 81: 76?86 doi:  10.1016/j.jprocont.2019.05.010
          • [1] 张成, 高宪文, 李元. 基于$ \pmb k $近邻主元得分差分的故障检测策略[J]. 自动化学报, 2020, 46(10): 2229-2238. doi: 10.16383/j.aas.c180163
            [2] 彭开香, 马亮, 张凯. 复杂工业过程质量相关的故障检测与诊断技术综述[J]. 自动化学报, 2017, 43(3): 349-365. doi: 10.16383/j.aas.2017.c160427
            [3] 彭开香, 张凯, 李钢. 基于贡献率法的非线性工业过程在线故障诊断[J]. 自动化学报, 2014, 40(3): 423-430. doi: 10.3724/SP.J.1004.2014.00423
            [4] 樊继聪, 王友清, 秦泗钊. 联合指标独立成分分析在多变量过程故障诊断中的应用[J]. 自动化学报, 2013, 39(5): 494-501. doi: 10.3724/SP.J.1004.2013.00494
            [5] 文成林, 胡玉成. 基于信息增量矩阵的故障诊断方法[J]. 自动化学报, 2012, 38(5): 832-840. doi: 10.3724/SP.J.1004.2012.00832
            [6] 易辉, 宋晓峰, 姜斌, 王定成. 基于结点优化的决策导向无环图支持向量机及其在故障诊断中的应用[J]. 自动化学报, 2010, 36(3): 427-432. doi: 10.3724/SP.J.1004.2010.00427
            [7] 张颖伟, 周宏, 秦泗钊. 基于多块核主元分析的复杂过程的分散故障诊断[J]. 自动化学报, 2010, 36(4): 593-597. doi: 10.3724/SP.J.1004.2010.00593
            [8] 周东华, 胡艳艳. 动态系统的故障诊断技术[J]. 自动化学报, 2009, 35(6): 748-758. doi: 10.3724/SP.J.1004.2009.00748
            [9] 甄子洋, 王道波, 王志胜. 基于蚁群优化算法的精密伺服转台故障诊断方法[J]. 自动化学报, 2009, 35(6): 780-784. doi: 10.3724/SP.J.1004.2009.00780
            [10] 严爱军, 柴天佑, 岳恒. 竖炉焙烧过程的多变量智能优化控制[J]. 自动化学报, 2006, 32(4): 636-640.
            [11] 刘开第, 曹庆奎, 庞彦军. 基于未确知集合的故障诊断方法[J]. 自动化学报, 2004, 30(5): 747-756.
            [12] 吕琛, 王桂增, 邱庆刚. 基于声信号小波包分析的故障诊断[J]. 自动化学报, 2004, 30(4): 554-559.
            [13] 萧德云, 莫以为. 基于混合系统状态估计的故障诊断[J]. 自动化学报, 2004, 30(6): 980-985.
            [14] 陈玉东, 翁正新, 施颂椒. 基于LMI的非线性差分-代数系统的鲁棒故障诊断[J]. 自动化学报, 2004, 30(1): 57-63.
            [15] 何贤会, 高春华, 王慧. 基于混合Petri网的连续过程建模与在线优化[J]. 自动化学报, 2000, 26(增刊B): 31-35.
            [16] 冯冬青, 陈铁军, 姚志红. 热工过程在线监测和故障诊断专家系统[J]. 自动化学报, 2000, 26(增刊B): 116-119.
            [17] 马智明, 阳宪惠. 采用主元分析的过程故障诊断方法[J]. 自动化学报, 2000, 26(增刊B): 125-129.
            [18] 李界家, 柴天佑. 辨识及故障检测技术在铝电解生产过程中的应用[J]. 自动化学报, 1998, 24(2): 275-277.
            [19] 陈金水, 孙优贤. 系统存在参数摄动时基于二次规划的一种故障诊断算法[J]. 自动化学报, 1997, 23(1): 77-80.
            [20] 谭民, 疏松桂. 神经元网络在故障诊断中的双向联想记忆法[J]. 自动化学报, 1991, 17(1): 95-99.
          • 加载中
          图(12) / 表(8)
          计量
          • 文章访问数:  49
          • HTML全文浏览量:  24
          • PDF下载量:  30
          • 被引次数: 0
          出版历程
          • 收稿日期:  2019-09-09
          • 录用日期:  2020-01-09
          • 刊出日期:  2020-11-20

          基于马氏距离的改进核Fisher化工故障诊断研究

          doi: 10.16383/j.aas.c190635
            基金项目:  西北工业大学硕士研究生创新创意种子基金(ZZ2019125), 陕西省自然科学基础研究计划(2019JQ-564)资助
            作者简介:

            西北工业大学硕士研究生. 主要研究方向为机器学习与故障诊断.E-mail: 13571807486@163.com

            西北工业大学力学与土木建筑学院教授. 主要研究方向为信息融合与故障智能诊断系统. 本文通信作者.E-mail: yjyan_2895@nwpu.edu.cn

            西北工业大学力学与土木建筑学院博士研究生. 主要研究方向为故障诊断与机器学习.E-mail: christli@mail.nwpu.edu.cn

          摘要: 针对化工故障诊断数据存在非线性分布、 数据类别复杂、数据量大且故障特征不易区分等问题, 本文提出一种基于马氏距离的改进核Fisher故障诊断方法(Mahalanobis distance-based kernel Fisher discrimination, MKFD). 首先, 针对数据非线性分布的特点, 本文将核Fisher判别分析算法改进, 改进后的算法可以有效解决原始样本在投影后出现的因类间距离差异过大、类内距离不够紧凑造成的样本混叠现象. 除此之外, 利用Euclidean距离对类间距做加权处理时, 用组平均距离取代质心距离, 提升了运算效率, 降低了时间复杂度; 其次, 根据高斯径向基核函数(Radial basis function, RBF)在MKFD中所呈现出的诊断精度的规律, 本文采用一种新的核参数选择方法: 区间三分法, 用以取代在实际应用中依靠经验的交叉验证法; 最后, 本文采用马氏距离对故障进行分类, 基于田纳西伊—斯特曼过程(Tennessee-Eastman, TE)数据将本方法与其他改进核Fisher算法进行仿真验证对比. 结果表明新提出MKFD算法不仅可以提高故障诊断的运算效率, 也能有效提高诊断的精度.

          English Abstract

          吕鹏飞, 闫云聚, 荔越. 基于马氏距离的改进核Fisher化工故障诊断研究. 自动化学报, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          引用本文: 吕鹏飞, 闫云聚, 荔越. 基于马氏距离的改进核Fisher化工故障诊断研究. 自动化学报, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          Lv Peng-Fei, Yan Yun-Ju, Li Yue. Research on fault diagnosis of improved kernel Fisher based on Mahalanobis distance in the field of chemical industry. Acta Automatica Sinica, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          Citation: Lv Peng-Fei, Yan Yun-Ju, Li Yue. Research on fault diagnosis of improved kernel Fisher based on Mahalanobis distance in the field of chemical industry. Acta Automatica Sinica, 2020, 46(11): 2379?2391. doi: 10.16383/j.aas.c190635
          • 随着科技的不断进步,现代化工业正发生着翻天覆地的变化, 工厂操作的复杂度急剧增加. 与此同时, 操作过程中测量的变量更加具有复杂性、非线性和巨量性, 而这些测量变量的新性质导致了监测平台操作挑战性不断升级[1]. 在化工过程中, 监测系统产生了大量的实测数据, 对这些数据的有效利用来实现实时监控和故障诊断, 为确保生产设备安全、降低维护成本、提高利润率提供了可靠的保证[2]. 因此, 高效的故障诊断技术正在工业生产的发展中扮演着愈来愈重要的角色.

            在化工生产过程中, 需要建立监测平台对整个操作过程进行监控, 并利用监测平台得到的数据进行故障诊断, 从而确保化工产业生产设备安全, 降低维护成本, 提高利润率. 化工过程的故障诊断问题可以看作是对故障数据的分类问题, 其中包括故障特征提取技术、模式识别技术以及故障分类技术. 常见的特征提取方法有: 主元分析法[3] (Principal component analysis, PCA)、偏最小二乘法[4] (Partial least squares, PLS)、核熵分析法[5] (Kernel entropy component analysis, KECA)、独立主元法[6] (Independent component analysis, ICA)等. 然而, 在面向化工的实际应用中, 单纯的多元统计分析并没有取得良好的分类效果. 这是由于化工数据具有很强的非线性, 数据类别复杂、数据量大而且故障特征不易区分的特点[7]. 基于以上问题, Mika等[8]将核函数引入Fisher判别分析算法, 得到了一种新的核Fisher判别法. 该方法在面对复杂的化工过程状态数据时, 能有效地解决因非线性造成的分类困难问题, 因此得到了广泛的应用. 随后, 国内外研究者对该算法进行了深入的研究并提出了许多改进措施. 张曦等[9]提出了基于核Fisher子空间特征提取的汽轮发电机组过程监控和故障诊断新方法, 该方法将原始样本数据从低维非线性空间映射到高维线性空间, 再利用线性Fisher判别分析算法提取原始样本数据的最优特征矢量, 实现了对汽轮发动机组的过程监控. 马立玲等[10]采用Euclidean距离对Fisher判别准则中的类间距做加权, 使得样本数据具有较好的投影效果, 然后通过改进K近邻算法[11]和马氏距离[12-13]算法对数据进行分类, 仿真验证结果表明改进后的核Fisher方法有效改善了因类间距较小而造成的投影数据混叠现象.

            然而, 已有的改进核Fisher判别分析方法中, 仍存在以下问题: 1)在投影过程中, 类间距差异较大的类别之间出现投影混叠现象; 2)因为类内比较分散, 数据投影后会出现因类内距不够紧凑而出现的重叠现象; 3)在引入高斯径向基核函数(Radial basis function, RBF)时, 选取非最优的核参数会直接导致故障诊断性能的降低[14]. 为解决以上问题, 本文提出了一种基于马氏距离的改进核Fisher故障诊断方法(MKFD), 该方法采用了区间三分迭代法选取核参数, 利用组平均距离取代质心距离降低运算复杂度并通过加权改进类内的距离, 有效改善了投影效果. 最后, 在田纳西伊—斯特曼过程平台上对该方法进行仿真试验验证, 并与传统的核Fisher诊断方法(Kernel fisher discrimination, KFD)、基于质心距离对类间距进行加权处理的核Fisher判别分析(Centroid kernel fisher discriminate, CKFD)和基于Fisher判别分析的全局—局部保持投影算法(Fisher discriminant global-local preserving projection, FDGLPP)进行了对比. 结果表明, 本文提出的方法不仅提高了运算速度, 同时也有效提高了故障诊断的精度, 具有很高的工程应用价值.

            • Fisher判别分析是模式识别中一种非常重要的基于数据降维和分类的方法, 是一种有监督的学习算法[15-17]. 传统的KFD算法在故障诊断领域具有广泛的应用, 但是当面对高维非线性数据时, 其故障诊断的性能大大降低[18]. 核函数的引入能够有效地解决这个问题,使其故障诊断的性能大大提升[19]. 核Fisher算法的基本理论可表述为:

              设在P维的原始空间中, 样本点有C类, 样本总数为N, 记为${{X}} \!=\! \{ {{{X_1}}},{{{X_2}}}, \!{{\cdots}} \!,{{{X_C}}}\}$, 第$i\;(i = 1,2,\cdots,$$C)\;$个类${\omega _i} \;$包含${N_i} \;$个样本记作${{{X_i}}} = \{ {{x}}_i^1,{{x}}_i^2, \cdots ,$${{x}}_i^{{{{N}}_i}}\},$其中, 每一个向量表示的都是列向量. 基于核Fisher判别函数先对原始样本数据进行非线性高维映射${{\phi}} :{{x}} \in {{\rm{R}}^P} \to {{\phi}} ({{x}}) \in {{\rm{H}}^P} ,\;$ 在高维特征空间$H$中, 第$i$类样本映射后的均值记为${{{m}}_i}, \;$所有样本点映射后的均值记为${{m}} . \;$可得:

              $${{{m}}_i} = \frac{1}{{{N_i}}}\sum\limits_{j = 1}^{{N_i}} {{{\phi}} ({{x}}_i^j)} $$ (1)
              $${{m}} = \frac{1}{N}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^{{N_i}} {{{\phi}} ({{x}}_i^j)} } $$ (2)

              在高维特征空间$H$中, 经过非线性变换后的类内离散度${{S}}_W^\phi$和类间的离散度${{S}}_B^\phi$分别为:

              $$ \begin{split} &{{S}}_W^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^{{N_i}} {({{\phi}} ({{x}}_i^j) - {{{m}}_i})} } {({{\phi}} ({{x}}_i^j) - {{{m}}_i})^{{\rm{T}}}} \\ & {{S}}_B^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {{N_i}({{{m}}_i} - {{m}})} {({{{m}}_i} - {{m}})^{{\rm{T}}}} \\[-15pt] \end{split} $$ (3)

              在特征空间$H$中, Fisher判别准则为:

              $${{J}}({{{w}_\phi} }) = \max \dfrac{{{{{{w}}}}_{{\phi}} ^{\rm{{T}}}{{S}}_B^{{\phi}} {{{w}}_{{\phi}} }}}{{{{{{w}}}}_{{\phi}} ^{{\rm{T}}}{{S}}_W^{{\phi}} {{{w}}_{{\phi}} }}}$$ (4)

              式中: ${{{w}}_{{\phi}} }$为任一非零列向量. Fisher判别准则就是要通过优化式(4), 找到最优特征矢量. 由核函数的特点可知, 非线性映射会导致式中的${{{w}}_\phi }$无法被直接计算. 此时最优判别矢量${{{w}}_{{\phi}} }$可由${{\phi}} ({{{x}}_1{{}),\phi}} ({{{x}}_2}), \cdots ,$${{\phi}} ({{{x}}_N})$进行线性表示, 即:

              $${{{w}}_\phi } = \sum\limits_{k = 1}^N {{\alpha _k}} {{\phi}} ({{{x}}_k}) = {{\phi \alpha}} $$ (5)

              式中, ${{\alpha}} = {\left( {{\alpha _1},{\alpha _2}, \cdots ,{\alpha _N}} \right)^{{\rm{T}}}}$为一个列向量.

              $$\begin{split} {{{{w}^{{\rm{T}}}}_\phi }}{{\phi}} ({{{x}}_i}) =& {{{\alpha}} ^{{\rm{T}}}}{{{\phi}} ^{{\rm{T}}}}{{\phi}} ({{{x}}_i})= \\ & {{{\alpha}} ^{{\rm{T}}}}{({{\phi}} ({{{x}}_1}),{{\phi}} ({{{x}}_2}), \cdots ,{{\phi}} ({{{x}}_N}))^{{\rm{T}}}}{{\phi}} ({{{x}}_i}) = \\ &{{{\alpha}} ^{{\rm{T}}}}{(k({{{x}}_1},{{{x}}_i}), \cdots ,k({{{x}}_N},{{{x}}_i}))^{{\rm{T}}}} =\\ &{{{\alpha}} ^{{\rm{T}}}}{{\varphi}} ({{{}}{{x}}_i}) \\[-10pt] \end{split} $$ (6)

              式中, ${{\varphi}} ({{{x}}_i}) = {(k({{{x}}_1},{{{x}}_i}), \cdots ,k({{{x}}_N},{{{x}}_i}))^{{\rm{T}}}}.$

              在高维特征空间$H$中, 训练集样本类均值向量与总体样本均值向量分别投影到${{{w}}_{{\phi}} }$上有:

              $$\begin{split} &{{{{w}^{{\rm{T}}}}_\phi }}{{\phi}} ({{{x}}_i}) = {{{\alpha}} ^{{\rm{T}}}}{{{\phi}} ^{\rm{T}}}\frac{1}{{{N_i}}}\sum\limits_{j = 1}^{{N_i}} {{{\phi }}({{x}}_i^j)} = {{{\alpha}} ^{{\rm{T}}}}{{{\mu}} _i} \\ & {{{{w}^{{\rm{T}}}}_\phi }}{{\phi}} ({{{x}}_0}) = {{{\alpha}} ^{{\rm{T}}}}{{{\phi}} ^{{\rm{T}}}}\frac{1}{N}\sum\limits_{g = 1}^N {{{\phi}} ({{{x}}_g})} = {{{\alpha}} ^{{\rm{T}}}}{{{\mu}} _0} \\[-15pt] \end{split} $$ (7)

              式中:

              $$ \begin{split} {{{\mu}} _i} =\,& \frac{1}{{{N_i}}}\left(\sum\limits_{j = 1}^{{N_i}} {{{\phi}}^{{\rm{T}}} {{({{{x}}_1})}}{{\phi}} ({{x}}_i^j),} \cdots ,\sum\limits_{j = 1}^{{N_i}} {{{\phi}}^{{\rm{T}}} {{({{{x}}_N})}}{{\phi}} ({{x}}_i^j)} \right) =\\ &\frac{1}{{{N_i}}}\left(\sum\limits_{j = 1}^{{N_i}} {{{k}}({{{x}}_1},{{x}}_i^j)} , \cdots ,\sum\limits_{j = 1}^{{N_i}} {k({{{x}}_N},{{x}}_i^j)} \right) \\[-20pt] \end{split} $$ (8)
              $$\begin{split} {{{\mu}} _0} =\,& \frac{1}{N}\left(\sum\limits_{g = 1}^N {{{\phi}} ^{{\rm{T}}}{{({{{x}}_1})}}{{\phi}} ({{x}}_g),} \cdots ,\sum\limits_{g = 1}^N {{{\phi}}^{{\rm{T}}} {{({{{x}}_N})}}{{\phi}} ({{x}}_g)} \right) = \\ & \frac{1}{N}\left(\sum\limits_{g = 1}^N {k({{{x}}_1},{{x}}_g)} , \cdots ,\sum\limits_{g = 1}^{{N}} {k({{{x}}_N},{{x}}_g)} \right) \\[-20pt] \end{split} $$ (9)

              在高维特征空间$H$中Fisher准则变为:

              $$J({{ w}_\phi }) = \max \dfrac{{{{w}}_{{\phi}} ^{{\rm{T}}}{{S}}_B^\phi {{{w}}_{{\phi}} }}}{{{{w}}_{{\phi}} ^{{\rm{T}}}{{S}}_W^\phi {{{w}}_{{\phi}} }}} = \max \dfrac{{{{{\alpha}} ^{{\rm{T}}}}{{K}}_B^\phi{{ \alpha}} }}{{{{{\alpha}} ^{{\rm{T}}}}{{K}}_W^\phi {{\alpha}} }}$$ (10)

              式中: ${{K}}_W^\phi$${{K}}_B^\phi$的表达式为:

              $$\begin{split} &{{K}}_W^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^{{N_i}} {({{\varphi}} ({{{x}}_i^j}) - {{{\mu}} _i})} } {({{\varphi}} ({{{x}}_i^j}) - {{{\mu}} _i})^{{\rm{T}}}} \\ &{{K}}_B^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {{N_i}({{{\mu}} _i} - {{{\mu}} _0})} {({{{\mu}} _i} - {{{\mu}} _0})^{{\rm{T}}}} \end{split} $$

              所以求解核Fisher最佳判别向量${{{w}}_\phi }$的问题就转化为求解式(10)的Fisher判别函数达到最大值时最佳向量${{\alpha}}$的问题. 求解${{\alpha}}$问题等价于求解广义特征方程:

              $${{K}}_B^\phi {{\alpha}} = \lambda {{K}}_W^\phi {{\alpha}} $$ (11)

              即Fisher判别准则转化为对${\left( {{{K}}_W^\phi } \right)^{ - 1}}{{K}}_B^\phi$的求解特征值和其所对应的特征向量的问题. 为解决非奇异问题, 将式中${{K}}_W^\phi$替换为${{K}}_W^\phi + \mu {{I}} ,\;$ 其中$\mu $为非常小的数值, 通常设为${10^{ - 7}},\;$${{I}}$为单位矩阵[20].

            • 核Fisher判别法在故障诊断领域应用广泛, 但是在处理大量非线性数据时, 仍存在一些问题. 第一, 不同类之间的类间距存在较大差异, 会存在数据混叠现象; 第二, 类内距离较分散, 数据投影后不紧凑, 会出现类别重叠现象; 第三, MKFD中RBF核参数的快速选取问题. 针对这些问题, 本文提出了MKFD算法.

            • 在许多情况下, 数据类别类间距存在很大差异性, 传统的类间距离散度的矩阵为:

              $${{S}}_B^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {{N_i}({{{m}}_i} -{{ m}})} {({{{m}}_i} - {{m}})^{{\rm{T}}}}$$ (12)

              类间距差异的权重仅依据不同数据类别样本数在总体样本数中所占比进行计算, 但在实际应用中,会出现部分数据类别间距较小,另一部分数据类别间距较大的情况,类间距较小的类信息被间距较大的类信息覆盖的情况, 从而降低故障诊断的性能[21]. 为解决上述问题, 可在原先核Fisher判别中, 保证类内离散度不变, 采用Euclidean距离的函数对类间距进行加权, 重新定义映射后的类间离散度[22]. 重新定义的类间离散度如下:

              $$ {{S}}_B^\phi = \dfrac{1}{{{N^2}}}\sum\limits_{i = 1}^{C - 1} {\sum\limits_{j = i + 1}^C {{N_i}} {N_j}W({d_{ij}})({{{m}}_i} - {{m}})} {({{{m}}_i} - {{m}})^{{\rm{T}}}} $$ (13)

              式中: ${d_{ij}}$表示类$i$和类$j$的类间距离, ${{{m}}_i}$${{m}}$分别代表类$i$和类$j$的平均值, 权重函数${{W}}({d_{ij}})$为关于${d_{ij}}$的一个函数. 式中:

              $$\begin{split} &{k_{i1,i2}} = \left\langle {{{\phi}} ({{x}}_i^{i1}),{{\phi}} ({{x}}_i^{i2})} \right\rangle \\ &{k_{j1,j2}} = \left\langle {{{\phi}} ({{x}}_j^{j1}),{{\phi}} ({{x}}_j^{j2})} \right\rangle \\ & {k_{i1,j1}} = \left\langle {{{\phi}} ({{x}}_i^{i1}),{{\phi}} ({{x}}_j^{j1})} \right\rangle \\ \end{split} $$

              此时类间距离${d_{ij}}$选取的是质心距离[23]. 然而质心距离并不能充分利用所有样本的信息, 所以该方法并不具有很好的代表性[24]. 如果把核函数的计算个数作为衡量计算复杂度的标准, 则质心距离的计算复杂度为${{\rm{O}}}(N_i^2 + N_j^2 + {N_i}{N_j})$. 本文采取组平均距离作为类间距离${d_{ij}}$:

              $$\begin{split} {d_{ij}} =\,& \left\| {{{{m}}_i} - {{{m}}_j}} \right\| = \\ & \sqrt {\frac{{\displaystyle\sum\limits_{{x_i}\;\in\; {C_i},{x_j} \;\in\; {C_j}} {({{\phi}} ({{{x}}_i}) \!-\! {{\phi}} ({{{x}}_j})){{({{\phi}} ({{{x}}_i}) \!-\! {{\phi }}({{{x}}_j}))}^{{\rm{T}}}}} }}{{{N_i}{N_j}}}} = \\ & \sqrt {\frac{{\displaystyle\sum\limits_{{x_i} \in {C_i}} {{k_{ii}} \!+\! \displaystyle\sum\limits_{{x_j} \in {C_j}} {{k_{jj}}} \!-\! 2\displaystyle\sum\limits_{xi \in {C_i},{x_j} \in {C_j}} {{k_{ij}}} } }}{{{N_i}{N_j}}}} \\[-20pt] \end{split} $$ (14)

              其时间复杂度为$\rm{O}({N_i} + {N_j} + {N_i}{N_j})$, 对比发现,采用组平均距离作为类间距离可以在保证精度相差不大的情况下大大提高运算效率. 除此之外, 定义

              $$ \begin{split} a(i) =\,& \frac{{{d^2}}}{{1 + \displaystyle\sum\limits_{j = 1}^{{N_i}} {{d^*_{ij}}} }} \\ {d^*}_{ij} = \,&\sqrt {({{\phi}} ({{{x}}_{i,j}}) - {{{m}}_i}){{({{\phi}} ({{{x}}_{i,j}}) - {{{m}}_i})}^{{\rm{T}}}}} = \\ &\sqrt {({{\phi}} ({{{x}}_{i,j}}) -{{ \phi}} ( {{\overline{{{x}}}_i}} )){{({{\phi}} ({{{x}}_{i,j}}) -{{ \phi}} ( {{\overline{{{x}}}_i}} ))}^{{\rm{T}}}}} \\ \end{split} $$ (15)

              重新定义类内离散度矩阵

              $${{S}}_W^\phi = \frac{1}{N}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^{{N_i}} {a(i)({{\phi}} ({{{x}}_i^j}) - {{{m}}_i})} } {{{(\phi}} ({{{x}}_i^j}) - {{{m}}_i})^{{\rm{T}}}}$$ (16)

              式中, ${{K}}_W^\phi$${{K}}_B^\phi$的表达式变为:

              $$\left\{ {\begin{split} & {{{K}}_W^\phi = \frac{{\rm{1}}}{N}\displaystyle\sum\limits_{i = 1}^C {\displaystyle\sum\limits_{j = 1}^{{N_i}} {a(i)({{\varphi}} ({{{x}}_i}) - {{{\mu}} _i})} } {{({{\varphi}} ({{{x}}_i}) - {{{\mu}} _i})}^{{\rm{T}}}}} \\ &{{{\varphi}} ({{{x}}_i}) = {{(k({{{x}}_1},{{{x}}_i}), \cdots ,k({{{x}}_N},{{{x}}_i}))}^{{\rm{T}}}}} \\[-12pt] \end{split}} \right.$$ (17)
              $$\left\{ {\begin{split} &{{{K}}_B^\phi \!=\! \frac{1}{{{N^2}}}\!\sum\limits_{i = 1}^{C - 1} \!{\sum\limits_{j = i + 1}^C {{N_i}} {N_j}W({d_{ij}})({{{\mu}} _i} \!-\! {{{\mu}} _j})} {{({{{\mu}} _i} \!-\! {{{\mu}} _j})}^{{\rm{T}}}}} \\ &{{{{\mu}} _i} \!=\! \frac{1}{{{N_i}}}{{\left(\sum\limits_{j = 1}^{{N_i}} {k({{{x}}_1},{{x}}_k^i)} , \cdots ,\sum\limits_{j = 1}^{{N_i}} {k({{{x}}_N},{{x}}_k^i)} \right)}^{{\rm{T}}}}} \\[-10pt] \end{split}} \right.$$ (18)

              权重函数的表达式为${{W}}({d_{ij}}) = f({d_{ij}}),$ 定义$f(x) = \dfrac{1}{{{x^{{d}}}}}\;(d \in \rm{N})$, 即表示权重与类间距离成反比; 对于参数$d,\;$ 通常选取3 ~ 10[25]. 求解${{\alpha}}$问题等价于求解广义特征方程:

              $${\left( {{{K}}_W^\phi } \right)^{ - 1}}{{K}}_B^\phi {{\alpha}} = \lambda {{\alpha}} $$ (19)

              此时核Fisher判别准则转化为求解${\left( {{{K}}_W^\phi } \right)^{ - 1}}\!\!{{K}}_B^\phi$的特征值和特征向量的问题.

            • 在改进的核Fisher判别分析方法中, 核函数及核参数的选取至关重要. 经文献[26]验证, RBF核函数具有良好的分类能力. 在本文中, 选择RBF核函数:

              $${{k}}({{x}},{{{x}}_i}) = \exp ( - {\frac{{\left\| {{{x}} - {{{x}}_i}} \right\|}}{{2{\sigma ^2}}}^2})$$ (20)

              式中, 核参数$\sigma $的取值对KFD性能的优劣起着至关重要的作用. 目前常用的核参数选取方法有: 交叉验证法[27]、经验选择法、梯度下降法[28]和Bayesian法等.

              张小云等[29]从理论上证明了在支持向量机(SVM)中采用RBF核函数的性质, 当$\sigma \to 0$时, 不管训练样本个数是多少, 如何标类, 高斯核SVM都能把它们正确的分开, 但对测试集样本的分类准确率差, 容易出现“过拟合”现象. 当$\sigma \to \infty $时, 高斯核SVM对所有样本从理论上一视同仁, 认为没有学习推广能力. 基于以上结论, 本文对MKFD中RBF的性质同样进行两种理论假设并进行证明.

              假设1. 在MKFD中, 当$\sigma \to 0$时, 所有的训练样本都能被正确分类. 但此时的MKFD没有学习推广能力.

              证明. 在MKFD中, RBF核函数为一个$N \times N$$\rm{Gram}$矩阵

              $$ {{k}} = \left( {\begin{array}{*{20}{c}} {k({{{x}}_1},{{{x}}_1})}&{k({{{x}}_1},{{{x}}_2})}& \cdots &{k({{{x}}_1},{{{x}}_N})} \\ {k({{{x}}_2},{{{x}}_1})}&{k({{{x}}_2},{{{x}}_2})}& \cdots &{k({{{x}}_2},{{{x}}_N})} \\ \vdots & \vdots & \cdots & \vdots \\ {k({{{x}}_N},{{{x}}_1})}&{k({{{x}}_N},{{{x}}_1})}& \cdots &{k({{{x}}_N},{{{x}}_1})} \end{array}} \right) $$

              $\sigma \to 0$时, RBF核函数为:

              $$ {{k}}({{{x}}_i},{{{x}}_j}) = \exp \left( - \frac{{{{\left\| {{{{x}}_i} - {{{x}}_j}} \right\|}^2}}}{{2{\sigma ^2}}}\right) \to \left\{ {\begin{array}{*{20}{c}} {1,{{{x}}_i} = {{{x}}_j}} \\ {0,{{{x}}_i} \ne {{{x}}_j}} \end{array}} \right. $$

              此时, 矩阵${{k}}$变成单位矩阵, 在做特征提取时, 将原问题转化了为求解矩阵(19)所对应的特征值和特征向量. 本文依据TE过程数据做了大量的数据实验, 从结果来看, 当$\sigma \to 0$时, 矩阵最大特征值所对应的特征向量中各元素基本相等, 则对于N个训练样本, 判别函数作用后所得到的函数值为:

              $$T_{csj,i}^* = \sum\limits_{i = 1}^N {{\alpha _0}k({{{x}}_i},{{{x}}_j})} = {\alpha _0}$$

              也就是说, 当$\sigma $取一个很小的数时, MKFD可以将所有的训练集样本正确分类, 但是测试集所映射的函数值几乎相等, 使得测试样本的分类准确率很低, 此时RBF核函数无法分类, MKFD没有学习推广的能力. □

              假设2. 若在MKFD中$\sigma \to \infty $, 此时RBF核函数的分类能力为0, 即它将所有的样本点都归为同一类.

              证明. 在MKFD中, 当$\sigma \to \infty$时, $\exp \left( \dfrac{{{{\left\| {{{{x}}_{csj}} - {{{x}}_i}} \right\|}^2}}}{{2{\sigma ^2}}}\right)\to1,\forall {{{x}}_{csj}},{{{x}}_i},$此时对于$q$个测试样本${{{x}}_{csj}},$得到的高斯核MKFD的判别函数值为:

              $$ \begin{split} T_{csj}^* =\,& \sum\limits_{i = 1}^q {\alpha _i^*k({{{x}}_{csj}},{{{x}}_i})} =\\ & \sum\limits_{i = 1}^q {\alpha _i^*\exp \left( - \frac{{{{\left\| {{{{x}}_{csj}} - {{{x}}_i}} \right\|}^2}}}{{2{\sigma ^2}}}\right)} = \sum\limits_{i = 1}^q {\alpha _i^*} \end{split} $$

              从上式的形式来看, 高斯核MKFD所得的判别函数为常函数: $T_{csj}^* = \displaystyle\sum\nolimits_{i = 1}^q {\alpha _i^*}$, 将所有类型的的样本点都归结为同一类. □

              由以上证明说明MKFD的分类能力经历由低到高再到低的过程, MKFD的分类准确率函数$D(\sigma )$相当于一个凸函数, 即我们可以近似认为分类准确率函数$D(\sigma )$是关于$\sigma $的先增后减的凸函数, 变化曲线近似于图1. 当$D(\sigma )$为一个连续凸函数时, 可以利用区间三分法迭代, 求取函数的极值问题.

              图  1  分类准确率变化图

              Figure 1.  Variation of classification accuracy

              综上, MKFD的分类能力会经历由低变高再变低的过程. 基于这种算法分类能力的规律, 受文献[30]启发本文给出区间三分法的基本步骤为:

              1)输入样本数据, 设置分类准确率条件, 选取核参数$\sigma $的范围[min, max] ;

              2)对区间进行迭代, 首先对区间三等分, 并将这四个等分点记为${X_1},{X_2},{X_3},{X_4}$, 分别计算四个$\sigma $取值所对应的分类准确率;

              3)如果四个$\sigma $取值所对应的分类准确率中有一个满足预设的分类准确率条件或者分类准确率不再改变, 终止迭代, 否则用(4)进行判断;

              4)记四个点中每两点间差商函数$A,B,C,$$A = $$ D'({\xi _1}),B = D'({\xi _2}),C = D'({\xi _3}),$其中${\xi _1} < {\xi _2} < {\xi _3}.$分析A, B, C的符号, 如图2有以下四种;

              图  2  A, B, C的符号

              Figure 2.  Symbols of A, B and C

              5) a)$A,B,C > 0,$图2(a)所示, 极值点必定在区间$[{X_2},{X_4}]$之间, 返回步骤1). b)$A,B > 0,C < 0,$图2(b)所示, 由零点存在性定理可知极值点必定在区间$[{X_2},{X_4}]$之间, 再返回步骤1). c)$A > 0, $$B,C < 0,$图2(c)所示, 由零点存在性定理可知极值点必定在区间$[{X_1},{X_3}]$内, 再返回步骤1), d)$A,B,C < 0,$图2(d)所示, 极值点必定在区间$[{X_1},{X_3}]$之间, 返回步骤(1);

              6)按步骤进行, 直到满足条件, 终止迭代, 得到最优$\sigma .$

            • 1)将样本数据分为训练集和测试集. 对数据进行归一化处理, 预处理后的训练集和测试集用${{{X}}_{xlj}}$${{{X}}_{csj}}$表示;

              2)采用区间迭代法确定RBF核参数, 求出训练集和测试集所对应的核函数集${{{\varepsilon}} _{xlj}}$${{{\varepsilon}} _{csj}};$

              3)基于MKFD算法, 求得训练集数据核类内离散度矩阵${{K}}_W^\phi$及核类间离散度矩阵${{K}}_B^\phi;$

              4)求解广义特征方程${{K}}_B^\phi {{\alpha}} = \lambda {{K}}_W^\phi {{\alpha}},$对得到方程对应的特征值和特征向量${{\alpha}} _{opt}^*;$

              5)将${{{\varepsilon}} _{xlj}}$${{{\varepsilon}} _{csj}}$两类核数据集向所求得的最优判别向量${{\alpha}} _{opt}^*$方向投影, 得到两类数据集最优的核Fisher特征向量${{{{V}}}}_{xlj}^*$${{V}}_{csj}^*;$

              6)计算最优的核Fisher特征向量之间的马氏距离$D = \left\| {{{V}}_{xlj}^* - {{V}}_{csj}^*} \right\|;$

              7)验证故障类别.

            • TE过程[31]是一个基于真实化工生产过程的模型. 它的数据在许多领域被广泛研究和应用, 比如优化控制、过程监控和故障诊断等. 为验证本文所提方法的有效性, 采用TE过程故障数据集进行仿真实验. TE过程故障类型如表1所示. TE过程是一个复杂的非线性大样本尺度系统, 全部过程数据均含有高斯噪声. 本文中,每种故障类型分别选取480组和960组数据作为训练集和测试集,每组数据有52个特征参数. 本文选取的故障类型为: 故障3、4、5和7, 这些故障具有较高的非线性特征.

              表 1  故障类型描述

              Table 1.  Description of the selected fault sample sets

              Fault NumberFault descriptionFault type
              3物料 D 的温度的异变阶跃
              4反应器冷却水入口温度的异变阶跃
              5泠凝器冷却水入口温度的异变阶跃
              7物料 C 压力下降阶跃
            • 选取故障3、4、5和7作为故障数据类型, 设置训练集共有样本600个, 每类故障样本有150个; 测试集共有样本320个, 每类故障样本有80个. 对上节选取的实验数据进行交叉验证处理, 首先采用KFD算法可得故障诊断准确率随核参数$\sigma $的变化规律如表2所示. 对表2中的数据绘制折线图, 如图3所示. 从图中可以清晰地看出故障诊断的准确率随着核函数参数不断增大的变化规律: 首先随着参数的增加故障诊断的准确率迅速增加; 当参数达到4后, 分类准确率增长趋势变缓; 当参数超过30以后, 分类准确率随参数的增加而下降. 此时在核参数的选择上采用的是人工经验选择的方法, 效率较低并且有可能会遗漏最优解. 因此, 可以选择区间迭代法的方法取代人工经验选择法来求解最优核参数.

              表 2  选取不同核参数σ下故障诊断的准确率 (KFD)

              Table 2.  The fault diagnosis accuracy based on different kernel parameter σ(KFD)

              The value of the parameter σTest accuracy (%)The value of the parameter σTest accuracy (%)
              0.1253081.25
              0.230.314080.94
              0.8507053.13
              266.889051.56
              475.6310045
              878.4416043.75
              1079.3818033.44

              图  3  故障诊断准确率与核参数取值折线图

              Figure 3.  Line diagram of the fault diagnosis accuracy and kernel parameter

              采用KFD算法对数据进行处理, 并利用区间三分法迭代求解最优核参数对应的故障诊断的准确率如表3所示. 由表3可知, 当区间迭代六次后, $\sigma = 30.{\rm{9}} ,\;$ 分类准确率为81.25 %, 且相比第三次迭代中的$\sigma = 30.3,\;$ 分类准确率不再改变, 因此, 可以取$\sigma = 30.{\rm{9}}$$\sigma = 30.3$作为最优参数. 通过对比表2可得, 利用区间三分法求解出的最优核参数对应的分类准确率和交叉验证法得到的$\sigma = {\rm{30}}$所对应的分类准确率相同, 但是三分法大大提高了运算效率, 并且避免了遗漏最优解的可能.

              表 3  利用区间三分法求解最优核参数σ对应的故障诊断的准确率 (KFD)

              Table 3.  The accuracy of fault diagnosis of optimal kernel parameter by using the interval three-part method (KFD)

              迭代次数对应区间三分点 1三分点 2三分点 3三分点 4
              ${X_1}$$D({X_1})$${X_2}$$D({X_2})$${X_3}$$D({X_3})$${X_3}$$D({X_4})$
              1[1, 100]150 %3479 %6751 %10045 %
              2[1, 67]150 %2380 %4573.8 %6751 %
              3[1, 45]150 %15.779.4 %30.381.25 %4573.8 %
              4[15.7, 45]15.779.4 %25.580 %35.278.8 %4573.8 %
              5[15.7, 35.2]15.779.4 %22.280.3 %28.780.4 %35.278.8 %
              6[22.2, 35.2]22.280.3 %26.580 %30.981.25 %35.278.8 %

              同时, 当核参数选取不同值时, 本文对KFD和MKFD两种算法的训练集和测试集的准确率进行了对比, 实验结果如表4所示.

              表 4  KFD算法和MKFD算法中不同核参数的故障诊断结果

              Table 4.  The fault diagnosis with different kernel parameters in KFD algorithm and MKFD algorithm

              The value of the
              parameter σ in KFD
              Train
              accuracy (%)
              Test
              accuracy (%)
              The value of the
              parameter σ in MKFD
              Train
              accuracy (%)
              Test
              accuracy (%)
              0.1100250.110025
              110050110050
              1099.879.4410076.9
              3099.881.3810099.69
              6070.544.71299.992.5
              9027.725.31699.980.6

              分析表4可知, 两种算法的分类能力都是由低到高再到低的过程. 在KFD算法中, 当参数$\sigma $取0.1和取1的时候训练集的准确率在100 %, 但是测试集的准确率却只在25 %和50 %; 相对应的, 在MKFD算法中, 参数$\sigma $取0.1和取1时也是同样的情况, 这与我们之前的理论证明一致, 即: 当$\sigma $趋近于0时, 核Fisher判别分析方法会出现严重的过拟合现象.

              为充分验证采用区间三分法的MKFD算法的适用性, 本文增加了2个仿真算例. 选用UCI机器学习数据库中Ionosphere和Breast cancer分类数据来做实验验证, Ionosphere数据集包含351个样本, 34个特征向量, 分为“good”和“bad”两个数据类别, 其中“good”类别含有126个样本, “bad”类别含有225个样本; Breast cancer数据集包含638个样本, 9个特征向量, 分为“benign”和“malignant”两个数据类别, 其中“benign”类别包含444个样本, “malignant”类别包含239个样本. 本算例中选取类别各80个作为样本的训练集和测试集, 仿真结果见表5图4.

              表 5  选取不同核参数σ下故障诊断的准确率(按照区间三分法做纵向表)

              Table 5.  The fault diagnosis accuracy based on different kernel parameters σ (Make the longitudinal table according to the interval three-part method)

              IonosphereBreast cancer
              The value of the parameter σTest accuracy (%)The value of the parameter σTest accuracy (%)
              178.9131.7
              3491.614995.1
              499222394.9
              5692.424895.4
              5992.829795.4
              6392.833495.4
              6792.434695.4
              689244594.6
              7890.866794
              10086.1100093.2

              图  4  故障诊断准确率与核参数取值折线图

              Figure 4.  Line diagram of the fault diagnosis accuracy and kernel parameter

              按照仿真结果来看, 采用区间三分法的MKFD算法仍适用于UCI机器学习数据库中Ionosphere和Breast cancer分类数据, 其分类能力是由低变高再变低的过程, 对于Ionosphere和Breast cancer分类数据, 其分类准确率分别达到92.8 %和95.4 %. 也可以充分说明该算法的有效性和适用性.

            • 为了进一步验证本文算法的优越性, 本节对四种故障诊断方法在运算效率上进行对比, 这四种方法分别为: KFD、CKFD、FDGLPP[32]和MKFD. 目前在化工故障领域, 基于全局—局部保持投影算法备受关注, 这种算法不仅考虑数据的全局结构信息也考虑了数据的局部近邻结构信息, 在对数据进行特征提取时, 能大大降低信息量的损失. 将这几种算法与本文算法进行仿真对比, 实验验证结果见表6表7.

              表 6  区间三分法迭代求解最优核参数σ (MKFD)

              Table 6.  The iterative solution of the optimal kernel parameters σ using interval partition method

              迭代次数对应区间三分点 1三分点 2三分点 3三分点 4
              ${X_1}$$D({X_1})$${X_2}$$D({X_2})$${X_3}$$D({X_3})$${X_3}$$D({X_4})$
              1[1, 100]150.9 %3460.6 %6757.5 %10058.1 %
              2[1, 67]150.9 %2376.6 %4558.1 %6757.5 %
              3[1, 45]150 %15.796.3 %30.363.8 %4558.1 %
              4[1, 30.3]150 %10.899.69 %20.584.69 %30.363.8 %
              5[1, 20.5]150 %7.599.38 %1497.81 %20.584.69 %
              6[1, 14]150 %5.381.56 %9.799.69 %1497.81 %

              表 7  交叉验证法选取不同核参数σ下故障诊断的准确率(FDGLPP)

              Table 7.  The fault diagnosis accuracy based on different kernel parameters σ by cross validation method

              The value of the
              parameter σ
              Test
              accuracy (%)
              The value of the
              parameter σ
              Test
              accuracy (%)
              The value of the
              parameter σ
              Test
              accuracy (%)
              0.1250.568.13355.31
              152.19575.31679.38
              5028.442525.0999.69
              10041.255028.441225.0
              50039.067534.691555.94
              100038.759540.01825.0

              本文将MKFD算法和FDGLPP算法进行对比, 我们已知MKFD算法故障诊断准确率随核参数σ的变化规律, 所以通过区间三分法迭代寻找最优核参数, 在第4步迭代时就可以找到最优σ, 此时故障诊断率达99.69 %; 而FDGLPP算法, 在选取最优核参数时, 需要通过交叉验证法得到, 损耗时间较长, 故MKFD算法能有效提升找到最优核参数的效率.

              通过分析表8可知: CKFD、FDGLPP和MKFD三种算法分别在σ = 8, 10, 9时, 故障诊断准确率达到最高值. 此时可以发现, FDGLPP算法和MKFD算法的准确率都高达99%以上, 但是FDGLPP算法运行的时间是MKFD算法运行效率的两倍之多, 这也可以看出MKFD算法在运行效率上的优越性. 这两个实验通过对比可以发现, 本文的算法在提升运算效率的同时并没有以损失准确率为代价, 这有效证明了本文算法的优越性.

              表 8  四种模型的故障诊断结果与运行时间

              Table 8.  Fault diagnosis results and running time of the four models

              ModelOptimal value of parameter σTest accuracy (%)Test time (s)
              KFD3081.253.90072
              CKFD897.814.14769
              FDGLPP1099.699.30612
              MKFD999.693.86806
            • 分别应用KFD、CKFD、FDGLPP以及MKFD四种算法对训练集和测试集样本进行特征投影, 并用马氏距离对样本进行故障分类, 特征投影结果如图5图6图7图8, 这四组图分别是在四种算法处理下, 训练集和测试集在三维主特征轴及二维主特征轴上的投影.

              图  5  基于KFD算法的投影

              Figure 5.  Projection based on KFD algorithm

              图  6  基于CKFD算法的投影

              Figure 6.  Projection based on CKFD algorithm

              图  7  基于FDGLPP算法的投影

              Figure 7.  Projection based on FDGLPP algorithm

              图  8  基于MKFD算法的投影

              Figure 8.  Projection based on MKFD algorithm

              对训练集和测试集样本采用KFD投影, 得到的投影图如图5所示, 此时核参数取30. 对训练集和测试集样本采用CKFD投影, 得到的投影图如图6所示, 此时核参数取8, 权重函数取3. 对训练集和测试集样本采用FDGLPP投影, 得到的投影图如图7所示, 此时核参数取10. 同样对训练集和测试集样本采用MKFD投影, 得到的投影图如图8所示, 此时核参数取8, 权重函数分别取3和1.

              图5可以看出, 通过KFD投影, 得到故障3、4和7的投影信息互相掩盖, 导致分类效果差. 图6所示, 通过CKFD投影, 可以将三者区分开, 增大两者之间的类间距, 使得分类效果明显增强, 可以达到97 %以上, 但是此时CKFD的运算效率明显低于KFD. 在图7中通过FDGLPP投影, 可以将这四类故障区分开, 但是每一类故障投影的类内距离较分散, 在数据量大的情况下, 不利于分类准确. 在图8中通过MKFD投影, 缩小类内间距, 用组平均距离代替质心距离作为改变类间距的权重函数, 此时不仅能提升运算效率, 还可以提升其准确率, 此时的准确率为99.69 %.

              综上, 本文提出的MKFD算法, 对于故障样本的投影效果具有很大改善, 提升了故障诊断的精度, 同时, 在MKFD算法中所提出的寻找最优核参数的区间三分法也可以大大提升算法的运行效率.

            • 复杂的化工过程产生了大量的状态数据, 这些数据具有大量、非线性的特点. 引入KFD算法进行特征提取, 可以有效解决数据非线性问题, 提升算法效率. 但KFD算法也有一些缺点, 本文针对故障数据分类效果差及无法快速确定最优核参数这两个缺点, 提出了MKFD算法.

              在MKFD算法中, 选用区间三分法来克服核参数的低效选取问题, 该方法不仅可以解决依靠经验选择参数的劣势, 还可以避免遗漏最优解, 可以有效提升核参数的选取效率. 该方法基于TE过程数据做仿真验证, 并与之前常用的交叉验证法做对比, 结果表明: 在最优参数精度范围内, 本文所提方法加快了参数选择速度; 同时, 运用马氏距离对类间和类内距离进行加权, 不仅可以最大限度地分离投影向量的类间距离, 还可以使得其类内距离更紧凑, 显著提升了故障诊断算法的运行效率.

              在本文提及的方法中, 数据量大所带来的矩阵非奇异的情况可以进一步深入研究, 除此之外, 并行运算, 实时监控, 提取最大信息量也是需要进一步深入研究的方向.

          参考文献 (32)

          目录

            /

            返回文章
            返回