摘要
本研究建立了一种结合T-PLS(全潜结构投影)和GRA(灰色关联度分析)的造纸干燥过程能耗非优原因追溯模型。该模型首先基于机理知识和方差特性,去除造纸干燥过程生产数据中的非核心特征变量,并通过3σ原则和箱形图剔除异常值;然后使用施胶前定量与卷取车速数据,结合K-Means聚类算法,实现不同生产状态的分类;最后针对不同的生产状态,对比T-PLS和PLS建立的经济指标计算模型,选用基于T-PLS-GRA算法,构建造纸干燥过程能效非优原因追溯模型。结合国内某造纸厂实时生产数据对该模型进行了验证。结果表明,该模型基于经济指标判断工业生产状态过程,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程;并且能追溯非优状态原因及整个工况下,非优生产状态中最大贡献变量出现频次,为企业改进工艺流程及节能优化提供了参考依据。
我国是传统造纸大国,改革开放以来,伴随着国民经济的持续快速发展,我国造纸行业也快速发展。2020年出台的《轻工业发展规划》中,造纸产业被确定为六大重大任务中的重点领

图1 2012—2021年纸及纸板生产和消费情
Fig. 1 From 2012 to 2021 paper and paperboard production and consumption situatio
纸及纸板主要通过造纸机来生产制造,包括制浆、成形、压榨和干燥等主要工序。其中,干燥是造纸过程中能源消耗最高的工序(占60%以上
近年来,对复杂工业生产过程的运行状态评价受到越来越多的关
针对上述方法在实际工业生产应用中存在的不足,本课题提出了一种基于T-PLS组合算法,并结合GRA(灰色关联度分析)的过程工业非优原因追溯模型。T-PLS算

图2 T-PLS模型结构分解图
Fig. 2 T-PLS model structure decomposition diagram
GRA是一种多因素统计分析方法,用于在一个灰色系统中了解所关注项目受其他因素影响的程度,并得到分析结果,从而在面向复杂工业生产过程中找到非优原因。该非优原因追溯模型具有如下特点。
①在数据准备阶段,经过机理知识和方差特性计算,排除了部分参与建模的过程变量。对筛选过后的数据进行数据清洗和滑动数据窗口处理后,根据机理知识和生产经验,选取施胶前定量数据与卷取车速,进行聚类分析,将整体生产过程分成若干个生产状态,不仅能有效提取不同生产状态与过程运行状态之间的信息,还能够降低模型的复杂度,改善评价结果的可解释性。
②针对不同过程变量与经济指标关联的耦合关系,基于T-PLS-GRA组合算法,构建非优原因追溯模型,充分计算各过程变量之间的相关性。
本研究所提出的过程工业非优原因追溯模型主要包括:数据准备、特征工程、建模分析、非优原因追溯4个部分,具体流程图如

图3 过程工业非优原因追溯模型流程图
Fig. 3 Flow chart of process industry consumption of non-best traceable model
所有建模数据均是从工业实时数据采集系统中获取得到。利用生产实时信息数据训练出的模型,比利用实验仿真数据训练的模型所涵盖的生产场景更多,鲁棒性更好。对原始数据使用方差特性、3σ原则和箱形图进行数据清洗。首先计算出全部过程变量数据的方差特性,再利用机理知识验证低方差的过程变量(本课题归类为非核心特征变量),方差特性可通过
(1) |
式中,为样本方差,为变量,为样本均值,n为样本数。
过程变量数据的方差较小,意味着在不同工况下,这些数据没有显著变化。根据机理知识选取相应的过程变量,将整体生产过程分成若干个生产状态。在实际工业运行中,出现速度传感器机械联结不良、机械设备负荷变化大,或烘缸内部断纸等问题,均会反应在卷取车速和施胶前定量的过程变量中。所以施胶前定量与卷取车速能在很大程度上用于判断造纸的工况过程。使用3σ原则处理这2种过程变量的异常值,计算如
(2) |
式中,为样本均值,为标准差,为变量。最后使用箱型图处理剩下的核心特征生产数据异常值,计算如
(3) |
式中,为下分位数,为四分位数全距,为上分位数。
多变量时间序列是指由多个变量的时间序列组成的一种数据,这些数据包含了多种工况;也可以将多变量时间序列视为多个单变量时间序列组成的数据集,在数学上可表示成二维矩阵。考虑到采样过程易受到噪声及采集设备干扰,可选取某个宽度的滑动数据窗口处理多变量时间序列。根据生产过程是否平稳或外部环境干扰是否过大,进行滑动数据窗口宽度大小的设置,可以将原始数据不稳定性对后续建模产生的影响降到最低。
使用K-Means聚类方法时,K值需要确定。为了使聚类效果最好,可根据聚类簇内的稠密程度和聚类簇间的离散程度确定K值。本课题使用手肘法与轮廓系数法确定K值。
手肘法的核心思想是:随着聚类数K值的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,因而和方差(SSE)会逐渐变小。并且,当K值小于真实聚类数时,由于K值的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度较大;而当K值达到真实聚类数时,再增加K值,所得到的聚合程度回报会迅速变小,所以SSE的下降幅度骤减,并随着K值的继续增大而趋于平缓,即SSE和K值的关系图是一个手肘的形状,而这个“肘部”对应的K值就是数据的真实聚类数。SSE可通过
(4) |
式中,为和方差,为第j个类中的数据,为第j个类中所有数据的平均值。
轮廓系数法的核心思想是:得出所有过程变量的轮廓系数后求其平均值,即为平均轮廓系数。平均轮廓系数的取值范围为[-1,1],簇内样本距离越近,簇间样本距离越远;平均轮廓系数越大,聚类效果越好。平均轮廓数最大的K值便是最佳聚类数,平均轮廓数可通过
(5) |
式中,为j向量到同一簇内其他点不相似程度的平均值,为j向量到其他簇的平均不相似程度的最小值。
基于T-PLS-GRA组合算法处理特征加强后的数据。该算法利用过程变量数据对经济指标建模,由经济指标评估阈值,检验造纸生产过程的状态优性评价,最后利用GRA算法进行非优原因追溯。经济指标通常是建立在能源效率基础上,能源效率一般是指能源投入量与服务产出量之间的关系。本课题采用单要素能源效率指标作为经济指标的基础,单要素能源效率指标通常表示为一个工业过程的有效产出和能源投入的比值,不考虑其他生产要
T-PLS-GRA组合算法的主要步骤如下:
①将数据矩阵X进行无量纲处理,令j=1,Xj=X;
②对(Xj,Y)运行PLS算法,得到相应的矩阵T、p和q,残差E和F、主元个数A由交叉验证法确定;
③ty=T
④,;
⑤对进行PCA分解,即,主元个数为A-1;
⑥对残差E进行PCA分解,即,主元个数由文献[
(6) |
⑦对T-PLS计算出的经济指标数据进行工况分类,确定评价阈值λ,对于非优工况数据,使用GRA方法计算非优原因;
⑧非优原因计算如
(7) |
本课题以国内某造纸干燥生产线为研究对象,以其2个月的实时生产数据为原始数据。该实时生产数据采样间隔为10 min,共4482组数据、31个过程变量;经过方差计算和机理经验,筛去部分非核心过程变量,选取施胶前定量、卷取车速、蒸汽组4压力,T1进风温度等19个过程变量作为核心变量,如
序号 | 符号 | 过程变量名称 | 单位 |
---|---|---|---|
1 | X1 | 施胶前定量 |
g/ |
2 | X2 | 卷取车速 | m/min |
3 | X3 | 蒸汽组4压力 | kPa |
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17 X18 X19 |
T1进风温度 T1进风流量 T1排风流量 T2进风流量 T2进风温度 T2排风流量1 T2排风流量2 T3进风流量 T3排风流量 T3进风温度 T1排风温度 T1排风湿度 T2排风湿度 T2排风温度 T3排风温度 T3排风湿度 |
℃ ℃ ℃ ℃ % % ℃ ℃ % |

图4 数据处理过程
Fig. 4 Data processing process
根据机理知识,选取施胶前定量与卷取车速为对象,利用K-Means聚类算法对施胶前定量和卷取车速过程变量进行工况聚类,最佳K值由手肘法和轮廓系数共同确定。如

图5 K-Means聚类
Fig. 5 K-Means Cluster
工况类别 | 施胶前定量区间/(g· | 卷取车速区间/(m·mi |
---|---|---|
第1类 | [93,111] | [1205,1280] |
第2类 | [67,75] | [1251,1351] |
第3类 第4类 第5类 |
[105,119] [86,95] [108,131] |
[1077,1197] [1266,1351] [1155,1240] |
本课题选取了T-PLS和PLS算法,对不同工况数据搭建经济指标模型。将训练数据再次代入到对应工况的经济指标模型中,检验模型预测的准确度及RSE(相对平方误差)值,结果如

图6 模型验证
Fig. 6 Model verification
此外,计算每个簇的中心均值点后,使用ED(欧式距离)判断测试数据所属的某类运行工况,再代入相应的经济指标模型。测试数据的经济指标预测结果及其相对误差如
(8) |

图7 样本预测结果及相对误差
Fig. 7 Sample prediction results and relative errors
设计实时评价运行过程工况的评价指标yk,如
(9) |
式中,和分别表示整个生产过程中,单因素经济指标的历史最大值和最小值。评价阈值λ取值为(0,1),其yk越接近于1,表示运行过程越好;反之则表示当前运行工况严重偏离最优工况,需要调整和改进。为了严格区分运行状态是优或非优,设定一个评价阈值λ(0.5<λ<1),若,则表示当前过程运行工况是优的,无需操作调整;相反,若,则表示当前过程运行工况为非优。对于非优工况,需要进一步查出非优原因,将过程重新调整到最优状态。本课题使用此方法,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程。
使用GRA方法计算各过程变量的贡献值,再根据贡献值的大小,将其分成4级贡献度,以贡献图的形式表示各过程变量的贡献度。贡献

图8 过程变量贡献度
Fig. 8 Process variable contribution
针对纸张干燥过程运行状态评价问题,本课题提出了一种新的基于T-PLS-GRA的能效非优原因追溯模型。该模型能够保障纸张干燥过程的运行健康管理,有助于促进造纸生产安全稳定、提升纸产品质量,以及节能降耗。
4.1 融入机理知识进行工业运行状态分类,将整个工业流程分成5种生产状态,利用T-PLS和PLS方法分别建立了不同生产状态的经济指标计算模型。T-PLS方法建立的经济指标计算模型相对平方误差均值为0.239,PLS方法建立的经济指标计算模型相对平方误差均值为0.278,T-PLS方法建立的模型效果更佳。
4.2 设计了生产过程中运行状态由经济指标决定的计算预测模型,结合国内某造纸厂的实时生产数据,验证了本课题所提出的方法,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程。
4.3 当生产过程运行为非优时,采用本课题提出的基于贡献等级的非优原因追溯方法,有助于对非优原因进行定位。并且统计了在同一工况下,非优生产状态中最大贡献变量的出现频次,为企业改进生产工艺流程及节能优化提供了参考依据。
参考文献
中国造纸学会.中国造纸年鉴[M].北京: 中国轻工业出版社, 2021. [百度学术]
China Technical Association of Paper Industry.China Papermaking Yearbook[M].Beijing: China Light Industry Press, 2021. [百度学术]
中国造纸工业2021年度报告[J].造纸信息, 2022(5): 6-17. [百度学术]
China Paper Industry Report 2021[J].China Paper Newsletters,2022(5): 6-17. [百度学术]
KONG L B, LIU H B.A Static Energy Model of Conventional Paper Drying for Multicylinder Paper Machines[J].Drying Technology, 2012,30(3):276-296. [百度学术]
陆造好, 满 奕, 李继庚, 等.基于深度强化学习的造纸废水处理过程多目标优化[J].中国造纸, 2023, 42(3): 13-22,103. [百度学术]
LU Z H, MAN Y, LI J G, et al.Multi-objective Optimization of Papermaking Wastewater Treatment Process Based on Deep Reinforcement Learning[J].China Pulp & Paper, 2023, 42(3): 13-22,103. [百度学术]
SHEN Y Z,TANG W,LIU Y G.Novel Parameter Identification Method for Basis Weight Control Loop of Papermaking Process[J].Paper and Biomaterials, 2023, 8(1): 35-49. [百度学术]
陈晓彬, 董云渊, 郑启富, 等.基于“边界层”理论的纸张干燥动力学模型及其数值仿真[J].中国造纸学报, 2017, 32(3): 37-42. [百度学术]
CHEN X B, DONG Y Y, ZHENG Q F, et al.Kinetic Model and Numerical Simulation of Paper Drying Process Base on Boundary Layer Theory[J].Transactions of China Pulp and Paper, 2017, 32(3): 37-42. [百度学术]
陈晓彬, 董云渊, 郑启富, 等.纸张多烘缸干燥过程建模与智能模拟技术研究进展[J].中国造纸学报, 2018, 33(4): 64-69. [百度学术]
CHEN X B, DONG Y Y, ZHENG Q F, et al.Research Progress of Modeling and Intelligent Simulation of Paper Multi-cylinder Drying Process[J].Transactions of China Pulp and Paper, 2018, 33(4): 64-69. [百度学术]
陈晓彬, 董云渊, 郑启富, 等.纸张内部水分存在形式及其干燥特性研究[J].中国造纸学报, 2019, 34(1): 55-59. [百度学术]
CHEN X B, DONG Y Y, ZHENG Q F, et al.Study on Existing Forms and Drying Characteristics of Internal Water in Paper Web[J].Transactions of China Pulp and Paper, 2019, 34(1): 55-59. [百度学术]
YE L, LIU Y, FEI Z, et al.Online Probabilistic Assessment of Operating Performance Based on Safety and Optimality Indices for Multimode Industrial Processes[J]. Industrial & Engineering Chemistry Research, 2009,48(24):10912-10923. [百度学术]
刘 强, 柴天佑, 秦泗钊, 等.基于数据和知识的工业过程监视及故障诊断综述[J].控制与决策, 2010, 25(6):801-807,813. [百度学术]
LIU Q, CHAI T Y, QIN S Z, et al.Progress of Data-driven and Knowledge-driven Process Monitoring and Fault Diagnosis for Industry Process[J].Control and Decision, 2010, 25(6):801-807,813. [百度学术]
LIU Y, CHANG Y, WANG F.Online Process Operating Performance Assessment and Nonoptimal Cause Identification for Industrial Processes[J].Journal of Process Control, 2014, 24(10): 1548-1555. [百度学术]
WANG Y, PENG Y Z, ZI Y Y, et al.A Two-stage Data-driven-based Prognostic Approach for Bearing Degradation Problem[J].IEEE Transactions on Industrial Informatics, DOI:10.1109/TII.2016.2535368. [百度学术]
ZHANG H.Online Health Assessment of Wind Turbine Based on Operational Condition Recognition[J].Transactions of the Institute of Measurement and Control, DOI: 10.1177/0142331218810070. [百度学术]
郑 伟, 姚 远, 刘 炎, 等.基于分层分块状态相关独立成分分析的火力发电过程运行状态评价[J].控制与决策,2022, 37(4):1081-1088. [百度学术]
ZHENG W, YAO Y, LIU Y, et al.Operation Performance Assessment of Thermal Power Generation Process Based on HMPRICA[J].Control and Decision, 2022,37(4):1081-1088. [百度学术]
BI X.Optimization of Tobacco Drying Process Control based on Reinforcement Learning[J].Drying Technology, 2020, 38(10):1291-1299. [百度学术]
ZHANG Y, ZENG Z, LI J, et al.Data-driven Method for Monitoring and Diagnosis in Energy System of Papermaking Process[J].Drying Technology, 2022, 40(13): 2710-2722. [百度学术]
褚 菲, 许 杨, 尚 超, 等.基于静-动态特性协同感知的复杂工业过程运行状态评价[J].自动化学报, 2023,49(8):1621-1634. [百度学术]
CHU F, XU Y, SHANG C, et al.Evaluation of Complex Industrial Process Operating State Based on Static and Dynamic Cooperative Perception[J].Acta Automatica Sinica, 2023, 49(8):1621-1634. [百度学术]
ZHOU D, GANG L, QIN S J.Total Projection to Latent Structures for Process Monitoring[J].Aiche Journal, 2010, 56(1): 168-178. [百度学术]
陈晓彬, 郑启富, 董云渊, 等.纸机干燥部能源效率在线监测与评价方法研究[J].中国造纸学报, 2020, 35(3): 59-64. [百度学术]
CHEN X B, ZHENG Q F, DONG Y Y, et al.Research on Online Monitoring and Evaluation Method of Energy Efficiency in Dryer Section of Paper Machine[J].Transactions of China Pulp and Paper, 2020, 35(3): 59-64. [百度学术]
QIN S J, DUNIA R.Determining the Number of Principal Components for Best Reconstruction[J].Journal of Process Control, 2000, 10(2/3): 245-250. [百度学术]
CHO J H, LEE J M, SANG W C, et al.Fault Identification for Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering, 2005, 60(1): 279-288. [百度学术]
GANG X, YANG Y P, LU S Y, et al.Comprehensive Evaluation of Coal-fired Power Plants based on Grey Relational Analysis and Analytic Hierarchy Process[J]. Energy Policy, 2011, 39(5): 2343-2351. [百度学术]