网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于T-PLS-GRA的造纸干燥过程能耗非优原因追溯模型

  • 戴景波 1,2
  • 陈晓彬 2
  • 方子言 2
  • 郑启富 2
  • 张垚 1,2
  • 张敏 2
  • 董云渊 2
  • 廖建明 2
1. 浙江工业大学化工学院,浙江杭州,310014; 2. 衢州学院化学与材料工程学院,浙江衢州,324000

中图分类号: TS755

最近更新:2024-03-25

DOI:10.11981/j.issn.1000-6842.2024.01.91

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

本研究建立了一种结合T-PLS(全潜结构投影)和GRA(灰色关联度分析)的造纸干燥过程能耗非优原因追溯模型。该模型首先基于机理知识和方差特性,去除造纸干燥过程生产数据中的非核心特征变量,并通过3σ原则和箱形图剔除异常值;然后使用施胶前定量与卷取车速数据,结合K-Means聚类算法,实现不同生产状态的分类;最后针对不同的生产状态,对比T-PLS和PLS建立的经济指标计算模型,选用基于T-PLS-GRA算法,构建造纸干燥过程能效非优原因追溯模型。结合国内某造纸厂实时生产数据对该模型进行了验证。结果表明,该模型基于经济指标判断工业生产状态过程,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程;并且能追溯非优状态原因及整个工况下,非优生产状态中最大贡献变量出现频次,为企业改进工艺流程及节能优化提供了参考依据。

我国是传统造纸大国,改革开放以来,伴随着国民经济的持续快速发展,我国造纸行业也快速发展。2020年出台的《轻工业发展规划》中,造纸产业被确定为六大重大任务中的重点领

1。据中国造纸协会统计数据(如图1所示),2021年我国纸及纸板生产企业2500家,纸及纸板生产量约12105万t,较上年增长了7.50%,年均增长率1.87%;消费量约12648万t,较上年增长了6.94%,年均增长率2.59%,人均年消费量为89.51 kg(14.13亿人2

图1  2012—2021年纸及纸板生产和消费情[

2]

Fig. 1  From 2012 to 2021 paper and paperboard production and consumption situation[

2]

纸及纸板主要通过造纸机来生产制造,包括制浆、成形、压榨和干燥等主要工序。其中,干燥是造纸过程中能源消耗最高的工序(占60%以上

3,且干燥部在造纸机上物理长度占比最长(约占50%),同时干燥过程也是纸产品物理性能形成的关键工序。造纸机的干燥部是一个多过程、多物料相互作用的系4-5,要对其运行状态进行高效管理,就必须实行全面智能6-8。因此,纸张干燥过程的运行健康管理,在保障造纸生产安全稳定、提升纸产品质量及节能降耗等方面非常重要。

近年来,对复杂工业生产过程的运行状态评价受到越来越多的关

9-10。Liu11使用T-PLS(全潜结构投影)方法评价了工业过程运行状态。Wang12利用轴承震动信号来判定设备故障种类,实现对轴承的运行状态评价。Zhang13使用GMM(高斯混合模型)对风力发电机组的运行状态进行评价。上述几种方法在计算工业过程运行状态时,需要强关联人工经验和机理知识。但实际工业生产过程是一个多子系统协同、机构众多、机理复杂、具有大规模过程特性的复杂工业过程,其故障类型多样,不仅有控制系统故障,还存在因原材料波动、运行环境变化、过程设备磨损老化、操作不当等,造成的生产效率和产品质量下降等异常问题;因此,从大规模变量中提取这些异常是十分困难的。郑伟14对工业过程进行分成分块处理,分开计算工业运行状态。Bi15在使用PID(比例-积分-微分)控制器的基础上,通过强化学习,动态调控干燥机的配置,使干燥过程运行状态达到最优。Zhang16使用KPCA(核主成分分析)算法进行干燥过程的运行状态评价。褚菲17使用KPI-Driven SFA(关键性能指标驱动的慢特征分析算法)搭建运行状态评价模型。上述几种方法均是以数据驱动模型,并未利用系统内部结构和故障机理信息,对故障分析和解释的能力不强,对故障根源诊断和传播路径辨识能力较差。

针对上述方法在实际工业生产应用中存在的不足,本课题提出了一种基于T-PLS组合算法,并结合GRA(灰色关联度分析)的过程工业非优原因追溯模型。T-PLS算

18在传统PLS算法的基础上去除了一些对预测变量无帮助的变量数据,以及与质量变量无关的数据;同时,PLS算法的残差数据中仍存在除噪声之外的较多变异信息,需要将其区分开。T-PLS模型结构分解如图2所示(X的负载是PXY直接相关的部分tyXY正交的部分T0,含较大方差变化的部分Tr,最终残差部分Er)。

图2  T-PLS模型结构分解图

Fig. 2  T-PLS model structure decomposition diagram

GRA是一种多因素统计分析方法,用于在一个灰色系统中了解所关注项目受其他因素影响的程度,并得到分析结果,从而在面向复杂工业生产过程中找到非优原因。该非优原因追溯模型具有如下特点。

①在数据准备阶段,经过机理知识和方差特性计算,排除了部分参与建模的过程变量。对筛选过后的数据进行数据清洗和滑动数据窗口处理后,根据机理知识和生产经验,选取施胶前定量数据与卷取车速,进行聚类分析,将整体生产过程分成若干个生产状态,不仅能有效提取不同生产状态与过程运行状态之间的信息,还能够降低模型的复杂度,改善评价结果的可解释性。

②针对不同过程变量与经济指标关联的耦合关系,基于T-PLS-GRA组合算法,构建非优原因追溯模型,充分计算各过程变量之间的相关性。

1 方 法

本研究所提出的过程工业非优原因追溯模型主要包括:数据准备、特征工程、建模分析、非优原因追溯4个部分,具体流程图如图3所示。

图3  过程工业非优原因追溯模型流程图

Fig. 3  Flow chart of process industry consumption of non-best traceable model

1.1 数据准备

所有建模数据均是从工业实时数据采集系统中获取得到。利用生产实时信息数据训练出的模型,比利用实验仿真数据训练的模型所涵盖的生产场景更多,鲁棒性更好。对原始数据使用方差特性、3σ原则和箱形图进行数据清洗。首先计算出全部过程变量数据的方差特性,再利用机理知识验证低方差的过程变量(本课题归类为非核心特征变量),方差特性可通过式(1)计算获得。

S2=X-X˙n-12 (1)

式中,S2为样本方差,X为变量,X˙为样本均值,n为样本数。

过程变量数据的方差较小,意味着在不同工况下,这些数据没有显著变化。根据机理知识选取相应的过程变量,将整体生产过程分成若干个生产状态。在实际工业运行中,出现速度传感器机械联结不良、机械设备负荷变化大,或烘缸内部断纸等问题,均会反应在卷取车速和施胶前定量的过程变量中。所以施胶前定量与卷取车速能在很大程度上用于判断造纸的工况过程。使用3σ原则处理这2种过程变量的异常值,计算如式(2)所示。

μ-3σ<X<μ+3σ (2)

式中,μ为样本均值,σ为标准差,X为变量。最后使用箱型图处理剩下的核心特征生产数据异常值,计算如式(3)所示。

Q1-1.5IQR<X<Q3+1.5IQR (3)

式中,Q1为下分位数,IQR为四分位数全距,Q3为上分位数。

1.2 特征加强

多变量时间序列是指由多个变量的时间序列组成的一种数据,这些数据包含了多种工况;也可以将多变量时间序列视为多个单变量时间序列组成的数据集,在数学上可表示成二维矩阵。考虑到采样过程易受到噪声及采集设备干扰,可选取某个宽度的滑动数据窗口处理多变量时间序列。根据生产过程是否平稳或外部环境干扰是否过大,进行滑动数据窗口宽度大小的设置,可以将原始数据不稳定性对后续建模产生的影响降到最低。

1.3 聚类分析

使用K-Means聚类方法时,K值需要确定。为了使聚类效果最好,可根据聚类簇内的稠密程度和聚类簇间的离散程度确定K值。本课题使用手肘法与轮廓系数法确定K值。

手肘法的核心思想是:随着聚类数K值的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,因而和方差(SSE)会逐渐变小。并且,当K值小于真实聚类数时,由于K值的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度较大;而当K值达到真实聚类数时,再增加K值,所得到的聚合程度回报会迅速变小,所以SSE的下降幅度骤减,并随着K值的继续增大而趋于平缓,即SSE和K值的关系图是一个手肘的形状,而这个“肘部”对应的K值就是数据的真实聚类数。SSE可通过式(4)计算得到。

SSE=j=1mXKjX-Yj2 (4)

式中,SSE为和方差,X为第j个类Kj中的数据,Yj为第j个类中所有数据的平均值。

轮廓系数法的核心思想是:得出所有过程变量的轮廓系数后求其平均值,即为平均轮廓系数。平均轮廓系数的取值范围为[-1,1],簇内样本距离越近,簇间样本距离越远;平均轮廓系数越大,聚类效果越好。平均轮廓数最大的K值便是最佳聚类数,平均轮廓数可通过式(5)计算得到。

S(j)=p(j)-q(j)max {p(j),q(j)} (5)

式中,p(j)j向量到同一簇内其他点不相似程度的平均值,q(j)j向量到其他簇的平均不相似程度的最小值。

1.4 聚类分析T-PLS-GRA组合算法

基于T-PLS-GRA组合算法处理特征加强后的数据。该算法利用过程变量数据对经济指标建模,由经济指标评估阈值,检验造纸生产过程的状态优性评价,最后利用GRA算法进行非优原因追溯。经济指标通常是建立在能源效率基础上,能源效率一般是指能源投入量与服务产出量之间的关系。本课题采用单要素能源效率指标作为经济指标的基础,单要素能源效率指标通常表示为一个工业过程的有效产出和能源投入的比值,不考虑其他生产要

19

T-PLS-GRA组合算法的主要步骤如下:

①将数据矩阵X进行无量纲处理,令j=1,Xj=X

②对(XjY)运行PLS算法,得到相应的矩阵Tpq,残差EF、主元个数A由交叉验证法确定;

ty=TqT

X^=TpTpy=X^ty/tyTty

⑤对X^0进行PCA分解,即X^0=X^-typyT=T0P0T,主元个数为A-1;

⑥对残差E进行PCA分解,即E=TrPrT+Er,主元个数由文献[

20]给出;当使用T-PLS对数据进行建模时,数据XY的分解如式(6)所示;

X=typyT+T0P0T+TrPrT+ErY=tyqy+F                               [Er=E(I-PrPrT)]               (6)

⑦对T-PLS计算出的经济指标数据进行工况分类,确定评价阈值λ,对于非优工况数据,使用GRA方法计算非优原因;

⑧非优原因计算如式(7)所示。

ξj(k)=minjminky(k)-xj(k)+ρmaxjmaxky(k)-xj(k)y(k)-xj(k)+ρmaxjmaxky(k)-xj(k) (7)

2 结果与讨论

本课题以国内某造纸干燥生产线为研究对象,以其2个月的实时生产数据为原始数据。该实时生产数据采样间隔为10 min,共4482组数据、31个过程变量;经过方差计算和机理经验,筛去部分非核心过程变量,选取施胶前定量、卷取车速、蒸汽组4压力,T1进风温度等19个过程变量作为核心变量,如表1所示;再对上述过程变量进行滑动数据窗口处理,以最大程度消除数据噪声。以施胶前定量和卷取车速为例,数据处理过程如图4所示。

表1  过程变量表
Table 1  Procedure variables table
序号符号过程变量名称单位
1 X1 施胶前定量 g/m2
2 X2 卷取车速 m/min
3 X3 蒸汽组4压力 kPa

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

X18

X19

T1进风温度

T1进风流量

T1排风流量

T2进风流量

T2进风温度

T2排风流量1

T2排风流量2

T3进风流量

T3排风流量

T3进风温度

T1排风温度

T1排风湿度

T2排风湿度

T2排风温度

T3排风温度

T3排风湿度

m3/min

m3/min

m3/min

m3/min

m3/min

m3/min

m3/min

图4  数据处理过程

Fig. 4  Data processing process

根据机理知识,选取施胶前定量与卷取车速为对象,利用K-Means聚类算法对施胶前定量和卷取车速过程变量进行工况聚类,最佳K值由手肘法和轮廓系数共同确定。如图5(a)所示,在K值=5时,轮廓系数值最大;当K<5时,随着K值的增加,SSE降幅较大,当K>5时,SSE降幅随着K值的增加趋于平缓。综上,将施胶前定量与卷取车速过程变量聚类成5类时效果最佳,由于不同工况下的数据区间不同,工况数据分类区间如表2所示,聚类效果图如图5(b)所示。

图5  K-Means聚类

Fig. 5  K-Means Cluster

表2  工况数据分类区间
Table 2  Classification interval of working condition data
工况类别施胶前定量区间/(g·m-2卷取车速区间/(m·min-1
第1类 [93,111] [1205,1280]
第2类 [67,75] [1251,1351]

第3类

第4类

第5类

[105,119]

[86,95]

[108,131]

[1077,1197]

[1266,1351]

[1155,1240]

本课题选取了T-PLS和PLS算法,对不同工况数据搭建经济指标模型。将训练数据再次代入到对应工况的经济指标模型中,检验模型预测的准确度及RSE(相对平方误差)值,结果如图6所示。从图6(a)~图6(e)(部分数据)可看出,T-PLS与PLS算法建模的预测值与真实值接近。图6(f)显示,使用T-PLS建立的经济指标模型计算5种工况的模型预测值,其RSE均值为0.239;使用PLS建立的经济指标模型计算所得预测值的RSE均值为0.278。该结果表明,T-PLS方法建立的计算模型要优于PLS方法。因此,在该5种工况下使用T-PLS算法搭建的经济指标模型准确度更高。

图6  模型验证

Fig. 6  Model verification

此外,计算每个簇的中心均值点后,使用ED(欧式距离)判断测试数据所属的某类运行工况,再代入相应的经济指标模型。测试数据的经济指标预测结果及其相对误差如图7所示。从图7(a)可看出,经济指标预测值与真实值非常接近。从图7(b)可看出,相对误差很小,说明经济指标预测结果可靠,可利用其评价运行状态过程。ED可通过式(8)计算得到。

ED=j=1kXj-Yj2 (8)

图7  样本预测结果及相对误差

Fig. 7  Sample prediction results and relative errors

设计实时评价运行过程工况的评价指标yk,如式(9)所示,可见经济指标yk越大,对应的过程运行工况效果越好。

yk=1,yyminymax-yymax-ymin,    ymin<y<ymax0,yymax (9)

式中,ymax=max1<n<5ynymin=min1<n<5yn分别表示整个生产过程中,单因素经济指标的历史最大值和最小值。评价阈值λ取值为(0,1),其yk越接近于1,表示运行过程越好;反之则表示当前运行工况严重偏离最优工况,需要调整和改进。为了严格区分运行状态是优或非优,设定一个评价阈值λ(0.5<λ<1),若ykλ,则表示当前过程运行工况是优的,无需操作调整;相反,若yk<λ,则表示当前过程运行工况为非优。对于非优工况,需要进一步查出非优原因,将过程重新调整到最优状态。本课题使用此方法,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程。

使用GRA方法计算各过程变量的贡献值,再根据贡献值的大小,将其分成4级贡献度,以贡献图的形式表示各过程变量的贡献度。贡献

21-22给出了各个被测量的过程变量对经济指标的贡献影响,贡献度等级越大,表示对经济指标的影响也越大,可以用于异常变量的识别。但由于流程工业往往是一个数据多源异构、条件变化频繁、多过程变量耦合交错的复杂动态参数分布过程,一个数据的异常会影响到其他变量的数值,进而影响不同生产变量对经济指标的贡献,所以贡献图只能为操作员提供一定的程序辅助作用。在生产过程某一时刻的非优工况下,使用本课题提供的方法能够找到非优原因贡献度最大的几个过程变量。

图8为非优过程变量的贡献图。如图8(a)所示,在该生产状态下,变量X19、X11、X2、X5、X6是对生产过程状态影响最大的因素,控制这些变量将为生产状态向优调整提供指导。图8(b)统计了在同一运行工况全部为非优的生产状态下最大贡献变量的出现频次。结果表明,X19X11X6这3个变量的出现频次最高。X19、X11、X6这3个过程变量对应造纸厂实际生产过程中的T3排风湿度、T3进风流量、T1排风流量。排风湿度和进排风流量在造纸生产过程中承担着节能减排、生产效率和纸张质量等任务。在国内某造纸厂实时纸张干燥生产的3个阶段中,T3阶段蒸汽耗能最大,优化变量X19X11的节能效果显著。在纸张干燥第1阶段的合理温度控制范围内,优化变量X6快速升温对纸张干燥进程尤为重要。

图8  过程变量贡献度

Fig. 8  Process variable contribution

4 结论

针对纸张干燥过程运行状态评价问题,本课题提出了一种新的基于T-PLS-GRA的能效非优原因追溯模型。该模型能够保障纸张干燥过程的运行健康管理,有助于促进造纸生产安全稳定、提升纸产品质量,以及节能降耗。

4.1 融入机理知识进行工业运行状态分类,将整个工业流程分成5种生产状态,利用T-PLS和PLS方法分别建立了不同生产状态的经济指标计算模型。T-PLS方法建立的经济指标计算模型相对平方误差均值为0.239,PLS方法建立的经济指标计算模型相对平方误差均值为0.278,T-PLS方法建立的模型效果更佳。

4.2 设计了生产过程中运行状态由经济指标决定的计算预测模型,结合国内某造纸厂的实时生产数据,验证了本课题所提出的方法,对非优过程预测精准率为77.7%,可较好地跟踪造纸过程设备运行状态的变化过程。

4.3 当生产过程运行为非优时,采用本课题提出的基于贡献等级的非优原因追溯方法,有助于对非优原因进行定位。并且统计了在同一工况下,非优生产状态中最大贡献变量的出现频次,为企业改进生产工艺流程及节能优化提供了参考依据。

参考文献

1

中国造纸学会.中国造纸年鉴[M].北京中国轻工业出版社2021. [百度学术] 

China Technical Association of Paper Industry.China Papermaking Yearbook[M].BeijingChina Light Industry Press2021. [百度学术] 

2

中国造纸工业2021年度报告[J].造纸信息20225): 6-17. [百度学术] 

China Paper Industry Report 2021[J].China Paper Newsletters20225): 6-17. [百度学术] 

3

KONG L BLIU H B.A Static Energy Model of Conventional Paper Drying for Multicylinder Paper Machines[J].Drying Technology2012303):276-296. [百度学术] 

4

陆造好满 奕李继庚.基于深度强化学习的造纸废水处理过程多目标优化[J].中国造纸2023423): 13-22,103. [百度学术] 

LU Z HMAN YLI J Get al.Multi-objective Optimization of Papermaking Wastewater Treatment Process Based on Deep Reinforcement Learning[J].China Pulp & Paper2023423): 13-22,103. [百度学术] 

5

SHEN Y ZTANG WLIU Y G.Novel Parameter Identification Method for Basis Weight Control Loop of Papermaking Process[J].Paper and Biomaterials202381): 35-49. [百度学术] 

6

陈晓彬董云渊郑启富.基于“边界层”理论的纸张干燥动力学模型及其数值仿真[J].中国造纸学报2017323): 37-42. [百度学术] 

CHEN X BDONG Y YZHENG Q Fet al.Kinetic Model and Numerical Simulation of Paper Drying Process Base on Boundary Layer Theory[J].Transactions of China Pulp and Paper2017323): 37-42. [百度学术] 

7

陈晓彬董云渊郑启富.纸张多烘缸干燥过程建模与智能模拟技术研究进展[J].中国造纸学报2018334): 64-69. [百度学术] 

CHEN X BDONG Y YZHENG Q Fet al.Research Progress of Modeling and Intelligent Simulation of Paper Multi-cylinder Drying Process[J].Transactions of China Pulp and Paper2018334): 64-69. [百度学术] 

8

陈晓彬董云渊郑启富.纸张内部水分存在形式及其干燥特性研究[J].中国造纸学报2019341): 55-59. [百度学术] 

CHEN X BDONG Y YZHENG Q Fet al.Study on Existing Forms and Drying Characteristics of Internal Water in Paper Web[J].Transactions of China Pulp and Paper2019341): 55-59. [百度学术] 

9

YE LLIU YFEI Zet al.Online Probabilistic Assessment of Operating Performance Based on Safety and Optimality Indices for Multimode Industrial Processes[J]. Industrial & Engineering Chemistry Research20094824):10912-10923. [百度学术] 

10

刘 强柴天佑秦泗钊.基于数据和知识的工业过程监视及故障诊断综述[J].控制与决策2010256):801-807,813. [百度学术] 

LIU QCHAI T YQIN S Zet al.Progress of Data-driven and Knowledge-driven Process Monitoring and Fault Diagnosis for Industry Process[J].Control and Decision2010256):801-807,813. [百度学术] 

11

LIU YCHANG YWANG F.Online Process Operating Performance Assessment and Nonoptimal Cause Identification for Industrial Processes[J].Journal of Process Control20142410): 1548-1555. [百度学术] 

12

WANG YPENG Y ZZI Y Yet al.A Two-stage Data-driven-based Prognostic Approach for Bearing Degradation Problem[J].IEEE Transactions on Industrial InformaticsDOI:10.1109/TII.2016.2535368. [百度学术] 

13

ZHANG H.Online Health Assessment of Wind Turbine Based on Operational Condition Recognition[J].Transactions of the Institute of Measurement and ControlDOI: 10.1177/0142331218810070. [百度学术] 

14

郑 伟姚 远刘 炎.基于分层分块状态相关独立成分分析的火力发电过程运行状态评价[J].控制与决策2022374):1081-1088. [百度学术] 

ZHENG WYAO YLIU Yet al.Operation Performance Assessment of Thermal Power Generation Process Based on HMPRICA[J].Control and Decision2022374):1081-1088. [百度学术] 

15

BI X.Optimization of Tobacco Drying Process Control based on Reinforcement Learning[J].Drying Technology20203810):1291-1299. [百度学术] 

16

ZHANG YZENG ZLI Jet al.Data-driven Method for Monitoring and Diagnosis in Energy System of Papermaking Process[J].Drying Technology20224013): 2710-2722. [百度学术] 

17

褚 菲许 杨尚 超.基于静-动态特性协同感知的复杂工业过程运行状态评价[J].自动化学报2023498):1621-1634. [百度学术] 

CHU FXU YSHANG Cet al.Evaluation of Complex Industrial Process Operating State Based on Static and Dynamic Cooperative Perception[J].Acta Automatica Sinica2023498):1621-1634. [百度学术] 

18

ZHOU DGANG LQIN S J.Total Projection to Latent Structures for Process Monitoring[J].Aiche Journal2010561): 168-178. [百度学术] 

19

陈晓彬郑启富董云渊.纸机干燥部能源效率在线监测与评价方法研究[J].中国造纸学报2020353): 59-64. [百度学术] 

CHEN X BZHENG Q FDONG Y Yet al.Research on Online Monitoring and Evaluation Method of Energy Efficiency in Dryer Section of Paper Machine[J].Transactions of China Pulp and Paper2020353): 59-64. [百度学术] 

20

QIN S JDUNIA R.Determining the Number of Principal Components for Best Reconstruction[J].Journal of Process Control2000102/3): 245-250. [百度学术] 

21

CHO J HLEE J MSANG W Cet al.Fault Identification for Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering2005601): 279-288. [百度学术] 

22

GANG XYANG Y PLU S Yet al.Comprehensive Evaluation of Coal-fired Power Plants based on Grey Relational Analysis and Analytic Hierarchy Process[J]. Energy Policy2011395): 2343-2351. [百度学术] 

分享按钮