Vol.25No.4安徽工业大学学报第25卷第4期
October2008
文章编号:1671-7872(2008)04-0417-05
J.ofAnhuiUniversityofTechnology2008年10月
基于神经网络的轧制力预报模型
岳宗敏,王小林
(安徽工业大学计算机学院,安徽马鞍山243002)
摘要:采用了BP神经网络对热轧无缝钢管穿孔过程中轧制力进行预测,在BP算法学习过程中引入了附加动量法和自适应学习速率,结合Levenberg-Marquardt优化方法,加快了学习时的收敛速度,试验证明,取得了良好的学习和测试效果。研究结果可开发新产品和新工艺提供有效的指导。为斜轧穿孔工具设计和工艺调整提供一定的理论依据,对解决生产中出现的实际问题、关键词:轧制力;热轧无缝钢管;BP神经网络;预报模型中图分类号:TP183
文献标识码:B
RollingForceForecastModelBasedonBP-NeuralNetwork
YUEZong-min,WANGXiao-lin
(SchoolofComputerScience,AnhuiUniversityofTechnology,Ma'anshan243002,China)
Abstract:BPneuralnetworkisadoptedtoforecastrollingforceduringproducinghot-rolledseamlesssteeltubes,BParithmeticofintroductionofadditionalmomentumandadaptivelearningrate,combiningLevenberg-Marquardtoptimizationmethodimportinginertiagene,acceleratesthespeedoflearningandgetsthenicerresult.Resultsofthisstudynotonlycanbeusedonthedesignoftools,butalsoissignificativeforequipmentadjustmentandprocessparametersoptimization.Whatismore,itcanbeasatheoriesguideinsolvingcurrentpiercingproblems,exploitingnewseamlesssteeltubeanddesigningnewprocess,simultaneity,itisalsohavesomeuseforreferencefunctiontosolvethesimilarityproblemsinseamlesssteeltubeproduction.
Keywords:rollingforce;hot-rolledseamlesssteeltubes;BPneuralnetwork;forecastmodel
无缝钢管在国民经济建设中具有重要作用,被广泛应用于石油钻探、矿山开采、锅炉管道等领域[1]。斜轧穿孔是无缝钢管生产中的第一道变形工序,也是影响无缝钢管产品质量的主要工序。由于穿孔机的构造复杂,导致工作状态、受力情况的分析也很复杂,目前国内外对斜轧穿孔时力的特性研究很不充分,理论计算出的轧制压力与实际测试的结果相差很大。
文中以某钢管厂Φ=140mm狄舍尔穿孔机组生产情况为研究背景,以热轧无缝钢管生产中穿孔涉及的力能参数为对象。通过测压头对参数进行采集。利用神经网络中的BP算法对数据进行预报。同时对预报结果与传统的数学模型预报结果进行比较,选择一个最有效的预测模型,提高预测精度。继而调整机组工作方式,以期生产出高质量的产品。
1BP神经网络预报理论
1.1BP算法的改进
BP算法实质上是把一组样本输入输出问题化为一个非线性优化问题,并通过梯度算法利用迭代运算求解权值问题的一种算法,已经证明,具有Sigmid非线性函数的3层神经网络可以任意精度逼近任何连续函
数。但是BP算法尚存在易形成局部极小、收敛速度慢等缺点[2]。
为了克服以上缺点,文中采用3种改进的BP算法,即附加动量法、自适应学习速率法和L-M优化方法。
收稿日期:2008-01-10
作者简介:岳宗敏(1977-),男,安徽淮北人,硕士生。
418(1)附加动量法
安徽工业大学学报2008年
Δwij(t+1)=(1-mc)ηδjYi+mcΔwij(t)
式中:t为训练次数;η为学习率,取0.001~0.8;mc为动量因子,一般取0.95左右。
1
(1)
附加动量法的实质是将最后一次权值(阈值)变化的影响,通过一个动量因子来传递。以此方式,当增加了动量项后,促使权值(阈值)的调节向着误差曲面底部的平均方向变化,当网络权值进入误差曲面底部的平坦区时,δj将变得很小,于是,Δwij(t+1)≈Δwij(t),从而防止了Δwij=0的出现,有助于网络从误差曲面的局部极小值中跳出。
(2)自适应学习速率
对于一个特定的问题,要选择适当的学习速率不是一件容易的事情。通常是凭经验或实验获取,但即使这样,对训练开始初期功效好的学习速率,不一定对后来的训练合适。为了解决这一问题,人们自然会想到在训练过程中,自动调整学习速率。通常调节学习速率的准则是:检查权值的修正值是否真正降低了误差函数,如果确实如此,说明选择的学习速率值小,可以对其增加一个量;若不是这样,产生了过调,那么就应该减少学习速率的值。给出了一个自适应学习速率的调整式:
1.05η(k)
η(k+1)=0.7η(k)
!
####\"####$
当SSE(k+1)>SSE(k)当SSE(k+1)<1.04SSE(k)其它
(2)
η(k)
初始学习速率η(0)的选取范围可以有很大的随意性。
(3)Levenberg-Marquardt优化方法
(Levenberg-Marquartdt)算法是在Gauss-Newton法的基础上改进得到的,按照式(3)进行计算:LM
(k)
W(k+1)=W(k)+p(k)(μ)式中:p(k)=-((A(k))TA(k))-1%S(W(k))k=0,1,…
(k)
算法的关键是选取适当的μ>0保证迭代时误差下降,一般采用自适应调整方法。为加快训练速度,当梯
(3)
度|%S(W(k))|<ε就退出寻优过程,其中ε是个小正整数,以免在最优解附近来回震荡消耗时间。输出、隐层神经元数的确定1.2输入、
输入变量的选择要遵守以下原则:
(轧制力)有清晰而明确的关系,能够产生较大的影响。(1)选取的变量与研究的输出变量
(2)选取的变量在实际生产中是可以检测或计算得到。隐层节点的确定方法常用的有式(4),(5)2种:初定隐层节点数的经验公式[3]:
n1=&0.43mn+0.12n2+2.54m+0.77n+0.35+0.51式中:n1为隐层单元数;m为输出层单元数;n为输入层单元数。
R.P.Lippmann提出的隐层估算式[4]:
n1=log2n
式中:n1为隐层单元数;n为输入层单元数。式(5)在数据压缩应用中很有效。
根据经验分析,文中采用式(4)计算隐层节点数。
(4)
(5)
1.3数据的预处理
在建立预测模型之前要对原始数据进行处理,尽量避免大的误差。由于系统是非线性的,初始值对于学习能否达到局部最小和是否能够收敛的关系很大。输入样本需要进行归一化处理,使比较大的输入仍落在激发函数梯度大的地方。要注意的是,对于已位于区间[0,1]的数据,无需进行归一化处理。归一化公式为:
Xi=αXi-min(Xi)+β
max(Xi)-min(Xi)式中:α为归一化系数。文献[5]给出α,β=0.9,β=0.05。1.4数据分割
(6)
在建构预测模式时,只用部分数据建立最初模式,剩余的数据用作测试和评估模式的预测效果。通常将数
第4期
据集分为三部分:
岳宗敏等:基于神经网络的轧制力预报模型419
(1)训练集:主要用来建立最初的预测模式;(2)测试集:主要用于测试模式,并对模式进行修正;
(3)评估集:对同一数据集可以建立不同观测模式,当各个预测模式建构完成后,需要针对不同模式预测
效果进行比较,评佑集是用来评估不同模型的执行效果。
分割后的每一数据集都必须具有代表性。在3个数据集的分配上,Berry&Linoff认为将数据集以60%(训练集):30%(测试集):10%(评估集)的比例分配,建立的模式效果较好[6]。
2传统轧制力计算
轧制力计算基本公式为[7]
P=p1F1+p1F2=p1F
F=F1+F2
区总的接触面积、入口锥接触面积和出口锥接触积mm2。
(7)
式中:p,p1,p2分别为变形区内总的平均单位压力、入口锥与出口锥内平均单位压力,kN/mm2;F,F1,F2为变形
穿孔变形区接触面积用计算法确定,穿孔变形区投影面积形状不规则,因此将整个变形区划分为若干个区段,并将每个区段形状视作梯形计算,即:
#
%%%%%%$%%%%%%&
F1=b1l2=!(bx+bx+1)Δl
21\"2l2=!(bx+bx+1)ΔlF2=b
21
n2
n1
\"1=1b
n\"2=1bn!b
1
n1
x
!b
1
n2
(8)
x
\"1,b\"2为入口锥变形区和出口锥变形区的平均接触宽式中:l1,l2为入口锥变形区长度和出口锥变形区长度;b
度,mm。
3实验结果与分析
3.1理论计算
需要测试穿孔机的轧制力和轧制扭矩的相关参数。管坯直径140mm;入口锥变形长度130mm;出口锥变形长度150mm;过渡带长度20mm;轧辊喉距116mm;导板间距145mm;前进角14.5°;纵向速比3.33;顶头规格130mm;顶伸量150mm;延伸系数3.092;椭圆度1.139;轧辊速度0.45r/min。
在生产现场测试的数据记录(部分)如表1。
根据式(7),(8),代入相关的数据,可以得出相应的计算结果,如表2。
表1实测数据记录表
序号钢管温度/℃轧辊速度/(r/min)
相对压下率/%送进角度/(°)穿孔前直径/mm平均总轧制力/kN
1
234567891011121145117611301197123412581264127012541181129212170.450.450.450.500.500.500.500.500.400.400.400.409.179.238.348.658.799.469.258.428.579.219.388.88999913131313151515151601601701701701551601601501551501501385.751351.161446.281382.491323.321200.841165.371112.821041.751269.41958.191017.53
4203.2
BP神经网络预报
(1)输入输出节点的确定与数据分集
安徽工业大学学报
表2轧制力理论计算结果
序号
总轧制力/kN
序号
2008年
总轧制力/kN
根据1.2节选择变量的原则从生产现场实测数据1中选取与轧制力影响较大的输入因子:送进角度、穿孔2前直径、入口温度、机架速度、变形参数。输出变量为轧制力。实际测得106组数据,要求对热轧无缝钢管穿孔过程中轧制力进行预测。根据数据分割原则,本实验中数据集分为训练集64组、测试集30组、评估集12组。
3456
1315.861261.371416.241396.191383.461230.17
789101112
1315.151262.121175.841201.341210.351102.61
(2)隐层数及隐层节点数
逼近问题。轧制BP网络通常有一个或多个隐层。一个3层人工神经网络模型就可解决一般函数的拟合、力预测实际上就是函数拟合问题,因此,3层BP神经网络能够满足要求。
隐层节点数的确定,参考式(4),根据3≤η1≤12的计算值,利用试错法由小到大改变节点数,建立了隐层节点数从1到12的BP网络,训练并检验其精度,当节点数的增加误差不进一步减小时,其临界值即为应采用的数值。图1显示了训练次数为1000次,期望误差取0.0001,训练速率选为0.05的情况下,网络性能随隐层节点数变化的趋势。在训练过程中,无论是训练样本还是测试样本,开始时都是均方差随隐层节点的增加而上下波动;接着,训练样本和测试样本的误差相对稳定;随着隐层节点数的继续增加,训练样本和测试样本的均方差再次随隐层节点的增加而上下波动。最后,经过网络的实际训练结果比较,选定网络隐含层节点数为6,此时网络能较快地收敛至所要求的精度。
训练算法(3)激发函数、
在以预报为目的的BP模型中,激发函数常采用
均方误差×10-3sigmoid函数。训练算法采用1.1节中改进的LM算法。
(4)实验结果
本实验在BP网的基础上,建立了优化的BP网络。
该网络有3层结构:输入层有5个输入因子、隐层有6个输入因子、输出层有1个输出因子;激发函数为
1.61.41.21.00.60
2
4
6
8
测试样本
训练样本
sigmoid函数;训练算法:LM算法。以此对研究的实例
进行拟合和预测,训练不到100次,网络输出即满足要求,训练样本的平均拟合误差小于5%。图2显示了优的情况。
最后,用评估集对上述模型进行评估(预测结果如表3)
归一化后的轧制力1012
隐层节点数
图1BP网络训练误差曲线
化的BP网络模型经测试集测试的结果与真实值对比
1.00.80.60.40.20
5
图2表3
轧制力预测值
轧制力实际值
3.3误差分析
评价一个预测系统好坏的最直接方法是计算预测值与真实值之间的误差大小,根据表2,3数据列出了轧制力的理论计算值和BP网络预测值与真实值之间的绝对误差与相对误差(表4)。
从表4可以看出,轧制力理论计算的相对误差最小为1.0%,最大为26.3%,平均绝对误差为94.3,平均相对误差为8.4%。BP网络预测的相对误差最小为
序号
1015202530
测试样本序号
BP网络轧制力预报与实况比较轧制力BP网络预测结果
序号
总轧制力/kN
总轧制力/kN
1234561392.351359.681462.511410.231316.331212.297891011121159.641131.781067.821252.19978.761034.140.5%,最大为2.5%,平均绝对误差为15.2,平均相对
误差为1.3%。无论是平均绝对误差还是平均相对误差,轧制力的BP网络据预测方法都要比理论计算方
第4期法小。
岳宗敏等:基于神经网络的轧制力预报模型421
表4两种预测方案的误差分析
序数
理论计算绝对误差
123456789101112
-69.9-89.8-30.013.760.129.3149.8149.3134.168.1-252.285.1
BP网络预测绝对误差理论计算相对误差/%BP网络预测相对误差/%
6.60.55.08.516.227.7-7.011.5-5.719.026.1-17.220.616.6
1500
14001300120011001000900
6.62.11.04.52.412.913.412.95.426.38.4
0.61.12.00.51.00.51.72.51.42.11.6
3.4结果分析
值进行比较,结果如图3所示。
从图3可以看出,对于文中同一实测数据,基于BP网络的轧制力预报精度明显高于传统的轧制理论计算公式的精度。
轧制力/kN对表2的轧制力理论计算值与表3的BP网络预测
123456789101112
测试样本序号
实际测量值
理论计算值
4结论
BP网络预测值
(1)同一批数据基于BP网络的无缝钢管在穿孔过程
(0%~3%)明显高于传统计中轧制力模型的预报精度
图3轧制力实测值、理论计算值和BP网络预报值误差比较图
算公式的精度(0%~27%),可以满足工程计算的精度要求,将神经网络用来预报轧制力是可行的。
(送进角度、穿孔前直(2)在建立神经网络轧制力模型时,选择与传统数学模型基本一致的轧制力影响因素
径、入口温度、机架速度、变形参数)作为输入变量,既能够比较真实地反映实际轧制过程特性又能使模型简单实用。
(3)选择适当的网络初始权值对于网络的性能有很大的影响。神经网络预报精度受学习样本条件的,
样本“质量”和数量直接影响预报结果,对于初始样本要进行适当的选择和预处理。还要注意神经网络相关因素的合理设定和选取。
参考文献:
[1]成海涛.我国无缝钢管行业的现状分析[J].钢管,2006,35(3):1-6.
[2]YasunoriKatayama,MasakiNakajimaHiroshiKoyama.Aneuralfuzzycontrolsystemforrollingmills[J].SteelTechnologyInternational,1992,7:189-196.
[3]高大启.有教师的线性基本函数前向三层神经网络结构研究[J].计算机学报,1998(1):80-85.[4]蒋先刚.基于Delphi的数字图像处理工程软件设计[M].北京:中国水利水电出版社,2006:179-181.[5]陈桂明,戚红雨,潘伟.MATLAB数理统计(6.x)[M].北京:科学技术出版社,2002:23-28.[6]张阿兰,戴稳胜,谢邦昌.数据挖掘任务之二:预测[J].中国统计,2004(11):49-53.
[7]BrownJW,Riekotakehira,KleinM.MaximizingRollingTensionandRollingWrestatPiercingprocess[C]//GeometryProcof1994ICECPurdueUniversity,WestLaffette,USA,1996:205-210.