輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法_第1頁
輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法_第2頁
輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法_第3頁
輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法_第4頁
輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法_第5頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、輪對(duì)壓裝曲線中異常點(diǎn)數(shù)據(jù)的處理方法肖 峻,李光海,韓建斌(武漢理工大學(xué) 機(jī)電工程學(xué)院,湖北 武漢 430070)摘 要:為了去除輪對(duì)壓裝壓力信號(hào)中的異常點(diǎn),獲得真實(shí)的壓裝曲線,提出了一種異常點(diǎn)數(shù)據(jù)處理算法-增量均值法,該算法結(jié)合壓裝壓力信號(hào)的特點(diǎn),能較好的識(shí)別并剔除異常點(diǎn)數(shù)據(jù)。經(jīng)過在輪對(duì)壓裝過程中的實(shí)際應(yīng)用,該算法收到了較好的效果,消除了干擾對(duì)輪對(duì)壓裝曲線的影響,減少了對(duì)壓裝質(zhì)量的誤判。關(guān)鍵詞:輪對(duì)壓裝曲線;異常點(diǎn);增量均值法中圖分類號(hào): TP301.65輪對(duì)是機(jī)車和車輛走行部的主要部件之一,是由一根車軸與兩個(gè)車輪以及齒輪、制動(dòng)盤等組成的完整裝置。車軸與車輪、齒輪、制動(dòng)盤采用過盈配合的連接方式

2、,通過壓裝的方法組成輪對(duì)。在輪軸壓裝過程中,壓裝曲線(即壓力-位移曲線)是反映壓裝質(zhì)量的重要評(píng)判依據(jù)。在目前廣泛使用的數(shù)控輪對(duì)壓裝機(jī)中,壓裝壓力信號(hào)是由計(jì)算機(jī)數(shù)據(jù)采集系統(tǒng)采集到的一系列具有固定時(shí)間間隔(采樣頻率固定)的數(shù)字時(shí)序信號(hào)。理想情況下,采集到的數(shù)字時(shí)序信號(hào)與壓裝過程中的壓裝壓力是一致的,但是由于實(shí)際應(yīng)用場(chǎng)合存在一定的干擾(突變的電、磁場(chǎng)或其它因素),使采集到的壓力數(shù)字時(shí)序信號(hào)夾雜有信號(hào)突變,即異常點(diǎn)。這些異常點(diǎn)并不能反映油缸壓力的真實(shí)變化,如果不對(duì)其加以剔除,會(huì)使壓裝曲線失真,造成對(duì)壓裝質(zhì)量的誤判。1 異常點(diǎn)對(duì)壓裝曲線的影響以某一臺(tái)數(shù)控輪對(duì)壓裝機(jī)為例,其壓裝 曲線是通過壓力傳感器和位移

3、傳感器采集到的數(shù)據(jù)經(jīng)過數(shù)字濾波后繪制的。圖1為某一輪對(duì)中左輪的壓裝曲線,曲線在壓裝位移大約42mm處出現(xiàn)了降噸凹槽,依據(jù)TB/T1718-2003鐵道車輛輪對(duì)組裝技術(shù)條件中關(guān)于輪對(duì)壓裝的判斷標(biāo)準(zhǔn),此車輪壓裝不合格。為了尋找造成該現(xiàn)象的原因,需要對(duì)采集信號(hào)做進(jìn)一步的分析。圖1 某一輪對(duì)的壓裝曲線在壓力-位移曲線中,將出現(xiàn)降噸凹槽的部分放大顯示,如圖2所示,可以看到,在42mm之前,壓力信號(hào)勻速上升,之后,有3個(gè)數(shù)據(jù)()陡然變化,由300kN降到數(shù)據(jù)(270kN),然后又急速上升到(281kN),再急速上升到(296kN)。然而,反映壓裝過程中壓裝壓力收稿日期:作者簡(jiǎn)介:肖峻(1964),男,湖北

4、武漢人,武漢理工大學(xué)機(jī)電工程學(xué)院教授;博士.基金項(xiàng)目:湖北省科學(xué)技術(shù)研究與開發(fā)基金項(xiàng)目(201097289).的動(dòng)態(tài)壓力信號(hào)是連續(xù)變化的,經(jīng)過等間隔的數(shù)據(jù)采集后獲得的壓力時(shí)序信號(hào),其數(shù)據(jù)間的變化不應(yīng)該有突變。因而,可以斷定,此處數(shù)據(jù)的急速突變并不是壓裝過程中壓力變化的真實(shí)反映,而是干擾數(shù)據(jù)點(diǎn),應(yīng)該加以剔除。圖2 信號(hào)突變位置2 數(shù)據(jù)異常點(diǎn)的挖掘方法異常點(diǎn)產(chǎn)生有很多原因,根據(jù)不同的角度,可以將異常點(diǎn)分為如圖3所示的幾種類型。圖3 異常點(diǎn)分類目前,比較常用的異常點(diǎn)挖掘方法有以下幾大類:(1) 基于統(tǒng)計(jì)模型的挖掘方法基于統(tǒng)計(jì)模型的異常點(diǎn)挖掘方法,其思想主要來自于統(tǒng)計(jì)學(xué),統(tǒng)計(jì)中常用的方法是:對(duì)于給定的

5、數(shù)據(jù)集合,先假設(shè)一個(gè)分布 (例如一個(gè)正態(tài)分布),然后根據(jù)該分布模型,采用不一致的原則對(duì)異常點(diǎn)進(jìn)行檢驗(yàn)挖掘。這種方法的缺陷在于,需要事先知道數(shù)據(jù)集數(shù)據(jù)模型、分布參數(shù)和估計(jì)的異常點(diǎn)的數(shù)目。由于統(tǒng)計(jì)學(xué)方法要求預(yù)先知道關(guān)于數(shù)據(jù)集合參數(shù)的知識(shí),例如數(shù)據(jù)分布,但許多情況下,數(shù)據(jù)分布是未知的,尤其是在沒有特定檢驗(yàn)的情況下,統(tǒng)計(jì)學(xué)方法不能發(fā)現(xiàn)所有的異常點(diǎn),或者觀察到的分布情況過于特殊,不能用標(biāo)準(zhǔn)分布來建模描述。(2) 基于距離模型的挖掘方法基于距離的異常點(diǎn)DB(p,d)的定義:如果數(shù)據(jù)集合中至少有p部分對(duì)象與對(duì)象O的距離大于d,則對(duì)象O是一個(gè)帶參數(shù)p、d的基于距離的異常點(diǎn),即DB(p,d)。由上面關(guān)于異常點(diǎn)的

6、定義可看出,DB(p,d)統(tǒng)一了異常點(diǎn)的概念,對(duì)異常點(diǎn)的判斷方法也比較明確,例如,設(shè)存在一個(gè)正態(tài)分布數(shù)據(jù)集,如果數(shù)據(jù)集中存在與均值之間的距離大于或等于3倍偏差的數(shù)據(jù)對(duì)象,則被認(rèn)為是異常點(diǎn)。直觀而言,如果不依賴于統(tǒng)計(jì)檢驗(yàn),可將基于距離的異常點(diǎn)看作是那些沒有足夠多鄰居的對(duì)象,此處鄰居是基于給定對(duì)象之間的距離定義的目前,該領(lǐng)域研究人員提供了若干高效的基于距離的異常點(diǎn)挖掘算法,比較有代表性的是基于索引的算法、嵌套循環(huán)算法和基于單元的算法,這些算法的主要特點(diǎn)是以對(duì)象間的距離作為相似性度量?;诰嚯x模型的異常點(diǎn)挖掘方法概括了基于統(tǒng)計(jì)模型的異常點(diǎn)的含義,并且對(duì)相對(duì)高維數(shù)據(jù)集有較好的挖掘效果,然而,當(dāng)數(shù)據(jù)集由

7、不同密度的子集混合而成時(shí),基于距離的異常點(diǎn)挖掘效果不好。(3) 基于密度模型的挖掘方法Hawkwins異常點(diǎn)的定義如下:異常點(diǎn)是明顯地偏離了其他測(cè)量值,使人們對(duì)其真實(shí)性產(chǎn)生懷疑,懷疑它的產(chǎn)生機(jī)理的點(diǎn)。如圖4所示,為一個(gè)二維數(shù)據(jù)集的例子,該數(shù)據(jù)集包含兩個(gè)聚類C1、C2和兩個(gè)異常點(diǎn)O1、O2,雖然O1、O2都為異常點(diǎn),但是有區(qū)別的,O1是局部異常點(diǎn),O2是全局異常點(diǎn)。根據(jù)上面提到的算法,O2異常點(diǎn)特征明顯,容易挖掘,但O1異常點(diǎn)卻比較難挖掘出來。圖4一個(gè)二維數(shù)據(jù)集從上面的例子可看出,基于距離的異常點(diǎn)定義DB(p,d)在一些特定的情況下是準(zhǔn)確和充分的,但如果數(shù)據(jù)聚類密度存在不同的單元,就會(huì)出現(xiàn)問題。

8、為了有效的解決這個(gè)問題,基于密度模型的局部異常點(diǎn)挖掘算法被提出,從而保證可以判斷出O1和O2在數(shù)據(jù)集中都是異常點(diǎn)。基于密度的診斷方法引入了度量單位:局部離群系數(shù),來表示一個(gè)數(shù)據(jù)集中數(shù)據(jù)的離群程度,正常數(shù)據(jù)的基本上都近似等于1,所以它們不是異常點(diǎn)。根據(jù)局部異常點(diǎn)的定義及其特征,可通過對(duì)數(shù)據(jù)集中的計(jì)算來確定異常點(diǎn),只要一個(gè)數(shù)據(jù)對(duì)象的遠(yuǎn)大于1,它很有可能是一個(gè)異常點(diǎn),應(yīng)該引起注意或者加以排除。但是,基于密度的診斷方法仍然存在一定的問題,在數(shù)據(jù)量較大時(shí),處理時(shí)間比較長(zhǎng),效率比較低。(4) 基于相似度的挖掘方法數(shù)據(jù)集的相似度隨應(yīng)用領(lǐng)域的不同,相似度的定義也不同。例如,兩個(gè)量的變化速度(斜率描述)保持一致

9、;波形允許在一定范圍內(nèi)漂移、伸縮。這種診斷方法,可以大大的減少計(jì)算量,提高效率。但相似度的確定是一個(gè)難點(diǎn)。3 增量均值法在介紹增量均值法之前,先給出以下定義:定義1(時(shí)間序列)時(shí)間序列是一組或多組由記錄時(shí)間和記錄值共同組成的元素有序集合,記為X=,,元素表示時(shí)間序列在時(shí)刻的記錄值為,記錄時(shí)間是嚴(yán)格增加的。在本文所采用的壓力數(shù)據(jù)采集系統(tǒng)中,時(shí)間序列的采樣間隔相等(采樣周期為70ms),可以認(rèn)為,此時(shí)將壓力信號(hào)時(shí)間序列簡(jiǎn)記為。用代表時(shí)間序列中的第各元素。定義2(元素距離)元素與元素的距離是指它們的序列號(hào)之差的絕對(duì)值,記為。定義3(鄰域)壓力信號(hào)時(shí)間序列中的元素的鄰域是指以元素為中心,與的距離不超過

10、的所有元素的集合,記為。定義4(壓力增量絕對(duì)值)指壓力信號(hào)時(shí)間序列中的元素相對(duì)于其前一個(gè)采樣點(diǎn)的變化量的絕對(duì)值,記為。正常情況下,壓力信號(hào)是連續(xù)均勻變化的,相鄰數(shù)據(jù)的變化量在一定的范圍內(nèi)。以上述車輪的壓力數(shù)據(jù)為例,將壓力數(shù)據(jù)中相鄰元素的壓力增量絕對(duì)值計(jì)算出來,如圖5所示,橫坐標(biāo)為元素序列編號(hào),縱坐標(biāo)為元素相對(duì)于其前一個(gè)元素的增量絕對(duì)值。從圖5中可以看出,正常情況下,壓力增量絕對(duì)值在一定的范圍微小波動(dòng),當(dāng)有外界干擾時(shí),壓力增量絕對(duì)值陡增,超出了正常的波動(dòng)范圍(10kN左右)。因此,可以通過設(shè)定適當(dāng)?shù)膲毫υ隽拷^對(duì)值閾值來識(shí)別異常點(diǎn)。當(dāng)時(shí),則認(rèn)為為壓力數(shù)據(jù)序列中的異常點(diǎn),應(yīng)加以剔除。由此可見,的取值

11、是非常關(guān)鍵的。取值過小,剔除效果不明顯,異常點(diǎn)對(duì)壓裝曲線的影響大,從而可能導(dǎo)致壓裝質(zhì)量的誤判。取值過大,則有可能將反映壓裝過程的真實(shí)壓力數(shù)據(jù)剔除,造成壓裝曲線失真。圖5 壓力變化量分布增量均值法定義:對(duì)于壓力時(shí)序信號(hào)中的元素,求出其鄰域內(nèi)所有元素壓力增量絕對(duì)值的均值,再乘以系數(shù)來確定閾值,當(dāng)時(shí),則認(rèn)為為壓力時(shí)序信號(hào)中的異常點(diǎn),應(yīng)加以剔除。和用公式表示為:式中:為經(jīng)驗(yàn)取值系數(shù),值的確定可以通過多次的試驗(yàn)來獲得。信號(hào)中的異常點(diǎn)去除后,可用該異常點(diǎn)前面的數(shù)據(jù)加上增量均值替代,即:。經(jīng)過對(duì)大量壓裝壓力數(shù)據(jù)的試驗(yàn)分析,最終確定,可以得到最佳的剔除效果。4 實(shí)驗(yàn)結(jié)果分析對(duì)上述車輪帶有干擾的壓裝壓力數(shù)據(jù)進(jìn)行

12、測(cè)試,圖6為對(duì)壓力數(shù)據(jù)中干擾區(qū)域的檢測(cè)結(jié)果,型點(diǎn)為檢測(cè)到的異常點(diǎn)。可以看到,增量均值法對(duì)壓裝壓力數(shù)據(jù)中的異常點(diǎn)剔除效果很好,特別是那些變化幅度很大,影響到壓裝曲線判斷的異常點(diǎn),得到了有效的消除。圖6壓裝壓力信號(hào)中異常點(diǎn)的檢測(cè)結(jié)果異常點(diǎn)剔除后,再對(duì)壓裝壓力數(shù)據(jù)進(jìn)行簡(jiǎn)單的滑動(dòng)平均處理,異常點(diǎn)對(duì)壓裝曲線的影響便被基本消除,壓裝曲線得到了正確的修正。修正后上述車輪的壓裝曲線如圖7所示。圖7 處理后上述車輪的壓裝曲線5 結(jié)論從以上的分析可以看出,增量均值法對(duì)輪對(duì)壓裝壓力數(shù)據(jù)中的異常點(diǎn)剔除效果明顯。增量均值法是在萊茵達(dá)法的基礎(chǔ)上總結(jié)出來的一種新的剔除異常點(diǎn)的方法,其計(jì)算方法簡(jiǎn)便,易于計(jì)算機(jī)編程。經(jīng)過在輪對(duì)

13、壓裝過程中的實(shí)際應(yīng)用,收到了較好的效果,消除了由于干擾造成的對(duì)壓裝質(zhì)量的誤判。參考文獻(xiàn):1 鄭東.鐵路貨車輪對(duì)壓裝曲線記錄儀的 研制D.成都:西南交通大學(xué),2003.6.2 TBT 1463-2003,機(jī)車輪對(duì)組裝技術(shù)條件 S.3 朱明.數(shù)據(jù)挖掘M.合肥:中國(guó)科技大學(xué) 出版社,2002.4 詹艷艷,陳曉云,徐榮聰.基于時(shí)間序列模式表示的異常檢測(cè)算法J.計(jì)算機(jī)應(yīng)用研究,2007,24(11):78-79.5 詹艷艷,徐榮聰.時(shí)間序列異常模式的k-均距異常因子檢測(cè)J.計(jì)算機(jī)工程與應(yīng)用,2009,45(9):141-145.6 楊世杰.動(dòng)態(tài)測(cè)試數(shù)據(jù)中壞點(diǎn)處理的一種新方法-絕對(duì)均值法及應(yīng)用研究J.中國(guó)

14、測(cè)試技術(shù),2006,32(1):48-49.7 何平.剔除測(cè)量數(shù)據(jù)中異常值的若干方 法J.航空計(jì)測(cè)技術(shù),1995(01):19-22.8 薛年喜.MATLAB在數(shù)字信號(hào)處理中的 應(yīng)用M.北京:清華大學(xué)出版社,2003.9 鄭斌祥,席裕庚,杜秀華.基于離群指數(shù)的時(shí)序數(shù)據(jù)離群挖掘J.自動(dòng)化學(xué)報(bào),2004,30(1):71-76.10 高品賢.測(cè)試信號(hào)分析處理方法與程序M.成都:西南交通大學(xué)出版社,1999.A new algorithm for removing outliers from press fitting curveXIAO Jun, LI Guanghai, HAN JianbinAbstract: In order to remove outliers from press signals acquired in press fitting process, obtain true press fitting curve, a new algorithm, incremental mean algorithm is presented in this paper. According to the traits of press signals, the algorithm can distinguish

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論