




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 基于matlab的就業(yè)數(shù)據(jù)的聚類分析 鄒全+常程威+賈月月摘 要: 根據(jù)2010年到2013年我院校大學(xué)生就業(yè)情況,對大學(xué)生的就業(yè)數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)分析有很多方法,本文主要采用譜系聚類、k均值聚類、模糊c均值聚類三種聚類方法,并得出了結(jié)論。關(guān)鍵詞: matlab 聚類分析 就業(yè)數(shù)據(jù)隨著中國高校教育的發(fā)展,大學(xué)生人數(shù)急劇增加,就業(yè)問題日益突出,大學(xué)生就業(yè)難的問題已成為社會熱點、難點。根據(jù)2010年到2013年近四年我院校大學(xué)生就業(yè)情況,對大學(xué)生的就業(yè)數(shù)據(jù)進(jìn)行聚類分析。根據(jù)就業(yè)數(shù)據(jù)可以對學(xué)生選擇就讀的專業(yè)及學(xué)校本科辦學(xué)提供一定的參考價值。聚類分
2、析是多元統(tǒng)計分析的一種,也是非監(jiān)督模式識別的重要分支,在模式分類、圖像處理和模糊規(guī)則處理等眾多領(lǐng)域獲得最廣泛應(yīng)用。它把一個沒有類別標(biāo)記的樣本集按某種準(zhǔn)則劃分為若干個子集(類),使相似樣本盡可能歸為一類,而將不相似樣本盡量劃分到不同類中。收集和整理2010年到2013年這四年我院校的就業(yè)數(shù)據(jù),對就業(yè)數(shù)據(jù)中的就業(yè)率、考研升學(xué)率和男女生首次平均月收入進(jìn)行matlab編程,得出散點圖,并進(jìn)行分析。對就業(yè)數(shù)據(jù)中畢業(yè)生的就業(yè)流向分別采用譜系聚類、k均值聚類和模糊c均值聚類三種聚類分析方法進(jìn)行分析。如表1。1.譜系聚類算法的步驟譜系聚類首先將每個樣品看成一類,然后把最相似的樣品聚為一小類,再將已聚類的小類按
3、各類之間的相似性進(jìn)行再聚類,隨著相似度減弱,最后將一切子類都聚為一大類,從而得到一個按相似度大小聚集起來的譜系圖1。利用譜系聚類算法對表1的就業(yè)流向數(shù)據(jù)進(jìn)行聚類分析。將數(shù)據(jù)分成3類,從程序輸出的結(jié)果得出結(jié)論,共可分成3類,常州單獨為一類,南京、蘇州、無錫為一類,剩下的鎮(zhèn)江、揚州、南通之類的歸為一類。也就是說,很多外地畢業(yè)生就在常州發(fā)展,很大一部分畢業(yè)生去南京、蘇州、無錫工作,還有一小部分畢業(yè)生去了鎮(zhèn)江、揚州、南通,還有省外等地。2.k均值聚類算法的步驟譜系聚類法是先將每一個樣品看成一類,通過比較距離的大小逐步擴(kuò)充類,因此,對于給定的數(shù)據(jù),譜系聚類一定能將樣品合并成為一類,分類結(jié)果唯一,但譜系聚
4、類有一個缺點,就是樣品一旦被分到某一類中就不能改變了,且當(dāng)樣品容量較大時,計算量相應(yīng)變大??朔@一缺點的辦法就是k均值聚類法,又稱之為快速聚類法或動態(tài)聚類法。利用k均值聚類算法對表1的就業(yè)流向數(shù)據(jù)進(jìn)行聚類分析。從圖1可知,將地區(qū)分成3類。為一類,分別表示常州、蘇州、南京、無錫;一類,分別表示省外、鎮(zhèn)江、揚州;為一類,表示剩下的幾個地區(qū),如鹽城、南通、泰州、宿遷等。換句話說,大部分畢業(yè)生選擇在蘇南地區(qū)工作,一部分畢業(yè)生選擇去省外,如上海和鎮(zhèn)江、揚州工作,只有少數(shù)一部分人選擇去淮安、宿遷、鹽城等地工作。3.模糊c均值聚類算法的步驟模糊聚類得到了樣本屬于各個類別的不確定性程度,表達(dá)了樣本類屬的中介性
5、,即建立起了樣本對類別的不確定性描述,能更客觀地反映現(xiàn)實世界,從而成為聚類分析研究的主流2。采用模糊c均值聚類算法對表1的就業(yè)流向數(shù)據(jù)進(jìn)行分析。從輸出聚類的結(jié)果來看,常州、南京、蘇州、無錫這四個城市為一類,表示很大一部分畢業(yè)生愿意在這幾個城市發(fā)展;鎮(zhèn)江、揚州、省外三地為一類,表示有一部分畢業(yè)生選擇在這些地方發(fā)展;剩下的如南通、鹽城、泰州等七個城市為一類,說明少部分人愿意去這些城市工作發(fā)展。4.三種聚類算法對就業(yè)流向的分析結(jié)論從三種聚類算法的結(jié)果可以看出,譜系聚類算法與k均值聚類算法和模糊c均值聚類兩種算法的聚類結(jié)果不同。通過比較可以看出,譜系聚類算法的結(jié)論不是很理想。k均值聚類算法得出的散點圖更直觀地表現(xiàn)了數(shù)據(jù)的聚類,所以k均值聚類算法更好一些。通過對就業(yè)流向的聚類分析,可以看出極大一部分畢業(yè)生選擇在江蘇經(jīng)濟(jì)發(fā)達(dá)地區(qū)工作,如蘇州、南京、無錫、常州這些城市,其中由于我院校在常州,因此很大一部分畢業(yè)生愿意留在這個生活了四年的地方工作。畢竟在大城市的選擇和發(fā)展機(jī)會都比較多。還有一部分畢業(yè)生選擇在鎮(zhèn)江、揚州和省外如上海等地工作。只有少數(shù)一部分人愿意去如泰州、鹽城、宿遷等地工作。參考文獻(xiàn):1吳志遠(yuǎn),王遠(yuǎn)干.大學(xué)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動控制系統(tǒng)【直流】課設(shè)指導(dǎo)書-野瑩瑩要點
- 設(shè)備費用核算管理
- 財務(wù)會計綜合考試試卷 (一)
- 2024年中考押題預(yù)測卷02(武漢卷)-道德與法治(考試版)A3
- 2024-2025學(xué)年下學(xué)期高一生物滬科版期末必刷??碱}之有性生殖中的遺傳信息傳遞
- 建筑施工特種作業(yè)-高處作業(yè)吊籃安裝拆卸工真題庫-1
- 山東社區(qū)招聘題目及答案
- 剖切面的種類與剖切方法2
- 2023-2024學(xué)年山東省青島市膠州市高二下學(xué)期期末學(xué)業(yè)水平檢測數(shù)學(xué)試題(解析版)
- 2023-2024學(xué)年湖北省新高考聯(lián)考協(xié)作體高二下學(xué)期7月期末考試數(shù)學(xué)試題(解析版)
- 部編人教版小學(xué)語文1-6年級詞語表
- 測繪類技術(shù)設(shè)計管理制度
- 中醫(yī)艾灸盒課件下載
- 浙江省溫州市名校2025屆七下數(shù)學(xué)期末考試試題含解析
- 《鐵路旅客運輸組織(活頁式)》課件 7.3 旅客傷害應(yīng)急處置
- 公司合同月結(jié)協(xié)議書
- 2025年海綿項目評估報告
- 農(nóng)村生活污水治理專項施工方案
- GB/T 45545-2025廚房家具配合尺寸
- 臨床血標(biāo)本采集錯誤事件的根因分析
- 夫妻承諾書合同協(xié)議
評論
0/150
提交評論