食品價(jià)格變動分析及預(yù)測模型.doc_第1頁
食品價(jià)格變動分析及預(yù)測模型.doc_第2頁
食品價(jià)格變動分析及預(yù)測模型.doc_第3頁
食品價(jià)格變動分析及預(yù)測模型.doc_第4頁
食品價(jià)格變動分析及預(yù)測模型.doc_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

食品價(jià)格變動分析及預(yù)測模型摘 要 本文主要對北京、上海和西安三個(gè)城市的主要食品價(jià)格進(jìn)行了分析與預(yù)測。 針對問題一,由于題目所給的主要食品種類較多,首先將其進(jìn)行分類。以近期50個(gè)城市主要食品每十天平均價(jià)格的漲跌幅為指標(biāo),利用SPSS軟件,采用系統(tǒng)聚類法中的最小距離法,將漲跌幅變化相近的食品分為一類,得到六個(gè)分類,分別為:豆角,黃瓜,西紅柿,大白菜,油菜,其它食品;根據(jù)分類結(jié)果以及北京、上海和西安三個(gè)城市的主要食品的平均價(jià)格數(shù)據(jù),利用Excel對三個(gè)城市的每類食品的平均價(jià)格繪制折線圖,分析得到三個(gè)城市的每類食品價(jià)格變動特征間的差異(見文中表1)。針對問題二,由于三個(gè)城市數(shù)據(jù)量較少,利用灰色系統(tǒng)可以利用少量數(shù)據(jù)進(jìn)行短期預(yù)測的特點(diǎn),借鑒灰色系統(tǒng)GM(1,1)模型。利用問題一所得到的分類,對三個(gè)城市的六類食品2014年812月份的價(jià)格進(jìn)行預(yù)測。六類食品分別以豆角,黃瓜,西紅柿,大白菜,油菜,豬肉為代表,取其17月每月的平均價(jià)格數(shù)據(jù)為原始數(shù)列,利用MATLAB軟件編程計(jì)算出112月每類食品的預(yù)測價(jià)格,根據(jù)預(yù)測的數(shù)據(jù)利用Excel繪制折線圖,分析得到2014年812月份,三個(gè)城市六類食品中豆角、黃瓜、西紅柿、油菜、豬肉的價(jià)格走勢均是下降的;大白菜的價(jià)格走勢是上升的。上海市油菜的價(jià)格走勢是上升的,北京市和西安市油菜的價(jià)格走勢是下降的。 針對問題三,首先采用50個(gè)城市主要食品每十天的平均價(jià)格數(shù)據(jù),利用主成分分析法,分析得出27種主要食品中對居民消費(fèi)水平影響較大的有13種,分別為第8、9、15、16、17、19、20、21、22、23、24、25、27種食品。得出結(jié)論:可以通過監(jiān)測盡量少的食品種類價(jià)格相對準(zhǔn)確地計(jì)算、預(yù)測居民消費(fèi)者價(jià)格指數(shù)。其次根據(jù)所查詢到北京、上海和西安三個(gè)城市的每類食品的平均價(jià)格數(shù)據(jù),運(yùn)用主成分分析法,分析得出對居民消費(fèi)影響較大的食品種類個(gè)數(shù)分別為4種、6種、7種。由此可知,在相同的精度下,不同城市的食品的主成分的種類以及種類數(shù)目不一致。最后對模型進(jìn)行了評價(jià)與推廣。關(guān)鍵詞 譜系聚類法;灰色預(yù)測模型;主成分分析法;MATLAB軟件 一、問題重述全國居民消費(fèi)價(jià)格指數(shù)是根據(jù)與居民生活有關(guān)的產(chǎn)品及勞務(wù)價(jià)格統(tǒng)計(jì)出來的物價(jià)變動指標(biāo),通常作為觀察通貨膨脹水平的重要指標(biāo),反映居民家庭購買生活消費(fèi)品和支出服務(wù)項(xiàng)目費(fèi)用價(jià)格變動趨勢和程度的相對數(shù)。其目的在于觀察居民生活消費(fèi)品及服務(wù)項(xiàng)目價(jià)格的變動對城鄉(xiāng)居民生活的影響,為各級黨政領(lǐng)導(dǎo)掌握居民消費(fèi)狀況,研究和制定居民消費(fèi)價(jià)格政策、工資政策以及為新國民經(jīng)濟(jì)核算體系中有消除價(jià)格變動因素的不變價(jià)格核算提供科學(xué)依據(jù)。食品價(jià)格是居民消費(fèi)價(jià)格指數(shù)的重要組成部分,食品價(jià)格波動直接影響居民生活成本和農(nóng)民收入,是關(guān)系國計(jì)民生的重要戰(zhàn)略問題。2000年以來,我國城鎮(zhèn)居民家庭食品消費(fèi)支出占總支出的比重一直維持在36%以上。在收入增長緩慢的情況下,食品價(jià)格上漲將使人民群眾明顯感到生活成本增加,特別是食品價(jià)格上漲將降低低收入群體的生活質(zhì)量。為監(jiān)測食品價(jià)格的實(shí)際變化情況,國家統(tǒng)計(jì)部門將會定期統(tǒng)計(jì)每個(gè)城市主要食品價(jià)格變動情況。 請根據(jù)附件所給資料,并自行查找上海、北京和西安等城市的相關(guān)資料,建立數(shù)學(xué)模型解決以下問題:1.根據(jù)相關(guān)統(tǒng)計(jì)網(wǎng)站的數(shù)據(jù),分析三個(gè)城市主要食品價(jià)格變動特征間的差異。2.分別給出三個(gè)城市2014年8-12月份食品價(jià)格走勢的預(yù)測結(jié)果。3.目前統(tǒng)計(jì)部門需要監(jiān)測大量食品價(jià)格變動情況以計(jì)算居民消費(fèi)者價(jià)格指數(shù)變動情況,能否僅僅通過監(jiān)測盡量少的食品種類(這里,食品種類是指附件1表格中的商品名稱,可以認(rèn)為每一種商品名稱即為一種食品種類)價(jià)格即能相對準(zhǔn)確地計(jì)算、預(yù)測居民消費(fèi)者價(jià)格指數(shù)?在同樣精度要求下,三個(gè)城市所選取的食品種類以及種類數(shù)目是否一致?二、問題分析針對問題一:該問題討論的是三個(gè)城市主要食品價(jià)格變動特征間的差異。價(jià)格變動可以用價(jià)格的漲跌幅來衡量。首先以近期全國50個(gè)城市主要食品平均價(jià)格變動情況的數(shù)據(jù)為基礎(chǔ),利用系統(tǒng)聚類法,根據(jù)食品價(jià)格的跌漲幅對27個(gè)主要食品進(jìn)行分類。分類完成后,找出三個(gè)城市的各類主要食品價(jià)格數(shù)據(jù),利用Excel繪制三個(gè)城市的每類食品價(jià)格走勢圖,分析其差異。針對問題二:該問題討論的是預(yù)測三個(gè)城市2014年8-12月份的食品價(jià)格走勢。由于食品種類較多,故利用問題一所得分類,只預(yù)測每類中代表食品的價(jià)格走勢即可。利用查找到的三個(gè)城市2014年前7個(gè)月的食品價(jià)格數(shù)據(jù),采用灰色預(yù)測模型,對8-12月份的食品價(jià)格進(jìn)行預(yù)測,進(jìn)而得到價(jià)格的走勢。針對問題三:該問題討論的是能否僅僅通過監(jiān)測盡量少的食品種類價(jià)格即能相對準(zhǔn)確地計(jì)算、預(yù)測居民消費(fèi)者價(jià)格指數(shù)。由于食品價(jià)格變動在居民消費(fèi)者價(jià)格指數(shù)中起重要作用,且居民消費(fèi)者指數(shù)反映的是價(jià)格的變動情況,因此食品價(jià)格變動越大,居民消費(fèi)者價(jià)格指數(shù)變動越大。利用主成分分析法,找出27種主要食品中對跌漲幅變動貢獻(xiàn)率較大的主要食品,即可用這些食品的價(jià)格來計(jì)算和預(yù)測居民消費(fèi)者價(jià)格指數(shù)。三、基本假設(shè)1. 假設(shè)數(shù)據(jù)真實(shí)、有效;2. 預(yù)測食品價(jià)格時(shí)不考慮突發(fā)狀況(如自然災(zāi)害等)對食品價(jià)格波動的影響;3. 問題一中食品零售價(jià)格每十天的平均價(jià)格與食品日平均價(jià)格的偏差很小,可以忽略不計(jì);4. 食品的分類是按價(jià)格的漲跌來劃分的,可假設(shè)每一種食品的價(jià)格走勢與每一類的價(jià)格走勢相同。四、符號表示 第個(gè)樣品和第個(gè)樣品之間的距離 第類與第類的距離 上海市每類代表食品的原始數(shù)據(jù) 北京市每類代表食品的原始數(shù)據(jù) 西安市每類代表食品的原始數(shù)據(jù) 上海市每類代表食品數(shù)據(jù)的均方差比值 北京市每類代表食品數(shù)據(jù)的均方差比值 西安市每類代表食品數(shù)據(jù)的均方差比值 協(xié)方差矩陣的特征值五、模型建立與求解本文根據(jù)題目所給數(shù)據(jù)及查詢到的數(shù)據(jù),對北京、上海和西安三個(gè)城市主要食品價(jià)格變動進(jìn)行分析與預(yù)測,并對三個(gè)城市主要食品進(jìn)行了主成分分析。5.1譜系聚類法并采用最短距離對食品價(jià)格變動進(jìn)行分類由于該題數(shù)據(jù)樣本容量較大,不利于模型的建立。因此為了使問題簡單化,本模型使用譜系聚類法根據(jù)樣品之間的相似程度對樣品進(jìn)行了分類,使所要討論的樣品容量減少,便于問題的解決。對于個(gè)樣品的多元觀測數(shù)據(jù)(1):,可將每個(gè)樣品看成維空間的一個(gè)點(diǎn),個(gè)樣品組成維空間的個(gè)點(diǎn),則在維空間可定義一種距離,根據(jù)兩個(gè)樣品之間距離的大小來衡量它們的相似程度。設(shè)表示第個(gè)樣品和第個(gè)樣品之間的距離,則有:(1)時(shí),樣品和樣品恒等;(2)對于一切的和,;(3);(4)。本模型采用歐氏距離來衡量樣品兩兩之間的相似程度。歐氏距離為:。采用最短距離來對樣品進(jìn)行的分類,用表示類,用表示與的距離,則最短距離為:,其中,。利用譜系聚類法對樣品的分了大致過程如下:(1)將個(gè)樣品開始時(shí)作為個(gè)類,計(jì)算出兩兩之間的歐氏距離,構(gòu)成一個(gè)對稱距離矩陣;(2)選擇最小的非零元素,設(shè)為,則將與合并為一個(gè)新類,記為;(3)計(jì)算新類與其他類的距離:(,)接下來將中第行及第列用(2)中的公式合并成一個(gè)新行新列,新行新列對應(yīng)于,所得的矩陣記為。(4)對重復(fù)上述對的2、3兩步作法,得如此下去,直到所有的元素并為一類為此。該模型把樣品按照127的順序進(jìn)行了編號,以27種主要食品的本期價(jià)格與上期價(jià)格相比漲跌百分比為指標(biāo),看出各個(gè)指標(biāo)之間的測量值相差比較大。因此需要對這些指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,使用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行距離的計(jì)算。利用SPSS軟件對食品進(jìn)行分類的過程中就已經(jīng)使數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化。由此,為了直觀明了的反映出分類的結(jié)果,利用SPSS軟件繪出了以27種主要食品的本期價(jià)格與上期價(jià)格相比漲跌百分比為指標(biāo)進(jìn)行分類的譜系圖如下:圖1樣品分類譜系圖由譜系圖知,可對27種食品進(jìn)行不同的分類。因此可以將27種主要食品分為6類,具體分類結(jié)果見下表:表1 主要食品分類表類別序號第1類24第2類22第3類23第4類19第5類20第6類1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、21、25、26、27由上述分類表知27種食品的分類情況為:第1類:豆角;第2類:黃瓜;第3類:西紅柿;第4類:大白菜;第5類:油菜;第6類:大米(粳米)、面粉(富強(qiáng)粉)、面粉(標(biāo)準(zhǔn)粉)、豆制品(豆腐)、花生油(壓榨一級)、大豆油(5L桶裝)、菜籽油(一級散裝)、豬肉(五花肉)、豬肉(后腿肉)、牛肉(腿肉)、羊肉(腿肉)、雞(白條雞)、雞(雞胸肉)、鴨(白條鴨)、雞蛋(散裝鮮雞蛋)、活鯉魚、活草魚、帶魚、芹菜、土豆、蘋果、香蕉。根據(jù)聚類分析所得到的食品分類以及三個(gè)城市1月1日至4月10日每十天的食品價(jià)格數(shù)據(jù),分別分析三個(gè)城市中這六類食品的價(jià)格變動情況。對于第一類食品豆角,三個(gè)城市的價(jià)格變化趨勢如下圖(以每十天為一時(shí)期):圖2 豆角的價(jià)格變化趨勢 從上圖可以看出,三個(gè)城市的豆角價(jià)格均在春節(jié)前后有明顯波動。其中,北京市的豆角價(jià)格從春節(jié)開始上漲,大約在2月10日左右達(dá)到最高,隨后開始下降。上海市與西安市的豆角價(jià)格則是在從1月初開始上漲,在春節(jié)前達(dá)到最高,春節(jié)之后價(jià)格開始回落。在4月初,三個(gè)城市的豆角價(jià)格均回落至1月初的水平。對于第二類食品黃瓜,三個(gè)城市的價(jià)格變化趨勢如下圖:圖3 黃瓜的價(jià)格變化趨勢 從上圖可以看出,北京市黃瓜的價(jià)格變動最大,經(jīng)歷了兩次大范圍起伏。北京的黃瓜價(jià)格第一次大范圍變動是在春節(jié)前,在春節(jié)達(dá)到最高,隨后開始下降。從2月20日開始又大規(guī)模上漲,3月初又開始大規(guī)模下降。上海和西安的黃瓜價(jià)格受春節(jié)影響也有一定的上漲,但總的來說比較平穩(wěn)。在4月初三個(gè)城市的黃瓜價(jià)格均已回落至1月初水平。對于第三類食品西紅柿,三個(gè)城市的價(jià)格變化趨勢如下圖:圖4 西紅柿的價(jià)格變動趨勢 由上圖可以看出,北京市西紅柿價(jià)格波動不大,只是在3月中旬有所下降,之后仍有較微小的波動。上海的西紅柿價(jià)格在春節(jié)前緩慢上升,春節(jié)后開始下降,之后在2月份中旬,西紅柿的價(jià)格又有一些較小的回升,但在3月上旬過后,西紅柿的價(jià)格有逐漸下降。西安市從1月初至3月10日的西紅柿價(jià)格一直處于緩慢上升階段,但在3月10日之后有一個(gè)明顯的下降,在3月底下降至最低,幾乎恢復(fù)至1月初的價(jià)格水平,隨后又開始上升。對于第四類食品大白菜,三個(gè)城市的價(jià)格變化趨勢如下圖:圖5 大白菜的價(jià)格變動趨勢圖 由上圖可得,2月10日前,北京市、上海市、西安市的大白菜價(jià)格受春節(jié)影響,變化趨勢相似總體均呈上漲狀態(tài)。相比之下,北京市與西安市大白菜價(jià)格的上漲幅度較大,上海市變化較為平穩(wěn)。4月初,上海市與西安市的大白菜價(jià)格均呈明顯上升趨勢,相反,由于3月下旬的價(jià)格上漲,北京市4月初的大白菜價(jià)格趨于平穩(wěn)。對于第五類食品油菜,三個(gè)城市的價(jià)格變化趨勢如下圖:圖6 油菜的價(jià)格變化趨勢由上圖可得,西安市與北京市的油菜價(jià)格變化趨勢基本一致,上海市油菜價(jià)格則處于平穩(wěn)狀態(tài)。西安市與北京市的價(jià)格變化受春節(jié)的影響,有明顯的一次價(jià)格上升,隨后開始下降。不同之處在于,西安市的價(jià)格在下降過程中有兩次趨于穩(wěn)定的時(shí)期,分別為3月中旬和4月上旬,而北京市兩次趨于穩(wěn)定的時(shí)期分別為3月上旬和3月下旬。從第六類食品中取豬肉為代表,得到三個(gè)城市的價(jià)格變化趨勢如下圖:圖7 豬肉的價(jià)格變化趨勢圖 從上圖可得,三個(gè)城市的豬肉價(jià)格總體都趨于穩(wěn)定,其中西安市的豬肉價(jià)格從2月下旬開始下降,從3月初又逐漸上升,隨后從3月中旬開始逐步下降。綜上所述,可得出三個(gè)城市每類食品之間的價(jià)格變動差異為:表2 三個(gè)城市每類食品的價(jià)格波動差異表產(chǎn)品類型北京上海西安第一類(豆角)較其他城市波動最劇烈,34時(shí)期急劇上升,45時(shí)期急劇下降與其他城市相比波動很平穩(wěn)相比其他城市,波動比較平緩第二類(黃瓜)較其他兩個(gè)城市波動非常劇烈波動很平穩(wěn)與上海一樣,波動很平穩(wěn)第三類(西紅柿)波動較小波動最小與其他城市相比,波動較大第四輪(大白菜)波動較小波動微小較其他城市波動劇烈第五類(油菜)波動很劇烈波動平穩(wěn)與北京一致,波動也很劇烈第六類(豬肉)波動很平穩(wěn)波動很平穩(wěn)價(jià)格有微小波動5.2 三個(gè)城市主要食品價(jià)格預(yù)測模型由于本文中查詢到的數(shù)據(jù)量比較少,而灰色系統(tǒng)理論對樣本量的多少沒有過分的要求,因此為了預(yù)測出短期的每類食品的價(jià)格,建立灰色系統(tǒng)模型。其中灰色系統(tǒng)理論建模的主要任務(wù)是根據(jù)具體灰色系統(tǒng)的行為特征數(shù)據(jù),利用不多的數(shù)據(jù)中的顯隱信息,尋找因素之間或因素與自身的數(shù)學(xué)關(guān)系?;疑P褪抢秒x散隨機(jī)數(shù)經(jīng)過生成變?yōu)殡S機(jī)性被顯著削弱而且比較有規(guī)律的生成數(shù),建立的微分方程形式的模型通常采用的辦法是離散模型,建立一個(gè)按時(shí)間作逐段分析的模型?;疑A(yù)測是指利用 GM 模型對系統(tǒng)行為特征的發(fā)展變化規(guī)律進(jìn)行估”。(2)主要以灰色系統(tǒng)理論中的GM(1,1)模型來進(jìn)行處理。GM(1,1)表示模型是1階計(jì)預(yù)測。實(shí)質(zhì)上是將“隨機(jī)過程”當(dāng)作“灰色過程”,“隨機(jī)變量”當(dāng)作“灰變量的,且只含有1個(gè)變量。建立灰色系統(tǒng)GM(1,1)模型的步驟為:已知參考數(shù)據(jù)列為,由于每類食品的價(jià)格均為正數(shù),即所參考的數(shù)列為非負(fù)數(shù)列。做累加生成可以使非負(fù)的擺動與非擺動的數(shù)列或任意無規(guī)律性的數(shù)列轉(zhuǎn)化為非減的、遞增的數(shù)列,可以適當(dāng)?shù)脑鰪?qiáng)數(shù)據(jù)間的規(guī)律性。所以首先給原始數(shù)列即參考數(shù)列做一次累加生成數(shù)列,其中,的灰導(dǎo)數(shù)為。其次令為數(shù)列的緊鄰均值數(shù)列,則對作緊鄰均值生成,其中,故經(jīng)計(jì)算有的緊鄰均值數(shù)列為:。然后建立灰微分方程 ,和為參數(shù)。將代入中有令 , , (參數(shù)列),稱為數(shù)據(jù)向量,為數(shù)據(jù)矩陣,為參數(shù)向量,則GM(1,1)模型可以表示為矩陣方程。其中參數(shù)列由最小二乘法估計(jì)滿足 ??傻闷浒谆匠痰慕鉃?,。且 ,。利用所知數(shù)據(jù)可以通過求出生成數(shù)列值求出相應(yīng)的模型還原值。模型建立與求解之后要對模型進(jìn)行適當(dāng)?shù)臋z驗(yàn),這里采用殘差檢驗(yàn)與相對誤差檢驗(yàn)以及原始數(shù)據(jù)方差與殘差方差的均方差比值、小誤差概率進(jìn)行檢驗(yàn)。其中殘差為,相對誤差為。均方差比值為,其中,。利用以上灰色系統(tǒng)GM(1,1)模型的建立與求解問題的步驟,檢驗(yàn)值的計(jì)算方法,在MATLAB中編出程序,解答下列問題。由模型中對27種主要食品分為6類知,在進(jìn)行對三個(gè)城市2014年812月份食品價(jià)格走勢的預(yù)測時(shí),只需要對每類進(jìn)行預(yù)測即可。在取數(shù)據(jù)時(shí),由于所查詢的數(shù)據(jù)在每月的每個(gè)時(shí)期都不同,所以為了計(jì)算的方便,這里所用的初始數(shù)據(jù)取每月銷售價(jià)的平均值。5.2.1三個(gè)城市第一類食品豆角的預(yù)測模型以每個(gè)城市一月到七月每月豆角的平均價(jià)格為原始數(shù)列,由此可以得到上海、北京、西安三個(gè)城市豆角價(jià)格的原始數(shù)列分別為利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期豆角價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表3 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值7.788.247.925.884.433.533.83預(yù)測值7.788.607.115.874.854.013.32殘差00.360.810.01-0.42-0.480.51相對誤差0-0.040.10-0.09-0.140.13北京實(shí)際值10.0013.0011.309.000預(yù)測值10.0012.5611.2410.059.008.057.20殘差00.440.06-1.050.200.050.40相對誤差00.0340.005-0.1170.0220.0060.052西安實(shí)際值17.117.616.2712.48.865.734.87預(yù)測值17.118.8314.6411.388.856.885.35殘差0-1.231.631.020.01-1.15-0.48相對誤差0-0.070.10.080-0.20-0.10其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于豆角預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對豆角812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的豆角價(jià)格預(yù)測值分別為:表4 豆角812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海2.742.261.871.551.28北京6.445.775.164.624.13西安11.951.52由豆角812月份的預(yù)測值可以看出三個(gè)城市豆角的價(jià)格是逐漸降低的。5.2.2三個(gè)城市第二類食品黃瓜的預(yù)測模型以每個(gè)城市一月到七月每月黃瓜的平均價(jià)格為原始數(shù)列,由此可以得到上海、北京、西安三個(gè)城市黃瓜價(jià)格的原始數(shù)列分別為利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期黃瓜價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表5 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值3.784.33.662.952.572.452.54預(yù)測值3.784.123.633.202.812.482.18殘差00.180.03-0.25-0.24-0.030.36相對誤差00.0420.008-0.085-0.093-0.0120.142北京實(shí)際值11.5213.5312.119.2010.008.105.83預(yù)測值11.5213.6011.7910.218.857.676.63殘差0-0.070.32-1.011.150.43-0.80相對誤差0-0.0050.027-0.1090.1150.0540.138西安實(shí)際值6.529.539.174.802.682.873.03預(yù)測值6.5210.087.385.413.962.902.13殘差00.551.790.611.280.030.90相對誤差0-0.0570.195-0.126-0.481-0.0090.2986其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于黃瓜預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對黃瓜812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的黃瓜價(jià)格預(yù)測值分別為:表6 黃瓜812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海1.921.691.491.311.16北京5.754.984.313.743.24西安1.561.140.840.620.45由黃瓜812月份的預(yù)測值可以看出三個(gè)城市黃瓜的價(jià)格雖月份增加是逐漸降低的。5.2.3三個(gè)城市第二類食品西紅柿的預(yù)測模型以每個(gè)城市一月到七月每月西紅柿的平均價(jià)格為原始數(shù)列,由此可以得到上海、北京、西安三個(gè)城市西紅柿價(jià)格的原始數(shù)列分別為利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期西紅柿價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表7 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值0.971.060.931.65預(yù)測值0.970.931.091.53殘差00.13-0.050.01-0.13-0.060.12相對誤差00.1221-0.050.013-0.1161-0.040.073北京實(shí)際值6.576.937.536.675.134.034.26預(yù)測值6.577.646.775.995.304.694.16殘差0-0.710.760.68-0.17-0.660.10相對誤差0-0.1040.100.101-0.033-0.160.024西安實(shí)際值8.579.939.537.676.134.334.6預(yù)測值8.5710.468.767.31殘差0-0.530.770.33-0.01-0.810.29相對誤差0-0.0540.080.043-0.002-0.19-0.19其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于西紅柿預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對西紅柿812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的西紅柿價(jià)格預(yù)測值分別為:表8 西紅柿812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海2.362.141.941.751.6北京3.683.262.882.552.26西安3.613.022.532.121.77由西紅柿812月份的預(yù)測值可以看出三個(gè)城市西紅柿的價(jià)格是隨時(shí)間逐漸降低的。5.2.4三個(gè)城市第四類食品大白菜的預(yù)測模型以每個(gè)城市一月到七月每月大白菜的平均價(jià)格為原始數(shù)列,由此可以得到上海、北京、西安三個(gè)城市大白菜價(jià)格的原始數(shù)列分別為利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期大白菜價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表9 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值0.971.060.931.65預(yù)測值0.970.931.091.53殘差00.13-0.050.01-0.13-0.060.12相對誤差00.122-0.050.013-0.12-0.040.073北京實(shí)際值1.331.401.031.211.431.571.60預(yù)測值1.321.41.501.60殘差00.23-0.21-0.110.030.070.00相對誤差00.165-0.21-0.090.0150.0460.000西安實(shí)際值1.732.42.032.412.032.673.4預(yù)測值1.732.002.172.362.562.783.02殘差00.40-0.140.05-0.53-0.110.38相對誤差00.167-0.070.021-0.26-0.040.110其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于大白菜預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對大白菜812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的大白菜價(jià)格預(yù)測值分別為:表10 大白菜812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海1.691.872.062.282.52北京1.691.801.922.042.17西安3.283.563.874.214.57由大白菜812月份的預(yù)測值可以看出三個(gè)城市大白菜的價(jià)格都是隨時(shí)間的變化逐漸升高的。5.2.5三個(gè)城市第五類食品油菜的預(yù)測模型以每個(gè)城市一月到七月每月油菜的平均價(jià)格為原始數(shù)列,由此可以得到上海、北京、西安三個(gè)城市油菜價(jià)格的原始數(shù)列分別為 利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期油菜價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表11 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值1.931.361.641.822.031.942.55預(yù)測值1.931.411.581.761.962.182.43殘差0-0.050.060.060.07-0.240.12相對誤差0-0.040.0370.0330.035-0.120.047北京實(shí)際值2.574.004.703.663.202.402.00預(yù)測值2.574.594.003.473.022.622.28殘差0-0.490.700.190.18-0.22-0.28相對誤差0-0.150.1500.0500.055-0.09-0.14西安實(shí)際值5.5預(yù)測值5.578.156.425.064.003.152.49殘差00.45-0.720.160.20-0.250.31相對誤差00.052-0.120.0280.048-0.080.112其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于油菜預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對油菜812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的油菜價(jià)格預(yù)測值分別為:表12 油菜812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海2.703.013.353.734.15北京1.991.731.501.311.14西安1.961.551.220.960.76由油菜812月份的預(yù)測值可以看出上海油菜的價(jià)格隨時(shí)間是逐漸升高的,而北京與西安兩個(gè)城市油菜的價(jià)格是隨時(shí)間逐漸降低的。5.2.6第六類食品的預(yù)測由于第六類中有食品22種,其中價(jià)格的大小差別較大,最小的價(jià)格為3.8每千克,最大的價(jià)格為66.26每千克。因此為了消除最大值與最小值的影響,這里取價(jià)格的中位數(shù)來代表第六類的價(jià)格整體變化。從所查詢的數(shù)據(jù)知,可以使用豬肉(后腿肉)的價(jià)格為原始數(shù)列,由此可以得到每個(gè)城市豬肉價(jià)格的原始數(shù)列分別為 利用MATLAB軟件即可計(jì)算出三個(gè)城市每個(gè)時(shí)期豬肉(后腿肉)價(jià)格預(yù)測值與對預(yù)測值進(jìn)行檢驗(yàn)的指標(biāo)值(程序見附錄),具體數(shù)值見下表:表13 所求預(yù)測值與數(shù)據(jù)檢驗(yàn)指標(biāo)值表城市數(shù)值名稱1月2月3月4月5月6月7月上海實(shí)際值16.2416.0315.6915.0615.3515.4815.49預(yù)測值16.2415.7415.6515.5615.4615.3815.29殘差00.290.04-0.50-0相對誤差00.0180.002-0.03-0.000.0060.012北京實(shí)際值24.1325.1123.2622.6423.1723.7223.89預(yù)測值24.1323.9423.8123.6923.5623.4523.33殘差01.17-0.55-1.05-0.390.270.56相對誤差00.046-0.02-0.04-0.010.0110.024西安實(shí)際值25.325.1723.9721.5020.3323.1723.18預(yù)測值25.323.9123.4923.0722.6722.2821.89殘差01.260.48-1.57-2.340.891.29相對誤差00.0500.020-0.07-0.110.0380.055其中三個(gè)城市的均方差比值分別為:,。由上表可以看出相對誤差總體是比較小的,均方差比值也都比較小。雖然模型對于豬肉(后腿肉)預(yù)測出的價(jià)格與實(shí)際價(jià)格是有一定差別的,但差別不大,因此可以用此模型對豬肉(后腿肉)812月份的價(jià)格進(jìn)行預(yù)測。利用MATLAB軟件得到812月的豬肉(后腿肉)價(jià)格預(yù)測值分別為:表14 豬肉(后腿肉)812月份價(jià)格預(yù)測表城市8月9月10月11月12月預(yù)測值上海15.2115.1215.0314.9514.86北京23.2123.0922.9622.8522.73西安21.5021.1320.7620.3920.04由豬肉(后腿肉)812月份的預(yù)測值可以看出三個(gè)城市豬肉(后腿肉)的價(jià)格都是隨時(shí)間逐漸降低的。用Excel將上述每類食品的實(shí)際值與預(yù)測值繪制出圖形,可得到以下每類食品的價(jià)格走勢圖(見附錄),得到以下結(jié)論:(1)前五類食品豆角、黃瓜、西紅柿、大白菜、油菜前七個(gè)月的實(shí)際價(jià)格與預(yù)測價(jià)格誤差較小。 (2)812月份,三個(gè)城市六類食品中豆角、黃瓜、西紅柿、油菜、豬肉的價(jià)格走勢均是下降的;第四類食品大白菜的價(jià)格走勢是上升的。第五類食品油菜,上海市的價(jià)格走勢是上升的,北京市和西安市的價(jià)格走勢是下降的。5.3 主成分分析模型由于該問題要求用少量的食品種類價(jià)格反映居民消費(fèi)者價(jià)格指數(shù)的變動情況,即使用少量的變量反映因變量的變化。居民消費(fèi)者價(jià)格指數(shù)反映居民家庭購買生活消費(fèi)品和支出服務(wù)項(xiàng)目費(fèi)用價(jià)格變動趨勢和程度的相對數(shù),食品消費(fèi)支出占居民總支出的比重較大,因此用主成分分析法得到27種主要食品中物價(jià)變動較大的食品,即可用這些食品作為代表計(jì)算、預(yù)測居民消費(fèi)者價(jià)格指數(shù)。因此為了選擇出需要檢測的食品種類,這里使用了主成分分析。主成分分析即構(gòu)造原變量的一系列線性組合,使各線性組合在彼此不相關(guān)的前提下盡可能多地反映原變量的信息,它是在降維的思想下產(chǎn)生的處理高維數(shù)據(jù)的方法(3)。設(shè),為某實(shí)際問題所涉及的個(gè)隨機(jī)變量。其協(xié)方差矩陣為。協(xié)方差矩陣的特征值為,相應(yīng)的正交單位化特征向量為,。描述了第個(gè)主成分提取的信息占總信息的份額,為第個(gè)主成分的貢獻(xiàn)率。前個(gè)主成分的貢獻(xiàn)率之和稱為,,的累計(jì)貢獻(xiàn)率,它表明前個(gè)主成分,,綜合提供,,中信息的能力。其中,為,的第主成分。實(shí)際應(yīng)用中,選取,使前個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到較高的比例(如80%到90%),這樣不但使變量維數(shù)降低,而且也不致于損失原始變量中的太多信息。5.3.1 50個(gè)城市主要食品的主成分分析本文根據(jù)題目所給50個(gè)城市主要食品平均價(jià)格變動情況數(shù)據(jù),分別對27種食品依次進(jìn)行編號,以每個(gè)主要食品各個(gè)時(shí)期的價(jià)格漲跌幅作為一組向量,組成一個(gè)27維向量矩陣,即,利用MATLAB軟件計(jì)算出27種食品的協(xié)方差矩陣,進(jìn)而算出特征值及相應(yīng)的正交單位化特征向量,其特征值結(jié)果為:, ,。由此可知,前三個(gè)主成分的累計(jì)貢獻(xiàn)率為84.00%,因?yàn)橄鄬?yīng)的特征向量為 相對應(yīng)的特征向量為相對應(yīng)的特征向量為故第一主成分為,第二主成分為,第三主成分為。分析各個(gè)主成分中的各個(gè)向量的權(quán)重系數(shù),得到對居民食品消費(fèi)指數(shù)影響大的食品分別是第8、9、15、16、17、19、20、21、22、23、24、25、27種食品,即豬肉(后腿肉)、豬肉(五花肉)、散裝鮮雞蛋、活鯉魚、活草魚、大白菜、油菜、芹菜、黃瓜、西紅柿、豆角、土豆、香蕉。因此,可以通過監(jiān)測豬肉(后腿肉)、豬肉(五花肉)、散裝鮮雞蛋、活鯉魚、活草魚、大白菜、油菜、芹菜、黃瓜、西紅柿、豆角、土豆、香蕉價(jià)格相對準(zhǔn)確地計(jì)算、預(yù)測居民消費(fèi)者價(jià)格指數(shù)。按照上述步驟,分別對北京市、西安市與上海市的主要食品進(jìn)行主成分分析。若向量的權(quán)重系數(shù)的絕對值大于0.10,則認(rèn)為該向量為一個(gè)主成分。5.3.2 北京市的食品主成分分析根據(jù)北京市的10種食品價(jià)格的漲跌幅,分別對10種食品依次進(jìn)行編號,以每個(gè)主要食品各個(gè)時(shí)期的價(jià)格漲跌幅作為一組向量,組成一個(gè)10維向量矩陣,即,利用MATLAB軟件計(jì)算出10種食品的協(xié)方差矩陣,進(jìn)而算出特征值及相應(yīng)的正交單位化特征向量,其特征值結(jié)果為:,。由此可知, ,前兩個(gè)主成分的累計(jì)貢獻(xiàn)率為93.31%,因?yàn)橄鄬?yīng)的特征向量為相對應(yīng)的特征向量為故第一主成分為,第二主成分為。分析各個(gè)主成分中的各個(gè)向量的權(quán)重系數(shù),可以得到對北京市居民食品消費(fèi)指數(shù)影響大的食品分別是第6、7、8、10種食品,即大白菜、油菜、黃瓜、豆角。5.3.3西安市的食品主成分分析根據(jù)西安市的10種食品價(jià)格的漲跌幅,分別對10種食品依次進(jìn)行編號,以每個(gè)主要食品各個(gè)時(shí)期的價(jià)格漲跌幅作為一組向量,組成一個(gè)10維向量矩陣,即,利用MATLAB軟件計(jì)算出10種食品的協(xié)方差矩陣,進(jìn)而算出特征值及相應(yīng)的正交單位化特征向量,其特征值結(jié)果為:,。由此可知,前三個(gè)主成分的累計(jì)貢獻(xiàn)率為87.41%,因?yàn)橄鄬?yīng)的特征向量為相對應(yīng)的特征向量為相對應(yīng)的特征向量為故第一主成分為,第二主成分為,第三主成分為。分析各個(gè)主成分中的各個(gè)變量的權(quán)重系數(shù),可以得到對西安市居民食品消費(fèi)指數(shù)影響大的食品分別是第3、5、6、7、8、9、10種食品,即豬后腿肉、雞蛋、白菜、青菜、黃瓜、豆角、西紅柿。5.3.4上海市的食品主成分分析根據(jù)上海市的10種食品價(jià)格的漲跌幅,分別對10種食品依次進(jìn)行編號,以每個(gè)主要食品各個(gè)時(shí)期的價(jià)格漲跌幅作為一組向量,組成一個(gè)10維向量矩陣,即,利用MATLAB軟件計(jì)算出10種食品的協(xié)方差矩陣,進(jìn)而算出特征值及相應(yīng)的正交單位化特征向量,其特征值結(jié)果為:, ,。由此可知,前三個(gè)主成分的累計(jì)貢獻(xiàn)率為86.46%,因?yàn)橄鄬?yīng)的特征向量為 相對應(yīng)的特征向量為 相對應(yīng)的特征向量為故第一主成分為,第二主成分為,第三主成分為。分析各個(gè)主成分中的各個(gè)向量的權(quán)重系數(shù),可以得到對上海市居民食品消費(fèi)指數(shù)影響大的食品分別是第1、2、3、4、5、9種食品,即白菜、油菜、黃瓜、豆角、西紅柿、粳米。 由對北京市、西安市與上海市的主要食品的主成分分析結(jié)果可知,在相同的精度要求下,三個(gè)城市所選取的食品種類以及種類數(shù)目不一致。六、模型評價(jià)與推廣6.1 模型評價(jià)優(yōu)點(diǎn):模型一運(yùn)用系統(tǒng)聚類法中的最短距離法,根據(jù)食品價(jià)格的跌漲幅對主要食品進(jìn)行分類。較為客觀。模型二運(yùn)用灰色預(yù)測對三個(gè)城市的主要食品價(jià)格進(jìn)行了預(yù)測,灰色預(yù)測模型能有效地進(jìn)行短期預(yù)測,且對數(shù)據(jù)沒有太大要求,所以得到的預(yù)測結(jié)果較為真實(shí)可靠。模型三的主成分分析法可以用少部分變量來反映原始數(shù)據(jù)的大部分信息。缺點(diǎn):模型一僅根據(jù)食品均價(jià)走勢的相似性進(jìn)行了分類,使得分類指標(biāo)較為單一,未對各食品之間的內(nèi)在關(guān)聯(lián)進(jìn)行過深挖掘,這可能是導(dǎo)致最終分類結(jié)果過于不平衡(如每類食品數(shù)量差別較大)的原因。模型二中的灰色預(yù)測只能產(chǎn)生單調(diào)性結(jié)果,不能預(yù)測出價(jià)格的波動情況,與具體情況會有一定差別。模型三利用主成分分析法對食品價(jià)格變動進(jìn)行分析,由于三個(gè)城市的數(shù)據(jù)量太少,分析結(jié)果不能很好地反映實(shí)際情況。由于三個(gè)城市的數(shù)據(jù)量太少且存在一定偏差,因此得到的結(jié)果不夠準(zhǔn)確。6.2 模型推廣 在社會、經(jīng)濟(jì)、人口研究中,存在著大量分類研究、構(gòu)造分類模式的問題。聚類分析為客觀地分類提供了可能。聚類分析中存在著大量方法,系統(tǒng)聚類法、快速聚類法、模糊聚類法等,能解決許多實(shí)際問題。灰色系統(tǒng)理論已成功應(yīng)用于工程控制、經(jīng)濟(jì)管理、生態(tài)系統(tǒng)及復(fù)雜多變的農(nóng)業(yè)系統(tǒng)中,有可能對社會、經(jīng)濟(jì)等抽象系統(tǒng)進(jìn)行分析、建模、預(yù)測、決策和控制,它有可能成為人們認(rèn)識客觀系統(tǒng)改造客觀系統(tǒng)的一個(gè)新型的理論工具。主成分分析一個(gè)非常重要的應(yīng)用是解決回歸建模的多重共線性問題。參考文獻(xiàn):1范金城,梅長林.數(shù)據(jù)分析.北京:科學(xué)出版社,20022肖新平,毛樹華.灰預(yù)測與決策方法.北京:科學(xué)出版社,20133何曉群.多元統(tǒng)計(jì)回歸(第三版).北京:中國人民大學(xué)出版社,20114西安市物價(jià)局主要副食品價(jià)格 /ptl/def/def/index_1285_3887_ci_trid_3708568-recid_3719734.html2014-8-15.4上海市主副食品價(jià)格公布/main?main_colid=531&top_id=315 2014-8-15.5中國蔬菜網(wǎng) /Price/list/ 2014-8-15.附錄1.灰色系統(tǒng)預(yù)測程序functionX,c,error1,error2=GM11(X0,k)format long;n=length(X0);X1=; X1(1)=X0(1);for i=2:n X1(i)=X1(i-1)+X0(i);endfor i=1:n-1 B(i,1)=-0.5*(X1(i)+X1(i+1); B(i,2)=1; Y(i)=X0(i+1);endalpha=(B*B)(-1)*B*Y;a=alpha(1,1);b=alpha(2,1);d=b/a;c=X1(1)-d;X2(1)=X0(1);X(1)=X0(1);for i=1:n-1 X2(i+1)=c*exp(-a*i)+d; X(i+1)=X2(i+1)-X2(i);end for i=(n+1):(n+k) X2(i)=c*exp(-a*(i-1)+d; X(i)=X2(i)-X2(i-1);endfor i=1:n error(i)=X(i)-X0(i); error1(i)=abs(error(i); error2(i)=error1(i)/X0(i);endc=std(error1)/std(X0)命令窗口k=?X0=;X,c,error1,error2=GM11(X0,k)2計(jì)算協(xié)方差矩陣與協(xié)方差矩陣的特征值與特征向量R=cov(A)(vd,vm)=eig(R)3.27種食品主成分分析:A=5.92 5.91 5.92 5.93 5.93 5.93 5.94 5.94 5.95 5.95 5.94 5.96 5.96 5.96 5.96 5.96 5.96 5.97 5.98 5.98 5.98;5.48 5.47 5.49 5.49 5.5 5.5 5.48 5.5 5.58 5.6 5.6 5.6 5.61 5.6 5.6 5.61 5.61 5.61 5.62 5.62 5.62;4.5 4.48 4.49 4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論