(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf_第1頁
(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf_第2頁
(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf_第3頁
(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf_第4頁
(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

(計算機應用技術專業(yè)論文)數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用.pdf.pdf 免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

大連理工大學碩士學位論文 摘要 采購優(yōu)化包括在企業(yè)生產(chǎn)中對原材料的消耗量進行預測,以及根據(jù)預測到的原材料 消耗量來制訂最優(yōu)的采購方案。采購優(yōu)化的目標是降低采購占用的資金,同時降低采購 成本。在現(xiàn)代企業(yè)管理中,大多數(shù)企業(yè)的采購資金在周轉(zhuǎn)資金中占用重要的比例,因此, 制訂合理的采購方案,對企業(yè)的經(jīng)營具有重要的現(xiàn)實意義。 制訂合理的采購方案,首先必須從大量業(yè)務數(shù)據(jù)中分析原材料的消耗規(guī)律,進而預 測原材料的消耗量。從2 0 世紀9 0 年代以來,數(shù)據(jù)挖掘技術開始逐漸應用于解決類似的 商業(yè)問題。近年來,得益于計算機運算能力的不斷提高,數(shù)據(jù)挖掘的研究方向開始側(cè)重 于如何使用搜索優(yōu)化算法來對數(shù)據(jù)進行分析,并挖掘出所需要的信息。本文的主要工作 是如何利用基于搜索優(yōu)化算法的數(shù)據(jù)挖掘方法,來對采購進行優(yōu)化。 本文中將采購優(yōu)化問題分解為兩個子問題。一是對原材料消耗量的預測問題,二是 根據(jù)所預測的消耗量制訂最優(yōu)采購方案。對于第一個問題,把原材料的消耗看作是受產(chǎn) 品影響的概率模型。根據(jù)統(tǒng)計出來的消耗量數(shù)據(jù),使用極大似然法計算原材料消耗概率 模型的參數(shù)。在求解概率模型參數(shù)時,把極大似然參數(shù)估計問題轉(zhuǎn)換成為約束優(yōu)化問題, 并應用自適應復合形法對參數(shù)進行求解。對于采購方案的制訂問題,在對數(shù)據(jù)分析的基 礎上,找出采購方案的影響因素,并依據(jù)這些因素,給出了一個采購成本計算模型,最 后通過對該模型的最優(yōu)化,得到了最優(yōu)采購方案。 本文中的方法可以在線使用,而且適用于多種概率模型,易于擴展,具有一定的通 用性。通過在某印染企業(yè)中半年以來的應用,表明這種方法能夠依據(jù)歷史數(shù)據(jù)來推斷未 來原材料的消耗規(guī)律,并能根據(jù)原材料的消耗制訂合理的采購方案,實現(xiàn)了采購優(yōu)化的 目標。 關鍵詞:數(shù)據(jù)挖掘;采購優(yōu)化;極大似然法;自適應復合形法 大連理工大學碩士學位論文 t h e s t u d ya n da p p l i c a t i o no fd a t am i n i n gm e t h o do nt h eo p t i m i z a t i o no f p r o c u r e m e n tp r o c e s s a b s t r a c t t h eo p t i m i z a t i o no fp r o c u r e m e n ti n c l u d e st h ep r e d i c t i o no nt h er a wm a t e r i a l si nt h e p r o d u c t i o no ft h ee n t e r p r i s ea n ds u b s e q u e n td e c i s i o nm a k i n go fp m c o r e m e n t n 圮a i mo ft h e p r o c u r e m e n to p t i m i z a t i o ni st or e d u c et h eo c c u p i e dc a p i t a lf o rp r o c u r e m e n ta n dt h ec o s to f p r o d u c t s i nm o d e r ne n t e r p r i s em a n a g e m e n t , t h ep r o c u r e m e n tc a p i t a lt a k e sg r e a tp a r to ft h e t l l h l o v e rc a p i t a l ,s oi ti so f g r e a ti m p o r t a n c et om a k er e a s o n a b l ep u r c h a s i n gd e c i s i o n s f i r s tt h ec o n s u m i n ga m o u n to fr a wm a t e r i a l sm u s tb ep r e d i c t e d t ob ec o r r e c t ,t h er u l e m u s t b ea n a l y z e df r o m l a r g ev o l u m eo f d a t a f r o m1 9 9 0 s ,d a t am i n i n gt e c h n o l o g yb e g a nt ob e a p p l i e dt os o l v et h eb u s i n e s sp r o b l e m i nt h e s ey e a r s ,d u et ot h ec e a s e l e s sa d v a n c e m e n ti n c o m p u t e r s c o m p u t i n ga b i l i t y , t h er e s e a r c hd i r e c t i o no fd a t am i n i n gs t a _ r t at oe m p h a s i z e p a r t i c u l a r l yo nh o wt oa n a l y z ed a t aa n dg e tn e e d e di n f o r m a t i o nb yo p t i m a ls e a r c h i n g a l g o r i t h m s 1 1 l ew o r ko f t h i sp a p e r i sh o wt oo p t i m i z et h ep r o c u r e m e n tb yt h ec o m b i n a t i o no f d a t am i n i n gm e t h o da n do p t i m a ls e a r c l l i n ga l g o r i t h m s 1 1 地p r o b l e mi sd i v i d e di n t ot w os u bp r o b l e m s o n ei st h ep r e d i c t i o no f t h ec o n s u m i n go f r a wm a t e r i a l s ,a n dt h eo t h e ri sm a k eo p t i m a lp u r c h a s i n gp l a n f o rt h ef i r s to n e ,t h ec o n s u m i n g o ft h er a wm a t e r i a l si sc o n s i d e r e d 勰ap r o b a b i l i t ym o d e ls w a y e db yp r o d u c t s f r o mt h e h i s t o r i cd a t ao fp r o d u c t s p r o d u c i n gr e w o r d s , t h ep a r a m e t e r so ft h ea s s i s t a n tm a t e r i a l s p r o b a b i l i t ym o d e lc o u l db ew o r k e do u tb yt h em e t h o do fm a x i m u ml i k e l i h o o d 1 1 l ep r o b l e m o ft h es o l u t i o n - f i n d i n gf o rt h ep a r a m e t e r si sc h a n g e dt oap r o b l e mo fc o n s t r a i n to p t i m i z a t i o n i nt h i sc a s et h ei m p r o v e d c o m p l e xm e t h o d a l g o r i t h mi sa p p l i e dc o n s i d e r i n gt h a ti tf i t sk i n d s o f p r o b a b i l i t ym o d e l s f o rt h ep u r c h a s i n gp l a n - m a k i n gp r o b l e m , o nt h eb a s i so f d a t aa n a l y s i s , t h ei n f l u e n c i n ge l e m e n t sa r ef o u n da n dap r o c u r e m e n tc o s tm o d e li sc o n s t r u c t e d t h e n t h r o u g ht h eo p t i m i z a t i o nf o rt h em o d e l ,t h ep u r c h a s i n gp l a ni sm a d e 1 1 1 em e t h o dr e f e r r e di n t h i sp a p e rc a nb eu s e do i l l i n e , a n di n d e p e n d e n to ft h es t a t i s t i c s m o d e l ,s ot h a ti ti se x t e n d a b l ea n du n i v e r s a l b ya p p l y i n gi nt h ep r i n t i n ga n dd y i n ge n t e r p r i s e f o rn e a r l yh a l f y e a r s ,t h i sm e t h o di sp r o v e dt ob eh e l p f u lt od e d u c at h er u l eo f t h ec o n s u m i n g o f r a wm a t e r i a l sf r o mh i s t o r i cd a t a , a n dt h ep u r c h a s i n gp l a nc a nb em a d e , s ot h a tt h ep u r p o s e i sr e a l i z e d k e yw o r d s ;d a t am i n i n g ;p r o c u r e m e n tp r o c e s so p t i m i z a t i o n ;m a x i m u ml i k e l i h o o d p r i n c i p l e ;a d a p t i v e c o m p l e x m e t h o d 獨創(chuàng)性說明 作者鄭重聲明:本碩士學位論文是我個人在導師指導下進行的研究工 作及取得研究成果。盡我所知,除了文中特別加以標注和致謝的地方外, 論文中不包含其他人已經(jīng)發(fā)表或撰寫的研究成果,也不包含為獲得大連理 工大學或者其他單位的學位或證書所使用過的材料。與我一同工作的同志 對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。 作者簽名: 大連理 :大學碩士研究生學位論文 大連理工大學學位論文版權使用授權書 本學位論文作者及指導教師完全了解“大連理工大學碩士、博士學位 論文版權使用規(guī)定”,同意大連理工大學保留并向國家有關部門或機構(gòu)送 交學位論文的復印件和電子版,允許論文被查閱和借閱。本人授權大連理 工大學可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,也 可采用影印、縮印或掃描等復制手段保存和匯編學位論文。 作者簽名 導師簽名 ,吞 沈表 蔓塑呈年型月竺芝f = t 大連理工大學碩士學位論文 1 緒論 1 1 研究背景及意義 印染企業(yè)每年需要花費近億的資金用來采購生產(chǎn)和工程中所需的各種原材料。在采 購過程中由于不能全面、及時、準確地了解生產(chǎn)上的用料需求、供應商的資質(zhì)、采購歷 史情況等信息,不能及時對庫存儲備定額進行科學準確地測算,使得在采購過程中可能 造成部分采購決策不準確或不科學。如果每年形成1 的失誤就會為企業(yè)帶來近百萬的 損失。因此印染企業(yè)的采購迫切需要一套幫助指導工作的采購優(yōu)化系統(tǒng)。 采購優(yōu)化是大多數(shù)生產(chǎn)型企業(yè)所面臨的問題。以印染企業(yè)為例,采購工作分為原料 的采購和物料的采購。統(tǒng)計結(jié)果表明,其原料的采購成本占其總成本的7 0 以上。而物 料種類繁多,在生產(chǎn)中也占有一定的地位,其占用庫存較多,庫存維護成本較高。但是 目前物料沒有科學的依據(jù)來指導采購,采購人員憑經(jīng)驗根據(jù)季節(jié)性來估計需求,主觀判 斷的不確定性經(jīng)常會使庫存過剩,造成資金流失,或者偶爾出現(xiàn)缺貨現(xiàn)象,對生產(chǎn)造成 一定的滯后影響。研究物料的消耗規(guī)律可以幫助采購部門根據(jù)生產(chǎn)計劃預測其消耗量, 確定采購數(shù)量。從多個供應商中選擇合適的供應商并按適當?shù)谋壤峙洳少徚浚赃_到 采購費用最少,從而制訂出合理的采購計劃,最終實現(xiàn)控制企業(yè)采購所需資金,即達到 采購優(yōu)化的目的。 本文中面臨的兩個問題為:物料消耗量的預測和供應商的選擇與采購量分配問題。 這類有著明確的商業(yè)目標、同時需要根據(jù)數(shù)據(jù)挖掘結(jié)果對決策結(jié)果在商業(yè)應用中進行優(yōu) 化部署的問題,正適合用最優(yōu)化方法進行解決。盡管在最優(yōu)化方法和數(shù)據(jù)挖掘技術結(jié)合 方面的研究已取得一定成果,但在實際應用中,目前還沒有一個面向?qū)嶋H管理決策問題, 將最優(yōu)化方法與數(shù)據(jù)挖掘技術有機地結(jié)合起來應用的理論方法體系和問題求解模型。因 此,本文以數(shù)據(jù)挖掘的統(tǒng)計方法分析歷史數(shù)據(jù),建立適合企業(yè)原材料庫存與采購的模型, 然后利用最優(yōu)化方法求解模型中的參數(shù),最后解決上述兩個問題。 本文在論述了已有數(shù)據(jù)挖掘的過程模型的基礎上,基于數(shù)據(jù)挖掘與最優(yōu)化結(jié)合對支 持最終采購決策分析的管理問題模型進行求解,目標是有效地將數(shù)據(jù)挖掘技術與最優(yōu)化 方法在實際應用中有機地結(jié)合起來,并為復雜的采購管理決策分析問題的求解和決策實 施提供一個可以依賴的參考模型。其中的自適應復合形法求解模型中參數(shù)的方法適用于 多種模型,當概率模型有一定的變化時,同樣可以自適應復合形法對模型的參數(shù)求解。 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 1 2 國內(nèi)外研究現(xiàn)狀 1 2 1 數(shù)據(jù)挖掘的國內(nèi)外研究現(xiàn)狀 數(shù)據(jù)挖掘是一個利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關系的過程,這 些模型和關系可以用來做出預測【l 】。數(shù)據(jù)挖掘涉及到許多其它的研究領域,包括多元統(tǒng) 計( 主要有組件分析,聚簇分析和多維縮放) ,數(shù)據(jù)庫接口( 協(xié)作數(shù)據(jù)庫接e i 、模糊查詢 接口、數(shù)據(jù)智能瀏覽) ,和信息檢索( 近似匹配算法) 。數(shù)據(jù)挖掘的工作,主要是使用半 自動化的方式來進行知識獲取。知識發(fā)現(xiàn)和數(shù)據(jù)挖掘( d a t a m i n i n g ) 是將為決策者提供重 要的、前所未料的信息或知識,從而產(chǎn)生不可估量的效益。研究k d d 和d m 技術的重 大意義已被人們廣泛地認識到,并且被列為數(shù)據(jù)庫研究領域中最重要的課題之一。例如 美國政府開發(fā)s e q u o i a 2 0 0 0 項目作為大規(guī)模數(shù)據(jù)庫中先進的數(shù)據(jù)分析工具,許多商業(yè)公 司也充分認識到了深層次地分析本公司業(yè)務數(shù)據(jù)庫中的數(shù)據(jù)能夠帶來更多的商業(yè)利潤, 例如銀行和零售商店通過分析他們的業(yè)務數(shù)據(jù),進一步掌握和了解客戶的信譽、習慣和 消費心理,相應地調(diào)整他們的市場決策,以拓寬更廣泛的市場。 目前,數(shù)據(jù)挖掘的研究熱點包括網(wǎng)站的數(shù)據(jù)挖掘( w e bs i t ed a t am i n i n g ) 、生物信息 或基因( b i o i n f o r m a t i c s g e n o m i c s ) 的數(shù)據(jù)挖掘及其文本的數(shù)據(jù)挖掘( t e x t u a lm i n i n g ) 等等。 ( 1 ) 網(wǎng)站的數(shù)據(jù)挖掘 隨著w e b 技術的發(fā)展,各類電子商務網(wǎng)站風起云涌,如何讓電子商務網(wǎng)站有效益 是一個關鍵問題。電子商務網(wǎng)站每天都生成大量的記錄文件和登記表,如果能對這些數(shù) 據(jù)進行分析和挖掘,充分了解客戶的喜好、購買模式,并設計出滿足于不同客戶群體需 要的個性化網(wǎng)站,必能增加商家的競爭力。在對網(wǎng)站進行數(shù)據(jù)挖掘時,所需要的數(shù)據(jù)主 要來自于兩個方面:一方面是客戶的背景信息,主要來自于客戶的登記表;另外一部分 數(shù)據(jù)主要來自瀏覽者的點擊流,主要用于考察客戶的行為表現(xiàn)。就分析和建立模型的技 術和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來的數(shù)據(jù)挖掘差別不大,很多方法和分析思想都可 以運用。所不同的是網(wǎng)站的數(shù)據(jù)格式有很大一部分來自于點擊流,和傳統(tǒng)的數(shù)據(jù)庫格式 有區(qū)別。因而對電子商務網(wǎng)站進行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準備。目前,有很多 廠商正在致力于開發(fā)專門用于網(wǎng)站挖掘的軟件。 ( 2 ) 生物信息或基因的數(shù)據(jù)挖掘 生物信息或基因數(shù)據(jù)挖掘在商業(yè)上很難講有多大的價值,但對于人類卻受益非淺。 無論在數(shù)據(jù)的復雜程度、數(shù)據(jù)量還有分析和建立模型的算法而言,生物信息或基因的數(shù) 據(jù)挖掘比通常的數(shù)據(jù)挖掘要復雜得多。從分析算法上講,更需要一些新的和好的算法。 一2 一 大連理工大學碩士學位論文 現(xiàn)在很多廠商正在致力于這方面的研究。但就技術和軟件而合一,還遠沒有達到成熟的 地步。 ( 3 ) 文本的數(shù)據(jù)挖掘 無論是在數(shù)據(jù)結(jié)構(gòu)還是在分析處理方法方面,文本數(shù)據(jù)挖掘與數(shù)據(jù)庫中的數(shù)據(jù)挖掘 相差很大。文本數(shù)據(jù)挖掘并不是一件容易的事情,尤其是在分析方法方面,還有很多需 要研究的問題。目前市場上有一些類似的軟件,但大部分方法只是把文本移來移去,或 簡單地計算一下某些詞匯的出現(xiàn)頻率,并沒有真正的分析功能。 隨著計算機計算能力的發(fā)展和業(yè)務復雜性的提高,數(shù)據(jù)的類型會越來越多、越來越 復雜,數(shù)據(jù)挖掘?qū)l(fā)揮出越來越大的作用。當前,數(shù)據(jù)挖掘研究與開發(fā)的總體水平相當 于數(shù)據(jù)庫技術在2 0 世紀7 0 年代所處的地位,迫切需要類似于關系模式、d b m s 系統(tǒng)和 s q l 查詢語言等理論和方法的指導,才能使其應用得以普遍推廣。預計在本世紀,數(shù)據(jù) 挖掘的研究焦點可能會集中到以下幾個方面【2 j : ( 1 ) 發(fā)現(xiàn)語言的形式化描述,即研究專門用于知識發(fā)現(xiàn)的數(shù)據(jù)挖掘語言,也許會像 s q l 語言一樣走向形式化和標準化; ( 2 ) 尋求數(shù)據(jù)挖掘過程中的可視化方法,使知識發(fā)現(xiàn)的過程能夠被用戶理解,也便 于在知識發(fā)現(xiàn)的過程中進行人機交互; ( 3 ) 研究在網(wǎng)絡環(huán)境下的數(shù)據(jù)挖掘技術( w e bm i n i n g ) ,特別是在因特網(wǎng)上建之數(shù)據(jù) 挖掘服務器,并且與數(shù)據(jù)庫服務器配合,實現(xiàn)w e bm i n i n g ; ( 4 ) 加強對各種非結(jié)構(gòu)化數(shù)據(jù)的挖掘( d a t am i n i n gf o ra u d i o & v i d e o ) ,如對文本數(shù) 據(jù)、圖形數(shù)據(jù)、視頻圖像數(shù)據(jù)、聲音數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的挖掘; ( 5 ) 處理的數(shù)據(jù)將會涉及到更多的數(shù)據(jù)類型,這些數(shù)據(jù)類型或者比較復雜,或者是 結(jié)構(gòu)比較獨特。為了處理這些復雜的數(shù)據(jù),就需要一些新的和更好的分析方法和模型, 同時還會涉及到為處理這些復雜或獨特數(shù)據(jù)所做的準備的一些工具和軟件。 1 2 2 數(shù)據(jù)挖掘與優(yōu)化方法結(jié)合的研究現(xiàn)狀 數(shù)據(jù)挖掘技術的應用十分廣泛,尤其在商業(yè)經(jīng)營和企業(yè)決策支持等領域。數(shù)據(jù)挖掘 的最終目標是使決策者根據(jù)挖掘得到的分析結(jié)果,優(yōu)化商業(yè)決策和行為,進而增加企業(yè) 的效益。遺憾的是,在實際應用中,傳統(tǒng)的數(shù)據(jù)挖掘技術只是提供了一套數(shù)據(jù)挖掘應用 的方法,對于領域知識表示和數(shù)據(jù)挖掘過程的集成、挖掘結(jié)果的解釋、部署等方面很少 涉及,缺乏對商業(yè)決策和行為優(yōu)化的能力,限制了數(shù)據(jù)挖掘的大量應用。而這類有著明 確的商業(yè)目標同時需要根據(jù)數(shù)據(jù)挖掘結(jié)果對決策結(jié)果在商業(yè)應用中進行優(yōu)化部署的問 題,正適合用最優(yōu)化技術進行解決n 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 基于此,將最優(yōu)化方法和數(shù)據(jù)挖掘技術相結(jié)合,二者互相補充,互相利用,則可有 效解決目前存在的這一問題。目前,二者結(jié)合的方式主要有兩種:一種是在一個復雜的 決策分析過程中,最優(yōu)化方法和數(shù)據(jù)挖掘方法相互替代,利用各自的優(yōu)勢,從而得到更 好的決策結(jié)果,這類方式具有較強的通用性和靈活性;另一種是直接將數(shù)據(jù)挖掘和最優(yōu) 化混雜的過程所要解決的問題定義為一個復雜的最優(yōu)化問題,通過遺傳算法等技術求取 近似解,從而達到較好的優(yōu)化效果。這種方式和問題域強相關,且最后的優(yōu)化問題會十 分復雜,其優(yōu)點是可能帶來非常好的結(jié)果。盡管在最優(yōu)化方法和數(shù)據(jù)挖掘技術結(jié)合方面 的研究已取得一定成果,但在實際應用中,目前還沒有一個面向?qū)嶋H管理決策問題,將 最優(yōu)化方法與數(shù)據(jù)挖掘技術有機地結(jié)合起來應用的理論方法體系和問題求解模型。 1 2 3 約束優(yōu)化問題求解方面的研究現(xiàn)狀 在模型求解方面,由于模型中目標函數(shù)和約束條件是非線性的,因此在求解上的算 法也是多種多樣的,一般針對模型的特點采用不同的求解方法,非線性規(guī)劃模型一般是 采用迭代算法求解。而從數(shù)學的角度,求解非線性規(guī)劃模型的方法,隨著近年來計算機 技術的飛速發(fā)展,不斷的有所創(chuàng)新。 ( 1 ) 基于單純形的方法,此法的主要思想是通過將非線性目標規(guī)劃轉(zhuǎn)化為近似的線 性目標規(guī)劃,以便使用線性規(guī)劃的單純型法。 ( 2 ) 直接搜索方法,這種方法是把給定的非線性多目標規(guī)劃問題轉(zhuǎn)化為一組單目標 非線性規(guī)劃問題,然后,使用解決單目標非線性規(guī)劃的直接搜索方法加以解決。 ( 3 ) 基于梯度的方法,該方法主要思想就是利用梯度來確定一個求解的可行方向, 以可行方向為基礎求解目標規(guī)劃。 ( 4 ) 進化算法。如遺傳算法、模擬退火算法、微粒群算法等,這些算法的可以處理 結(jié)構(gòu)復雜的非線性規(guī)劃模型,優(yōu)點在于在求解過程中,無須我們考慮函數(shù)的導數(shù)和連續(xù) 性問題。 在非線性規(guī)劃模型求解方法上,發(fā)展最快的就是進化算法,尤其是遺傳算法,遺傳 算法在求解非線性規(guī)劃問題方面,具有很高的魯棒性,自上個世紀7 0 年代初問世以來, 發(fā)展極為迅速。遺傳算法( g e n e t i c a l g o r i t h m s ,a g ) 研究的歷史比較短,2 0 世紀6 0 年代 末期到7 0 年代初期,主要由美國m i c h i g a n 大學的j o h nh o l l a n d 與其同事、學生們研究 形成了一個較為完整的理論與方法【4 】,從試圖解釋自然系統(tǒng)中生物的復雜適應過程入手, 模擬生物進化的機制來構(gòu)造人工系統(tǒng)的模型。隨著2 0 世紀余年的發(fā)展,取得了豐碩的 應用成果和理論研究的進展,特別是近年來世界范圍形成的進化計算熱潮,計算智能己 作為人工智能研究的一個重要方向,以及后來的人工生命研究的興起,使得遺傳算法受 一4 大連理工大學碩士學位論文 到廣泛的關注。從1 9 8 5 年在美國卡耐基梅隆大學召開的第一屆國際遺傳算法會議 ( i n t e m a f i o n f lc o n f e r e n c eo rg e n e t i cf l g o f i t h m s :i c g a 8 5 ) ,到1 9 9 7 年5 月i e e e 的 t r a n s a c t i o n so ne v o l u t i o n a r yc o m p u t a t i o n 創(chuàng)刊,遺傳算法作為具有系統(tǒng)優(yōu)化、適應與學習 的高性能計算和建模方法的研究漸趨成熟。另外,其他的進化算法如模擬退火算法和微 粒群算法方面,近年來發(fā)表的文章也很多,取得的理論成果及應用成果也是有目共睹的。 1 3 本文的主要工作和論文的組織結(jié)構(gòu) 本文詳細討論了企業(yè)采購優(yōu)化的問題,在無法直接得到原料與物料消耗關系的情況 下,把物料的消耗看作是受原料影響的概率模型。應用統(tǒng)計出來的原料消耗數(shù)據(jù),使用 極大似然法得出物料消耗概率模型參數(shù)。在此基礎上根據(jù)未來生產(chǎn)計劃中預定的原料數(shù) 量來預測未來物料消耗量,從而對采購數(shù)量進行優(yōu)化控制。在求解物料消耗概率模型時, 把極大似然參數(shù)估計轉(zhuǎn)換成為約束優(yōu)化問題,并應用改進的復合形法進行求解,便于在 多種概率模型上計算,得到的結(jié)果在企業(yè)生產(chǎn)中進行了驗證。在得到預測需求量以后, 對企業(yè)原材料的供應商選擇與采購分配量問題進行了分析并建模,并同樣應用自適應復 合形法對模型的參數(shù)進行求解。最終,給出了系統(tǒng)的整體實現(xiàn)結(jié)果。 全文的組織結(jié)構(gòu)如下: 第1 章緒論部分,主要介紹了本文的研究背景、意義及應用領域,數(shù)據(jù)挖掘、優(yōu)化 方法等國內(nèi)外的研究現(xiàn)狀。 第2 章數(shù)據(jù)挖掘理論部分,主要介紹了數(shù)據(jù)挖掘的主要功能、常用技術和數(shù)據(jù)挖掘 的應用領域及研究成果,并介紹了數(shù)理統(tǒng)計與數(shù)據(jù)挖掘的關系以及數(shù)理統(tǒng)計在預測型數(shù) 據(jù)挖掘中的應用。 第3 章介紹了數(shù)值優(yōu)化理論與用于數(shù)值計算的常用優(yōu)化方法,詳細介紹了約束優(yōu)化 方法的概念,及用于求解約束優(yōu)化問題的常用方法。 第4 章物料的概率模型及問題求解是本文的重點之一,該部分以某企業(yè)為背景,詳 細描述了產(chǎn)品與物料消耗的關系及物料消耗模型的建立,將模型參數(shù)估計轉(zhuǎn)化為最優(yōu)化 問題,應用自適應復合形法求解參數(shù),最后給出了試驗的結(jié)果及實現(xiàn)效果。 第5 章采購優(yōu)化部分也是本文的重點之一,該部分討論了供應商選擇和訂購量分配 問題,建立了基于確定需求的采購優(yōu)化模型。模型中的參數(shù)同樣以自適應復合形法進行 求解,最終實現(xiàn)了采購優(yōu)化系統(tǒng),說明了所提出方法的可行性與有效性。 第6 章對全文做總結(jié),并給出了對未來工作的設想與展望。 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 2 數(shù)據(jù)挖掘理論與方法 2 1數(shù)據(jù)挖掘概述及應用 2 1 1 數(shù)據(jù)挖掘的概念 所謂數(shù)據(jù)挖掘就是設計一套數(shù)學模型、算法或軟件系統(tǒng),用以從數(shù)據(jù)庫中找出某一 類特有性質(zhì)數(shù)據(jù)的分布規(guī)律,也就是歸納現(xiàn)有海量數(shù)據(jù)中某類數(shù)據(jù)分布的知諺 【5 1 。在已 有的數(shù)據(jù)挖掘技術中,最常用的是統(tǒng)計分析、回歸分析、聚類分析等。應用這些技術的 基礎是設計數(shù)學模式,對大量的數(shù)據(jù)進行過濾檢查,也就是挖掘【6 】。 無論是商業(yè)企業(yè)、科研機構(gòu)或者政府部門,在過去若干年的時間里都積累了海量的、 以不同形式存儲的數(shù)據(jù)資料。由于這些資料十分復雜,要從中發(fā)現(xiàn)有價值的信息或知識, 達到為決策服務的目的,成為非常艱巨的任務。數(shù)據(jù)挖掘方法的提出,讓人們有能力最 終認識數(shù)據(jù)的真正價值,即蘊藏在數(shù)據(jù)中的信息和知識。目前的數(shù)據(jù)庫系統(tǒng)可以高效地 實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù) 現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導致了“數(shù)據(jù) 爆炸但知識貧乏”的現(xiàn)象。這就需要新的技術和工具來幫助人們自動地提取和分析隱藏 在這些數(shù)據(jù)中的知識,數(shù)據(jù)挖掘( d a t am i n i n g ) ,也稱知識發(fā)現(xiàn)( k d d ,k n o w l e d g e d i s c o v e r yi nd a t a b a s e ) 就是致力于這門學科。 數(shù)據(jù)挖掘( d a t a m i n i n g ) ,一種比較公認的定義是w j f r a w l e y , g p i a t e t s k ys h a p i r o 等 人提出的【7 , 8 1 :數(shù)據(jù)挖掘,就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識。這些知識 是隱含的、事先未知的潛在有用信息,提取的知識表示為概念( c o n c e p t s ) 、規(guī)則( r u l e s ) 、 規(guī)律( r e g u l a r i t i e s ) 、模式( p a t t e r n s ) 等形式。這種定義把數(shù)據(jù)挖掘的對象定義為數(shù)據(jù)庫。 而更為廣義的說法是:數(shù)據(jù)挖掘意味著在一些事實或觀察數(shù)據(jù)的集合中尋找模式的決策 支持過程。數(shù)據(jù)挖掘的對象不僅是數(shù)據(jù)庫,也可以是文件系統(tǒng),或其它任何組織在一起 的數(shù)據(jù)集合。數(shù)據(jù)挖掘確切地講是一種決策支持過程,它主要基于人工智能、機器學習、 統(tǒng)計學等技術,高度自動化地分析企業(yè)原有的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛 在的模式,預測客戶的行為,幫助企業(yè)的決策者調(diào)整市場策略,減少風險,做出正確的 決策。 2 1 2 數(shù)據(jù)挖掘的主要功能及模式 數(shù)據(jù)挖掘的主要功能是確定數(shù)據(jù)挖掘任務中要找的模式類型,數(shù)據(jù)挖掘任務一般可 以分為描述和預測兩大類,描述性挖掘任務主要是刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性,預測 一6 一 大連理工大學碩士學位論文 性挖掘任務是在當前數(shù)據(jù)上進行推斷,以進行預測。如圖2 1 所示,每類模型下都包含一 些需要用到該類模型的最常用的數(shù)據(jù)挖掘任務【9 】。 圖2 1 數(shù)據(jù)挖掘類型及任務圖 f i g 2 1 c o m p o n e n t so f d a t aa c q u i s i t i o ns y s t e m 數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型介紹如下: ( 1 ) 分類、預測 分類就是通過研究已分類的樣本集的特征,分析樣本集的屬性,建立一個分類函數(shù) 或分類模型,通過這個分類模型,未分類的或新的數(shù)據(jù)就可以分派到不同的類別中,達 到分類的目的。分類可以用決策樹歸納、貝葉斯網(wǎng)絡、人工神經(jīng)元網(wǎng)絡( 如b p 網(wǎng)絡等) , 粗糙集、遺傳算法、k - 一最臨近分類和支持向量機等方法。分類可以預測對象的類標記, 當要預測的數(shù)據(jù)是數(shù)值數(shù)據(jù)( 連續(xù)值) ,而不是離散的類別標志時,我們可以稱之為預測。 預測主要使用回歸方法,當然也可以使用人工神經(jīng)元網(wǎng)絡、遺傳算法、支持向量機等機 器學習方法。 ( 2 ) 關聯(lián)規(guī)則 數(shù)據(jù)庫中的數(shù)據(jù)之間一般都存在某種關聯(lián)關系,即變量之間可能存在某種規(guī)律,關 聯(lián)規(guī)則挖掘的任務就是找出數(shù)據(jù)庫中哪些事物或?qū)傩怨餐霈F(xiàn)的條件。最有影響力的關 聯(lián)規(guī)則挖掘的算法是r a k e s ha g r w a l 等人提出的a p r i o r i 算法,近年來,也出現(xiàn)了很多 a p r i o r i 的改進算法,如e d i t hc o h e n 等人提出的不需要剪枝的改進算法,m o h a m m e d j z a k i 提出的可伸縮的改進算法等。 ( 3 ) 聚類分析 聚類是將對象集合按照相似性歸為若干類別,屬于無指導分類,屬于同一類的對象 具有較高的某種相似性,而不同類的對象之間的差別較大。通過聚類,識別密集和稀疏 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 的區(qū)域,發(fā)現(xiàn)全局的分布模式及數(shù)據(jù)屬性之間的相互關系,幫助人們建立宏觀概念。聚 類的方法主要可以分為:劃分方法( p a r t i t i o n i n g m e t h o d ) 、層次方法( h i e r a r c h i c a l m e t h o d ) 、 基于密度的方法( d e n s i t y - b a s e dm e t h o d ) 、基于網(wǎng)格的方法( g r i d - b a s e dm e t h o d ) 和基于模 型的方法。其中,劃分方法中用的比較多的是k - 平均算法和k 一中心點算法。b i r c h 和c u r e 就是比較典型的層次方法,d b s c a n 是比較有代表意義的基于密度的方法, s t i n g 算法是典型的基于網(wǎng)格的方法,基于模型的方法有統(tǒng)計學方法、人工神經(jīng)元網(wǎng)絡 方法( 如k o h o n e n 網(wǎng)絡) 等。 “) 類概念描述 數(shù)據(jù)可以與類或概念相關聯(lián),用匯總的、簡潔的、精確的方式描述每個類和概念是 有用的,目的是對數(shù)據(jù)進行濃縮,給出它的總體的綜合描述,實現(xiàn)對原始數(shù)據(jù)的總體把 握。這種類或概念的描述稱為類概念描述。通過類概念描述使得人們能夠在復雜數(shù)據(jù) 庫中了解數(shù)據(jù)的意義以及產(chǎn)生數(shù)據(jù)的過程。這種描述可以通過匯總所研究類的數(shù)據(jù)來獲 得( 這個過程也叫數(shù)據(jù)特征化) 或?qū)⑺芯款惻c其它的比較類進行比較來獲得,或采用上 面兩種方法的結(jié)合?;跀?shù)據(jù)立方體的o l a p 上卷操作來執(zhí)行指定維的數(shù)據(jù)匯總就是一 種很有效的數(shù)據(jù)特征化的方法,數(shù)據(jù)特征化的輸出通常采用如餅圖、柱狀圖、多維數(shù)據(jù) 立方體等形式來形象的表現(xiàn)出來。 ( 5 ) 孤立點分析 數(shù)據(jù)庫中經(jīng)常存在這樣一些數(shù)據(jù)對象,它們與數(shù)據(jù)的一般行為或模型不一致,這些 數(shù)據(jù)對象我們就稱之為孤立點。在一般情況下,數(shù)據(jù)挖掘方法會將孤立點視為噪聲或異 常而丟棄,但是在特殊場合,如在電子商務領域,探測和分析孤立點顯得比正常數(shù)據(jù)還 來的重要。 ( 6 ) 演變分析 數(shù)據(jù)演變分析( e v o l u t i o na n a l y s i s ) 用來描述行為隨時間變化的對象的規(guī)律或趨勢, 并對其建模。時間趨勢分析考慮時間上的變化趨勢,空間趨勢則要根據(jù)某空間維找出變 化趨勢。 2 1 3 數(shù)據(jù)挖掘常用技術 ( 1 ) 決策樹 代表著決策集的樹形結(jié)構(gòu)。決策樹是對分類問題進行深入分析的一種方法,在實際 問題中,按算法生成的決策樹往往復雜而龐大,令用戶難以理解。這就告訴我們在重分 類精確性的同時,也要加強對樹修剪的研究。 大連理工大學碩士學位論文 數(shù)據(jù)挖掘中決策樹是一種經(jīng)常要用到的技術,可以用于分析數(shù)據(jù),同樣也可以用來 作預測。常用的算法有c h a i d ,c a r t ,q u e s t 等。決策樹提供了一種展示類似在什么 條件下會得到什么值這類規(guī)則的方法。 決策樹中最上面的節(jié)點稱為根節(jié)點,是整個決策樹的開始。決策樹的每個節(jié)點子節(jié) 點的個數(shù)與決策樹所用的算法有關。每個分支要么是一個新的決策節(jié)點,要么是樹的結(jié) 尾,稱為葉子。在沿著決策樹從上到下遍歷的過程中,在每個節(jié)點都會遇到一個問題, 對每個節(jié)點上問題的不同回答導致不同的分支最后會到達一個葉子節(jié)點。這個過程就是 利用決策樹進行分類的過程,利用幾個變量( 每個變量對應一個問題) 來判斷所屬的類別 ( 最后每個葉子會對應一個類別) 。假如負責借貸的銀行官員利用上面這棵決策樹來決定 支持哪些貸款和拒絕哪些貸款,那么他就可以用貸款申請表來運行這棵決策樹,用決策 樹來判斷風險的大小?!澳晔杖?¥4 0 0 0 0 ”和“高負債”的用戶被認為是“高風險”, 同時“收入 5 年”的申請,則被認為“低風險”而建議貸款 給用戶。 ( 2 ) 人工神經(jīng)網(wǎng)絡 神經(jīng)網(wǎng)絡建立在自學習的數(shù)學模型基礎之上。它可以對大量復雜的數(shù)據(jù)進行分析, 并可以完成對人腦或其他計算機來說極為復雜的模式抽取及趨勢分析。神經(jīng)網(wǎng)絡系統(tǒng)由 一系列類似于人腦神經(jīng)元一樣的處理單元組成,我們稱之為節(jié)點( n o d e ) 。這些節(jié)點通過 網(wǎng)絡彼此互連,如果有數(shù)據(jù)輸入,它們便可以進行確定數(shù)據(jù)模式的工作。神經(jīng)網(wǎng)絡有相 互連接的輸入層、中間層( 或隱藏層) 、輸出層組成。中問層由多個節(jié)點組成,完成大部 分網(wǎng)絡工作。輸出層輸出數(shù)據(jù)分析的執(zhí)行結(jié)果。例如;我們可以指定輸入層為代表過去 的銷售情況、價格及季節(jié)等因素,輸出層便可輸出判斷本季度的銷售情況的數(shù)據(jù)。 神經(jīng)網(wǎng)絡近來越來越受到人們的關注,因為它為解決大復雜度問題提供了一種相對 來說比較有效的簡單方法。神經(jīng)網(wǎng)絡可以很容易的解決具有上百個參數(shù)的問題( 當然實 際生物體中存在的神經(jīng)網(wǎng)絡要比我們這里所說的程序模擬的神經(jīng)網(wǎng)絡要復雜的多) 。神 經(jīng)網(wǎng)絡常用于兩類問題:分類和回歸。在結(jié)構(gòu)上,可以把一個神經(jīng)網(wǎng)絡劃分為輸入層、 輸出層和隱含層。輸入層的每個節(jié)點對應一個個的預測變量。輸出層的節(jié)點對應目標變 量,可有多個。在輸入層和輸出層之間是隱含層( 對神經(jīng)網(wǎng)絡使用者來說不可見) ,隱含 層的層數(shù)和每層節(jié)點的個數(shù)決定了神經(jīng)網(wǎng)絡的復雜度。 神經(jīng)元網(wǎng)絡和統(tǒng)計方法在本質(zhì)上有很多差別。神經(jīng)網(wǎng)絡的參數(shù)可以比統(tǒng)計方法多很 多。由于多,參數(shù)通過各種各樣的組合方式來影響輸出結(jié)果,以至于很難對一個神經(jīng)網(wǎng) 絡表示的模型做出直觀的解釋。實際上神經(jīng)網(wǎng)絡也正是當作“黑盒”來用的,不用去管 “盒子”里面是什么,只管用就行了。在大部分情況下,這種限制條件是可以接受的。 一9 一 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 比如銀行可能需要一個筆跡識別軟件,但他沒必要知道為什么這些線條組合在一起就是 一個人的簽名,而另外一個相似的則不是。在很多復雜度很高的問題如化學試驗、機器 人、金融市場的模擬、和語言圖像的識別,等領域神經(jīng)網(wǎng)絡都取得了很好的效果。神經(jīng) 網(wǎng)絡的另一個優(yōu)點是很容易在并行計算機上實現(xiàn),可以把他的節(jié)點分配到不同的c p u 上并行計算。 ( 3 ) 遺傳算法 遺傳算法( g e n e t i ca l g o r i t h m , g a ) 是近幾年發(fā)展起來的一種嶄新的全局優(yōu)化算法,是 一種基于生物進化論和分子遺傳學的搜索優(yōu)化算法。它借用了生物遺傳學的觀點,通過 自然選擇、遺傳、變異等作用機制,實現(xiàn)各個個體的適應性的提高。這一點體現(xiàn)了自然 界中“物競天擇、適者生存”進化過程。1 9 6 2 年h o l l a n d 教授首次提出了g a 算法的思 想,從而吸引了大批的研究者,迅速推廣到優(yōu)化、搜索、機器學習等方面,并奠定了堅 實的理論基礎。 遺傳算法是首先將問題可能的解按某種形式進行編碼,編碼后的解稱為染色體;隨 機選取n 個染色體作為初始種群,再根據(jù)預定的評價函數(shù)對每個染色體計算適應值,性 能較好的染色體有較高的適應值;選擇適應值較高的染色體進行復制,并通過遺傳算子, 產(chǎn)生一群新的更適應環(huán)境的染色體,形成新的種群,直至最后收斂到一個最適應環(huán)境的 個體,得到問題的最優(yōu)化解。 ( 4 ) 近鄰算法 將數(shù)據(jù)集合中每一個記錄進行分類的方法。依據(jù) d oa sy o u rn e i g h b o r sd o 的原則, 相鄰數(shù)據(jù)必然有相同的屬性或行為。k - - n e a r e s t 鄰居方法的含義為:k 表示某個特定數(shù) 據(jù)的k 個鄰居,可以通過k 個鄰居的平均數(shù)據(jù)來預測該特定數(shù)據(jù)的某個屬性或行為。 ( 5 ) 規(guī)則推導 從統(tǒng)計意義上對數(shù)據(jù)中的“如果一那么”規(guī)則進行尋找和推導。采用上述技術的某 些專門的分析工具己經(jīng)發(fā)展了大約l o 年的歷史,不過這些工具所面對的數(shù)據(jù)量通常較 小?,F(xiàn)在這些技術已經(jīng)被直接集成到許多大型的工業(yè)標準的數(shù)據(jù)倉庫和聯(lián)機分析系統(tǒng)中 去了。 2 1 4 數(shù)據(jù)挖掘的應用 數(shù)據(jù)挖掘所要處理的問題,就是在龐大的數(shù)據(jù)庫中找出有價值的隱藏事件,并且加 以分析,獲取有意義的信息,歸納出有用的結(jié)構(gòu),作為企業(yè)進行決策的依據(jù)。其應用非 常廣泛,只要該產(chǎn)業(yè)有分析價值與需求的數(shù)據(jù)庫,皆可利用m i n i n g 工具進行有目的的 發(fā)掘分析。 大連理工大學碩士學位論文 ( 1 ) 數(shù)據(jù)挖掘解決的典型商業(yè)問題 需要強調(diào)的是,數(shù)據(jù)挖掘技術從一開始就是面向應用的。目前,在很多領域,數(shù)據(jù) 挖掘都是一個很時髦的詞,尤其是在如銀行、電信、保險、交通、零售( 如超級市場) 等 商業(yè)領域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括:數(shù)據(jù)庫營銷( d a t a b a s em a r k e t i n g ) 、 客戶群體劃分( c u s t o m e rs e g m e n t a t i o n c l a s s i f i c a t i o n ) 、背景分析( p r o f i l ea n a l y s i s ) 、交叉 銷售( c r o s s s e l l i n g ) 等市場分析行為,以及客戶流失性分析( c h u r n a n a l y s i s ) 、客戶信用記 分( c r e d i ts c o r i n g ) 、欺詐發(fā)現(xiàn)( f r a u d d e t e c t i o n ) 等等。 ( 2 ) 數(shù)據(jù)挖掘在市場營銷的應用 數(shù)據(jù)挖掘技術在企業(yè)市場營銷中得到了比較普遍的應用,它是以市場營銷學的市場 細分原理為基礎,其基本假定是“消費者過去的行為是其今后消費傾向的最好說明”。 通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體 的興趣、消費習慣、消費傾向和消費需求,進而推斷出相應消費群體或個體下一步的消 費行為,然后以此為基礎,對所識別出來的消費群體進行特定內(nèi)容的定向營銷,這與傳 統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷 效果,從而為企業(yè)帶來更多的利潤。 商業(yè)消費信息來自市場中的各種渠道。例如,每當我們用信用卡消費時,商業(yè)企業(yè): 就可以在信用卡結(jié)算過程收集商業(yè)消費信息,記錄下我們進行消費的時間、地點、感興 趣的商品或服務、愿意接收的價格水平和支付能力等數(shù)據(jù);當我們在申辦信用卡、辦理 汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表格的場合時,我們的個人信息就存入 了相應的業(yè)務數(shù)據(jù)庫;企業(yè)除了自行收集相關業(yè)務信息之外,甚至可以從其他公司或機 構(gòu)購買此類信息為自己所用。 這些來自各種渠道的數(shù)據(jù)信息被組合,應用超級計算機、并行處理、神經(jīng)元網(wǎng)絡、 模型化算法和其他信息處理技術手段進行處理,從中得到商家用于向特定消費群體或個 體進行定向營銷的決策信息。這種數(shù)據(jù)信息是如何應用的呢? 舉一個簡單的例子,當銀 行通過對業(yè)務數(shù)據(jù)進行挖掘后,發(fā)現(xiàn)一個銀行賬戶持有者突然要求申請雙人聯(lián)合賬戶 時,并且確認該消費者是第一次申請聯(lián)合賬戶,銀行會推斷該用戶可能要結(jié)婚了,它就 會向該用戶定向推銷用于購買房屋、支付子女學費等長期投資業(yè)務,銀行甚至可能將該 信息賣給專營婚慶商品和服務的公司。 數(shù)據(jù)挖掘構(gòu)筑競爭優(yōu)勢。在市場經(jīng)濟比較發(fā)達的國家和地區(qū),許多公司都開始在原 有信息系統(tǒng)的基礎上通過數(shù)據(jù)挖掘?qū)I(yè)務信息進行深加工,以構(gòu)筑自己的競爭優(yōu)勢,擴 大自己的營業(yè)額。美國運通公司( a m e r i c a ne x p r e s s ) 有一個用于記錄信用卡業(yè)務的數(shù)據(jù) 庫,數(shù)據(jù)量達到5 4 億字符,并仍在隨著業(yè)務進展不斷更新:運通公司通過對這些數(shù)據(jù) 數(shù)據(jù)挖掘方法在采購優(yōu)化中的研究與應用 進行挖掘,制定了“關聯(lián)結(jié)算( r e l a t i o n s h i p b i u i n g :) 優(yōu)惠”的促銷策略,即如果一個顧客 在一個商店用運通卡購買一套時裝,那么在同一個商店再買一雙鞋,就可以得到比較大 的折扣,這樣既可以增加商店的銷售量,也可以增加運通卡在該商店的使用率。再如, 居住在倫敦的持卡消費者如果最近剛剛乘英國航空公司的航班去過巴黎,那么他可能會 得到一個周末前往紐約的機票打折優(yōu)惠卡。 基于數(shù)據(jù)挖掘的營銷,常??梢韵蛳M者發(fā)出與其以前的消費行為相關的推銷材 料??ǚ? k r a f t ) 食品公司建立了一個擁有3 0 0 0 萬客戶資料的數(shù)據(jù)庫,數(shù)據(jù)庫是通過收 集對公司發(fā)出的優(yōu)惠券等其他促銷手段做出積極反應的客戶和銷售記錄而建立起來的, 卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎向他們發(fā)送特定產(chǎn)品 的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜。美國的讀者文摘 ( r e a d e r sd i g e s t ) 出版公司運行著一個積累了4 0 年的業(yè)務數(shù)據(jù)庫,其中容納有遍布全球 的一億多個訂戶的資料,數(shù)據(jù)庫每天2 4 小時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論