




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、課 程 論 文( 2014/ 2015 學(xué)年 第一學(xué)期)課程名稱數(shù)據(jù)挖掘論文名稱寫作時間2014年 12 月 28日指導(dǎo)單位計算機學(xué)院指導(dǎo)教師 葉水仙學(xué)生姓名班級學(xué)號B12111823學(xué)院(系)管理學(xué)院專 業(yè)信息管理與信息系統(tǒng)數(shù)據(jù)挖掘在網(wǎng)絡(luò)游戲客戶關(guān)系管理的應(yīng)用摘要 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲客戶關(guān)系管理中的應(yīng)用現(xiàn)今,數(shù)據(jù)挖掘技術(shù)已經(jīng)在各個領(lǐng)域得以應(yīng)用,并有了相當?shù)陌l(fā)展。許多學(xué)者對數(shù)據(jù)挖掘的研究及其在客戶關(guān)系管理中的應(yīng)用上獲得了相當?shù)耐黄?,很多行業(yè)因此獲益匪淺。在我國,網(wǎng)絡(luò)游戲作為一個新興不久的行業(yè),擁有著巨大的市場和龐大的潛力,但隨之而來的是愈發(fā)激烈的市場競爭,一些主流的游戲運營商已經(jīng)把目光投向
2、了在傳統(tǒng)行業(yè)中取得了巨大成功的客戶關(guān)系管理體制。但是,不同于其他行業(yè),網(wǎng)絡(luò)游戲是建立在網(wǎng)絡(luò)信息交流平臺之上,它所搜集到的客戶數(shù)據(jù)更為龐大和繁雜,那么怎樣從如此龐大的數(shù)據(jù)中找到有效資料呢?這就需要應(yīng)用到數(shù)據(jù)挖掘技術(shù)。本文簡要介紹了網(wǎng)絡(luò)游戲客戶關(guān)系管理的模式和內(nèi)容以及幾種主要的數(shù)據(jù)挖掘技術(shù);著重利用決策樹玩家進行了分類、利用神經(jīng)網(wǎng)絡(luò)對玩家流失進行了分析、利用粗糙集對玩家信息進行了挖掘。通過上述分析論證了數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲客戶關(guān)系管理中應(yīng)用的可行性和有效性。關(guān)鍵詞:網(wǎng)絡(luò)游戲;客戶關(guān)系管理;數(shù)據(jù)挖掘;決策樹;Data mining in customer relationship manageme
3、nt network game applicationsAbstractData mining technology in the network game of todays customer relationship management, data mining techniques have been applied in various fields, and has considerable development. Many scholars study on data mining and gained considerable breakthrough in customer
4、 relationship management application, and therefore benefit many industries. In China, online games industry as an emerging soon, has a huge market and a huge potential, but the attendant is increasingly fierce market competition, some mainstream gaming operators have set their sights on traditional
5、 industries We have achieved great success in customer relationship management system. However, unlike other industries, online games are built on top of a network for information exchange platform, which it collect customer data more large and complex, then how to find effective information from su
6、ch a large data in it? This requires the application of data mining techniques. This article briefly describes the mode and content of online games as well as customer relationship management several major data mining techniques; focus on the use of decision trees players were classified by using ne
7、ural networks for the loss of players were analyzed using rough set mining player information . Through the above analysis demonstrated the feasibility and effectiveness of data mining technology in the network game customer relationship management applications.Key words:Online games; customer relat
8、ionship management; data mining; decision tree;一、研究意義及思路“網(wǎng)絡(luò)游戲”也被成為“在線游戲”(Online Games),是通過互聯(lián)網(wǎng)進行、可以多人同時參與的電腦游戲,是通過人與人之間的互動以達到交流、娛樂和休閑的目的。網(wǎng)絡(luò)游戲不同于其他行業(yè),它建立在網(wǎng)絡(luò)信息交流平臺之上,因此,它所搜集到的客戶數(shù)據(jù)更為龐大和繁雜,那么如何從如此龐大的數(shù)據(jù)中找到有效資料,又如何應(yīng)用于客戶關(guān)系管理之上,這便是我們需要去研究的問題。在我國,網(wǎng)絡(luò)游戲是一個新興的行業(yè),對其研究多集中于法律的虛擬財產(chǎn)案件上,網(wǎng)絡(luò)游戲客戶關(guān)系管理方面的研究寥寥無幾。雖然如此,但我們?nèi)耘f可
9、以通過數(shù)據(jù)挖掘技術(shù)在其他行業(yè)上的客戶關(guān)系管理中的應(yīng)用里進行參考, 進而對數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲客戶關(guān)系管理中的應(yīng)用的可行性,有效性進行探討。哈爾濱工程大學(xué)的鞠偉平,鄧憶瑞所刊登的基于決策樹的數(shù)據(jù)挖掘方法在CRM中的應(yīng)用研究中指出:“客戶關(guān)系管理是一種旨在加強企業(yè)與客戶之間關(guān)系的新的管理機制。其如何利用數(shù)據(jù)挖掘技術(shù)對客戶數(shù)據(jù)進行深層分析,保留高價值客戶、發(fā)掘潛力客戶,實現(xiàn)在恰當?shù)臅r間,為客戶提供合適產(chǎn)品和服務(wù)是現(xiàn)在客戶關(guān)系管理中的研究重點。本文將數(shù)據(jù)挖掘中的ID3分類算法應(yīng)用于CRM系統(tǒng)中,不僅可以使企業(yè)更好地發(fā)現(xiàn)客戶群特征,掌握市場動態(tài),同時也將有助于企業(yè)的管理全面走向信息化。3”山東財政學(xué)院
10、的董寧所刊登的數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用中指出:“數(shù)據(jù)挖掘技術(shù) 幫助企業(yè)管理客戶生命周期的各個階段,包括客戶的識別、獲取新的客戶、讓已有的客戶創(chuàng)造更多的利潤、保持住有價值的客戶等。它能夠幫助企業(yè)確定客戶的特點,使企業(yè)能夠為客戶提供有針對性的服務(wù)客戶識別的關(guān)鍵問題是確定對企業(yè)有意義客戶的標準數(shù)據(jù)挖掘技術(shù)應(yīng)用在對營銷的反映情況的預(yù)測上。根據(jù)歷史數(shù)據(jù)運用數(shù)據(jù)挖掘技術(shù)建立“客戶行為反應(yīng)”預(yù)測模型,對客戶的未來行為進行預(yù)測解決客戶流失問題,可以使用數(shù)據(jù)挖掘方法對已經(jīng)流失客戶進行分類,并對每類流失客戶的特征進行描述。然后,使用關(guān)聯(lián)、近鄰等挖掘技術(shù)和方法對現(xiàn)有客戶消費行為進行分析, 以確定每類客戶流失的可
11、能性,其中著重于發(fā)現(xiàn)那些流失可能性大的優(yōu)質(zhì)客戶。 4” 華中師范大學(xué)經(jīng)濟學(xué)院的曹萍刊登的利用數(shù)據(jù)挖掘技術(shù)(DM)提升客戶關(guān)系管理(CRM)中指出:“客戶關(guān)系管理系統(tǒng)隨著信息技術(shù)的發(fā)展和企業(yè)管理理念的轉(zhuǎn)變,己受到國內(nèi)外企業(yè)的廣泛重視。在實際應(yīng)用中 CRM 還可進一步延伸企業(yè)供應(yīng)鏈管理,與ERP (企業(yè)資源計劃)進行整合, 將客戶、經(jīng)銷商、銷售和人力資源等方。面鏈接起來,構(gòu)成企業(yè)完整的管理信息系統(tǒng)。CRM作為企業(yè)的前臺提供供應(yīng)鏈中的下游鏈管理,實現(xiàn)企業(yè)對客戶個性化需求的快速反應(yīng)。DM 作為CRM中的關(guān)鍵信息技術(shù),其在CRM中的應(yīng)用與發(fā)展,必將為企業(yè)在信息時代提供看得見的優(yōu)勢。5” Penzias曾
12、在計算機世界上評論說:“DM 將變得更加重要,由于DM如此有價值以至于企業(yè)不再會丟失與其客戶有關(guān)的任何事物。如果你不在這方面做些什么,那么你將失去你的生意?!边€有許多專家和研究者提出了許多觀點,都說明DM在CRM中的應(yīng)用是可行的,是必要的,是具有強大競爭力的。隨著社會信息化的不斷建設(shè),網(wǎng)絡(luò)設(shè)備的不斷提升以及社會需求的不斷增加,DM 技術(shù)在CRM領(lǐng)域運用將得到普及。至2007年1月,中國互聯(lián)網(wǎng)用戶已經(jīng)達到1.37億人,其中26.6%的用戶為網(wǎng)絡(luò)游戲用戶群體,市場規(guī)模已達到93.6億元人民幣。隨著中國互聯(lián)網(wǎng)發(fā)展,網(wǎng)絡(luò)游戲市場還會持續(xù)增加。2”但是激烈的競爭是不可避免的,面對平均粘稠度僅為7.9個月
13、的網(wǎng)絡(luò)游戲玩家來說,如何吸引及留住玩家,如何掌握優(yōu)質(zhì)客戶已經(jīng)成為各游戲運營商的當務(wù)之急。在其它行業(yè)取得巨大成功的客戶關(guān)系管理體系已越來越受到網(wǎng)絡(luò)游戲運營商的重視,幾個主流運營商:騰訊,網(wǎng)易,世紀,久游,九城,盛大等都在近年紛紛建立和完善客服體系,以應(yīng)對愈發(fā)激烈的市場競爭。如今的客戶關(guān)系管理已從“被動型”轉(zhuǎn)向“主動型”,如果能夠通過各種數(shù)據(jù)挖掘技術(shù),對龐大的玩家數(shù)據(jù)進行挖掘分析,對玩家進行分類, 判斷玩家行為, 預(yù)測玩家流失, 分析玩家興趣等, 就可以使客戶關(guān)系管理目標更明確化,客服更主動化,形式更人性化,以達到利益最大化。論文將通三大版塊進行分析探索:1、通過對網(wǎng)絡(luò)游戲的介紹,網(wǎng)絡(luò)游戲客戶關(guān)系
14、管理內(nèi)容的分析,并對一種類型網(wǎng)絡(luò)游戲(MMORPG)生命周期的分析,使讀者對網(wǎng)絡(luò)游戲及其客戶關(guān)系管理有一個相對具體的概念,以方便數(shù)據(jù)挖掘案例分析的說明。2、介紹十種主流的數(shù)據(jù)挖掘技術(shù),讓讀者對數(shù)據(jù)挖掘技術(shù)有個相當?shù)母拍?,以方便?shù)據(jù)挖掘案例分析的說明。3、著重通過利用決策樹對玩家進行了分類;利用神經(jīng)網(wǎng)絡(luò)對玩家流失進行了分析判斷;利用粗糙集對玩家信息進行了挖掘。這三個案例,來論證數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲客戶關(guān)系管理中應(yīng)用的可行性和有效性。 二、網(wǎng)絡(luò)游戲的客戶關(guān)系管理 2.1 網(wǎng)絡(luò)游戲分類 網(wǎng)絡(luò)游戲其實是電子游戲中的一種,其中角色扮演類網(wǎng)絡(luò)游戲(MMORPG) 和大中型休閑游戲占據(jù)了大多數(shù)的市場份額,
15、因此本文所有的研究內(nèi)容都是針對這兩種網(wǎng)游形式進行分析的。一角色扮演類網(wǎng)絡(luò)游戲 MMORPG(Massive Multiplayer Online Role Playing Game), 即大型多人在線角色扮演類游戲, 這是目前最主流的在線游戲類型,游戲構(gòu)筑了一個有基本健全的社會體制和經(jīng)濟系統(tǒng)的虛擬世界,玩家在游戲虛擬世界中扮演特定角色,通過自己的游戲技能及其它各方面投入,實現(xiàn)自己所扮演的角色在游戲虛擬社會中的生存和成長,并參與游戲虛擬世界的人際溝通及社會活動 等。目前有56%的玩家分布在其中。二休閑游戲休閑對戰(zhàn)類網(wǎng)絡(luò)游戲(Casual / Lobby Game),簡稱休閑游戲,包括大中型休閑網(wǎng)
16、絡(luò)游戲和游戲平臺上的游戲。休閑游戲本身是網(wǎng)絡(luò)游戲的一種,休閑游戲的特點在于回合制、階段性, 玩一盤所耗費的時間一般不會超過 10 分鐘。通過玩休閑游戲這種娛樂方式,玩家通常可以得到 放松、休息。目前 40%玩家分布在大中型休閑游戲中;4%玩家分布在平臺類游戲中 。 2.2網(wǎng)絡(luò)游戲客戶關(guān)系管理范圍 2.2.1游戲帳號及安全措施服務(wù) 帳號的安全是網(wǎng)絡(luò)游戲客戶關(guān)系管理的重中之重!是在客戶關(guān)系管理涉及到的范圍中客戶流失率最高的一個。如果一個 MMORPG 游戲帳號被盜,考察期的玩家流失率基本為百分百,形成期流失率也很高,即使是穩(wěn)定期的玩家,如果帳號不安全了,也會考慮退出,所以一個游戲想延長他的生命周期
17、就必須要最大限度的保證安全措施做到位。 2.2.2游戲內(nèi)容及玩法服務(wù) 這是吸引新玩家,延長老玩家生命周期的重要手段。一個游戲是否讓玩家有歸屬感,除了游戲本身和游戲內(nèi)玩家的交流,游戲管理人員和玩家的交流也是一大因素。 2.2.3游戲線下活動 組織玩家舉行游戲外的各種活動,對于穩(wěn)定期的玩家來說具有極大的吸引力。這樣的活動能極大地延長玩家的生命周期,很好地宣傳游戲。 2.2.4游戲的更新及版本 當游戲出現(xiàn)問題,更新是很好的解決方法。當玩家進入穩(wěn)定后期,開始邁向衰退期的時候,游戲的新版本,新玩法能延長玩家的生命周期,乃至延長整個游戲的生命周期。2.2.5客戶分析及客戶正面引導(dǎo) 客戶分析包括很多,也是需
18、要運用數(shù)據(jù)挖掘最多的地方。比如玩家資料分析,玩家行為分析,玩家流失分析,玩家期望分析,玩家導(dǎo)向分析,玩家流動分析等等。凡是涉及到游戲利益有關(guān)的玩家數(shù)據(jù)都是其分析的目標??蛻粽嬉龑?dǎo)就是利用客戶服務(wù)系統(tǒng),對玩家進行有利于運營商的行為引導(dǎo)。比如:正面言論引導(dǎo),客戶流失引導(dǎo)(當一個優(yōu)質(zhì)客戶必定離開該游戲時,客戶服務(wù)就需要利用各種方法,盡可能地引導(dǎo)其進入該運營商運營的其他游戲,即使失敗也要使玩家對運營商存在好感,當運營商推出新游戲時就有極大可能使該玩家再次消費)等等。 三、客戶生命周期 客戶生命周期根據(jù)Dwyer的五階段模型,MMORPG客戶關(guān)系發(fā)展分為:考察期,形成期,穩(wěn)定期,退化期;其簡要描述如下
19、 3.1考察期 這是關(guān)系的探索和實驗階段,在該階段,玩家測試和考察游戲是否值得自己繼續(xù)玩下去。考察期內(nèi)的客戶,客戶的消費量很少或者根本沒有消費量; 而服務(wù)成本和交易成本卻是最高的;間接效益基本沒有,最多只是聚集人氣;利潤很低甚至可能是負利潤;由于不確定性很高,這段時期內(nèi)的客戶流失可能性很大,新游戲出現(xiàn),不好玩,家人反對朋友離開等都有可能造成客戶流失。 3.2形成期 這是關(guān)系的快速發(fā)展階段,雙方關(guān)系能進入這一階段,表明考察期玩家對該游戲基本滿意,建立了一定的好感與依賴。形成期的客戶,客戶的消費量開始呈上升趨勢,而到形成后期更加明顯而服務(wù)成本和交易成本開始明顯下降;間接效益有所形成但不是很明顯,只
20、有到形成后期才有擴大趨勢;利潤快速上升,到形成后期開始向最高點接近;在這一階段,由于玩家對游戲的了解與依賴的增加,玩家開始對游戲產(chǎn)生一定感情,游戲虛擬財產(chǎn)開始累加,客戶流失情況開始好轉(zhuǎn)。但是流失數(shù)量還是很多,特別是“盜號”對該階段客戶的打擊是毀滅性的,一旦玩家虛擬財產(chǎn)損失過大就會導(dǎo)致玩家放棄游戲,所以對游戲客戶安全 服務(wù),特別是防盜,帳號找回,損失挽回等工作要特別細致。 3.3穩(wěn)定期 這是關(guān)系發(fā)展的最高階段,在這個階段,玩家已經(jīng)沉迷于游戲中,對游戲有了相當?shù)暮酶信c依賴。穩(wěn)定期的客戶,客戶的消費量是最大的也是最穩(wěn)定的;而服務(wù)成本和交易成本開始降到一個最低點;間接效益已經(jīng)相當明顯,并且進一步擴大中
21、;利潤進入一個穩(wěn)定的高水平;在這個階段被稱為“鐵桿玩家”,對游戲的關(guān)注度和期望度會相當高,會對游戲提出各種意見和建議,會主動拉攏朋友進入游戲;這個階段的玩家外界干擾對其影響也是最小的,即使有人勸阻玩家游戲,號被盜而損失嚴重,游戲中朋友流失等情況也很難讓他放棄游戲。所以管理人員要重視這部分玩家,積極聽取他們意見,甚至可以給予他們一部分游戲中的管理權(quán)限,盡可能延長穩(wěn)定期。 3.4退化期 這是關(guān)系發(fā)展過程中關(guān)系水平逆轉(zhuǎn)的階段。關(guān)系的退化并不一定在穩(wěn)定期之后,其實任何一個時期都有可能因為各種原因退化。退化期的客戶,客戶的消費量開始回落,也可能是直接消失;而服務(wù)成本和交易成本開始回升,因此要盡量挽留這些
22、客戶,但一般不會超過考察期的費用,所以挽留客戶比建立個新客戶成本要低的多;間接效益開始縮小,如果玩家開始傳播壞的口碑,那么間接效益將成為負效益; 利潤開始下降,甚至直接消失;進入這個階段的玩家一般是由于長期玩該游戲而進入一個疲勞階段,一些小的影響就可能使之離開。但由于玩家已經(jīng)投入巨大的經(jīng)歷,對游戲的感情還是比較深厚的,所以挽留這部分的玩家就成為管理者的當務(wù)之急。更新游戲的新玩法,新活動,出新的版本,新的虛擬裝備虛擬寵物等都可以在一定程度上延遲退化期的形成。表2.4.1對上述四個周期的各種影響因素作了個總結(jié)。 四、網(wǎng)絡(luò)游戲客戶關(guān)系管理中的數(shù)據(jù)挖掘4.1客戶分類 4.1.1區(qū)分“優(yōu)質(zhì)客戶” CRM
23、 中心思想就是“優(yōu)質(zhì)客戶”概念,即:20%客戶貢獻 80%利潤。在網(wǎng)絡(luò)游戲中,特別是免費游戲,由于其不收取在線服務(wù)費,單純依靠變賣“虛擬道具”來盈利,“優(yōu)質(zhì)客戶”更為重要,那么如何區(qū)分出這些“優(yōu)質(zhì)客戶”,就成為首要解決的問題。 4.1.2區(qū)分“熱心玩家” 對于網(wǎng)絡(luò)游戲運營商來說,“熱心玩家”不可缺少,他們可能不是“優(yōu)質(zhì)客戶”,但他們肯定是鐵桿玩家,是擁護該網(wǎng)絡(luò)游戲的穩(wěn)定期玩家。他們會熱心提供游戲 BUG,舉報非法玩家,幫助和介紹新玩家,幫助管理更新網(wǎng)站論壇,提高游戲正面影響力。所以找到這些玩家并給予一定的權(quán)限有助于游戲正常運營。 4.1.3區(qū)分“非正常玩家” “非正常玩家”那些虛擬數(shù)據(jù)有異常的
24、帳號,出現(xiàn)的可能有:使用外掛等非法軟件;盜號或利用 BUG 非法獲得大量虛擬物品或經(jīng)驗;利用交易轉(zhuǎn)移非法獲得的物品;不過也可能是玩家通過線下交易獲得大量虛擬物品。如何區(qū)分出這些帳號,并時刻監(jiān)視這些帳號,對延長游戲壽命有很大的作用。 4.1.4發(fā)掘潛在客戶 在考察期間的玩家中就有相當一部分是潛在客戶,他們現(xiàn)在可能沒有消費或者消費不多,但只要他們覺得這個游戲好玩或者其他需要的時候就可能變成“優(yōu)質(zhì)客戶”,比如:一個被游戲所吸引的玩家,其本身沒大量時間且希望變強,并有這個經(jīng)濟條件,那么他就是一個有消費能力和欲望的“潛在客戶”。 4.2客戶行為分析 4.2.1安排GM(GW)在線時間 從理論上來說,一對
25、一的營銷戰(zhàn)略是最好的,但是從成本論來說在網(wǎng)絡(luò)游戲的CRM中這是不可能的,那么如何讓GM(GW)的作用發(fā)揮到最大呢?這就需要去分析挖掘數(shù)據(jù),分析玩家在線時間,游戲流量。分析一天中哪個時間段玩家在線最多,一月中各個時間段玩家在線波動,及一年中玩家上線時間波動變化差異,根據(jù)玩家數(shù)量,分配 GM(GW)的在線時間和數(shù)量。 4.2.2建立自動反饋系統(tǒng) 玩家的數(shù)量是龐大的,因此對客服所提出的問題也有大量是重復(fù)的,特別是新游戲,大量玩家的重復(fù)提問會導(dǎo)致本就不多的GM(GW)重復(fù)工作,效率下降。因此設(shè)置一個自動反饋系統(tǒng),對玩家大量提到的問題進行數(shù)據(jù)庫自動反饋成為有效的解決方法之一, 那么如何篩選數(shù)據(jù)庫中的問題
26、及答案就成為需要解決的問題。 4.2.3客戶流失分析 在競爭愈發(fā)激烈的游戲市場,即使是沒有任何消費的玩家也是運營商的一種資源,因為“優(yōu)質(zhì)客戶”是建立在比沒有消費的“普通客戶”更為“強大”的基礎(chǔ)上,才愿意投入資金玩游戲的,所以,只有大量的“普通客戶”的存在才能吸引“優(yōu)質(zhì)客戶”。因此維系老玩家,是十分重要的,不同于其他產(chǎn)業(yè),網(wǎng)絡(luò)游戲是人們在線交流的一個平臺,某個玩家的流失很有可能出現(xiàn)聯(lián)動性流失玩家。所以監(jiān)視玩家數(shù)據(jù)動態(tài),比如上線時間變化,消費數(shù)量變化等,預(yù)測可能流失的玩家,及時做好與玩家的交流,有助于維護老客戶。 4.2.4客戶細分 由于國家強制推出防沉迷系統(tǒng),身份驗證更為真實(不排除玩家使用他人
27、身份證,導(dǎo)致獲得數(shù)據(jù)有偏差)。另外,由于網(wǎng)絡(luò)游戲虛擬物品現(xiàn)實價值越來越高,非法盜取帳號行為越發(fā)猖狂,因此玩家對帳號安全也越來越重視,注冊帳號時填寫真實資料的比例越來越高,這對玩家數(shù)據(jù)分析極為有利。通過數(shù)據(jù)分析,游戲運營商可以了解“優(yōu)質(zhì)客戶”的身份,職業(yè),地域,喜好以及在線時間等資料,可以因此而進行有效決策。比如:線下活動及宣傳的地點安排,各種活動獎勵的物品內(nèi)容,點卡發(fā)放地點的比例安排,周邊產(chǎn)品的推出地點,客服中心的安排地點及針對方向等等。 4.2.5客戶期望分析 客戶期望分析是通過客戶行為分析,歷史數(shù)據(jù)分析,綜合客戶資料,來分析客戶對游戲的各種期望。比如:游戲中舉行個活動,發(fā)放多少虛擬物品作為
28、獎勵,這需要經(jīng)過嚴格計算的。因為發(fā)放過多虛擬物品會影響游戲內(nèi)市場穩(wěn)定,導(dǎo)致玩家流失,影響玩家消費道具的熱情;發(fā)放過少會引起玩家不滿,游戲評價會降低。這時就要分析客戶期望,找到客戶期望的下限,結(jié)合市場情況,來設(shè)定虛擬物品獎勵的發(fā)生幾率。五、研究方法及原理1、數(shù)據(jù)挖掘的定義5.1 數(shù)據(jù)挖掘概論 數(shù)據(jù)挖掘(data mining,DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要尋找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分為兩類:描述和預(yù)測。描述性挖掘任務(wù)刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。
29、預(yù)測性挖掘任務(wù)是在當前數(shù)據(jù)上進行推斷以進行預(yù)測。 5.2 數(shù)據(jù)挖掘技術(shù) 5.2.1統(tǒng)計技術(shù) 統(tǒng)計技術(shù)對數(shù)據(jù)集進行挖掘的主要思想是:統(tǒng)計的方法對給定的數(shù)據(jù)集合假定了一個分布或者概率的模型(比如一個正態(tài)分布),然后根據(jù)模型采用相應(yīng)的方法進行挖掘。5.2.2關(guān)聯(lián)規(guī)則 數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類很重要的可以發(fā)現(xiàn)的知識。若兩個或者多個變量的取值之間存在某種規(guī)律性,就成為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián),時序關(guān)聯(lián),因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱含的關(guān)聯(lián)網(wǎng),有時并不知道數(shù)據(jù)庫中的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。 5.2.3基于歷史的分析 MBR(Memory-based
30、 Reasoning) MBR的本質(zhì)是:先根據(jù)經(jīng)驗知識尋找相似情況,然后再將這些情況的信息應(yīng)用于當前的例子中。使用的三個問題是:尋找確定的歷史數(shù)據(jù);決定表示歷史數(shù)據(jù)的最有效方法;決定距離函數(shù)、聯(lián)合函數(shù)和鄰近的數(shù)量。 5.2.4遺傳算法GA(Genetic Aigorithms) 該算法是基于進化理論,并采用遺傳結(jié)合、遺傳變異及自然選擇等方法優(yōu)化結(jié)果。主要思想是:根據(jù)適者生存的原則,形成由當前群體中最適合的規(guī)則組成新的群體,以及這些規(guī)則的后代。規(guī)則的適合度(Fitness)是對訓(xùn)練樣本分類準確性的評估。 5.2.5聚集檢測 將物理或者抽象對象的集合,分組成為由類似的對象組成的多個類的過程被成為聚
31、類。在由聚類生成的數(shù)據(jù)對象集合中,這些對象具有相似性,并與其他集合中的對象具有相異性。這種相異度是根據(jù)描述對象的屬性值來計算的,距離是經(jīng)常被采用的度量方法。 5.2.6連接分析(Link analysis) 連接分析它的基本理論是圖論,圖論的思想是尋找一個可以得出好的結(jié)果但不是完美結(jié)果的算法。這種不完美但是可行的思想模式,可以使之運用到更廣的用戶群中。 5.2.7決策樹(decision tree) 決策樹是能夠被看成一棵樹的預(yù)測模型。樹的每個分支都是一個分類的問題,內(nèi)部節(jié)點表示在一個屬性上的測試,樹葉代表類或者分布。決策樹算法是目前應(yīng)用最廣泛的歸納推理算法之一,是一種逼近離散值函數(shù)的方法,也
32、可將它看作是一個布爾函數(shù)。它是以實例為基礎(chǔ)的歸納學(xué)習(xí)算法,通過對一組訓(xùn)練數(shù)據(jù)的學(xué)習(xí),構(gòu) 造出決策樹形式的只是表示, 在決策樹的內(nèi)節(jié)點進行屬性值的比較并根據(jù)不同的屬性值判斷從該節(jié)點向下的分枝,從而在決策樹葉節(jié)點得到結(jié)論。所以從根到葉節(jié)點的一條路徑就對應(yīng)著一條規(guī) 則,整棵決策樹就對應(yīng)著一組吸取表達式規(guī)則。 5.2.8神經(jīng)網(wǎng)絡(luò)(Nerual Net) 神經(jīng)網(wǎng)絡(luò)是指由大量神經(jīng)元互聯(lián)而成的網(wǎng)絡(luò),類似于服務(wù)器互聯(lián)而成的因特網(wǎng)。它主要由 “神經(jīng)元”的互聯(lián),或按組織的結(jié)點構(gòu)成。通常神經(jīng)網(wǎng)絡(luò)模型由三個層次組成:輸入層,中間層,輸出層。在神經(jīng)元求得輸入值后,再匯總計算總輸入值;由過濾機比較總輸出值,確定網(wǎng)絡(luò)的輸出
33、值??梢酝ㄟ^模擬判斷,來不斷修正計算的“權(quán)值”來達到學(xué)習(xí)的目的,增加判斷的正確性。 5.2.9粗糙集 粗糙集是一種研究不確定性問題的工具,它根據(jù)已有的給定問題的知識,對問題論域進行劃分。然后對劃分后的每個組成部分確定其對某個概念的支持程度。它用于從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則的基本思路是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性。對數(shù)據(jù)庫中的元組根據(jù)各個屬性不同的屬性值分成相應(yīng)的子集,然后對條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)系生成判定規(guī)則。 5.2.10回歸分析 回歸分析分為線性回歸、多元回歸和非線性回歸。線性回歸中,數(shù)據(jù)是用直線建模;多元回歸是線性回歸的擴展,涉及多個預(yù)測變量。非線性回
34、歸是在基本線性模型上添加多個項式項形成非線性回歸模型。六、數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲 CRM 中的具體應(yīng)用 6.1 利用決策樹歸納分類方法進行玩家分類 首先我們要在玩家數(shù)據(jù)庫中找到我們所需要的關(guān)鍵字,如:玩家收入:高收入者更容易在游戲中進行消費帶來利玩家在線時間:在線時間長的玩家對游戲的感情更深,容易產(chǎn)生比較多的花費。玩家消費情況:消費越高的玩家給企業(yè)帶來的利潤越大我們可以粗略將用戶分為以下五類共 16 種情況:表 1 : 客戶類型及其屬性特點客戶類型長期在線高收入消費高消費持續(xù)高消費001100111010110優(yōu)質(zhì)客戶111100010101101101011110100100消費客戶0110
35、01010011100潛在客戶11000普通客戶10000無效帳號0100000000則各屬性相應(yīng)的信息增益為:Gain (長期在線期在線 ) = Info ( D ) - Info線在期長期在線 ( D) = 1.875 -1.5 = 0.375Gain (入收高收入 ) = Info ( D ) - Info入收高收入 ( D) = 1.875 -1.75 = 0.125Gain (消費費 ) = Info ( D ) - Info費消 ( D) = 1.875 -1.065 = 0.81消費Gain (費消高消費 ) = Info ( D ) - Info費消高消費 ( D) = 1.875 - 0.875 = 1Gain (持續(xù)高消費續(xù)高消費) = Info ( D ) - Info持續(xù)高消費持續(xù)高消費 ( D) = 1.875 -1.56 = 0.315由此可以看出Gain(費消高消費)的增益最大,因此選擇高消費作為根節(jié)點進行分類,并以此類推,最后生成的決策樹如下: 高消費 Yes no 消費優(yōu)質(zhì)客戶 Yes no 持續(xù)高消費長期在線 Yes no yes no消費客戶無效賬號高收入優(yōu)質(zhì)客戶 Yes no普通客戶潛在客戶6.2 利用神經(jīng)網(wǎng)絡(luò)知識挖掘技術(shù)進行玩家流失預(yù)測 根據(jù)神經(jīng)網(wǎng)絡(luò)的特點,我們可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 婁底職業(yè)技術(shù)學(xué)院《圖像分析與處理》2023-2024學(xué)年第二學(xué)期期末試卷
- 建東職業(yè)技術(shù)學(xué)院《規(guī)劃CAD》2023-2024學(xué)年第二學(xué)期期末試卷
- 武漢商學(xué)院《建筑工程計量》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安培華學(xué)院《現(xiàn)代凝固技術(shù)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南陽職業(yè)學(xué)院《建筑施工組織實訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 阜新高等??茖W(xué)校《方案快題設(shè)計》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江橫店影視職業(yè)學(xué)院《中外建筑史C》2023-2024學(xué)年第二學(xué)期期末試卷
- 沙洲職業(yè)工學(xué)院《機械工程訓(xùn)練A》2023-2024學(xué)年第二學(xué)期期末試卷
- 昆明鐵道職業(yè)技術(shù)學(xué)院《模式識別與人工智能》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州民航職業(yè)技術(shù)學(xué)院《創(chuàng)新思維與創(chuàng)業(yè)能力培養(yǎng)》2023-2024學(xué)年第二學(xué)期期末試卷
- 初中地理《埃及》教學(xué)設(shè)計-2024-2025學(xué)年湘教版地理七年級下冊
- 內(nèi)蒙古百校聯(lián)盟2025屆高考英語押題試卷含答案
- 2025年北京市通州區(qū)九年級初三一模道德與法治試卷(含答案)
- 數(shù)據(jù)資產(chǎn)的確認與計量問題研究
- 浙江省北斗星盟2025屆高三下學(xué)期適應(yīng)性考試(三模)物理試題(含答案)
- Unit 4 Healthy food B Lets learn(教學(xué)設(shè)計)-2024-2025學(xué)年人教PEP版(2024)英語三年級下冊
- 七年級地理下冊 7.1 日本教學(xué)設(shè)計 湘教版
- 2024-2025學(xué)年人教新版八年級下冊數(shù)學(xué)期中復(fù)習(xí)試卷(含詳解)
- 法律行業(yè)法律風(fēng)險評估與合規(guī)性方案
- 體育教育中的跨學(xué)科整合教學(xué)研究論文
- 2024考研管理類聯(lián)考真題答案解析完整版
評論
0/150
提交評論