




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)學(xué)建模資料請(qǐng)關(guān)注微店“數(shù)學(xué)建模學(xué)習(xí)交流”評(píng)委一評(píng)分,簽名及備注隊(duì)號(hào):10490評(píng)委三評(píng)分,簽名及備注評(píng)委二評(píng)分,簽名及備注選題:B評(píng)委四評(píng)分,簽名及備注題目:基于復(fù)雜網(wǎng)絡(luò)和因子分析的智能推薦隨著互聯(lián)網(wǎng)的飛速發(fā)展,基于社交網(wǎng)絡(luò)的評(píng)價(jià)系統(tǒng)在網(wǎng)絡(luò)推薦中扮演者越來(lái)越重要的 。本文致力于通過(guò)復(fù)雜網(wǎng)絡(luò)算法和因子分析法進(jìn)行用戶(hù)-書(shū)籍評(píng)分預(yù)測(cè)和智能推薦。首先,本文建立了用戶(hù)-書(shū)籍有向分層復(fù)雜網(wǎng)絡(luò)。第一層用戶(hù)關(guān)系網(wǎng)絡(luò)以用戶(hù)之間的社交關(guān)系為基礎(chǔ),以用戶(hù)間的公共閱讀 數(shù)目作為權(quán)重形成有向網(wǎng)絡(luò)層;第二層則以用戶(hù)評(píng)分為權(quán)重形成用戶(hù)與書(shū)籍之間的有向交叉網(wǎng)絡(luò)?;谶@一復(fù)雜網(wǎng)絡(luò),我們定義了網(wǎng)絡(luò)中結(jié)點(diǎn)之間的距離為所經(jīng)過(guò)邊權(quán)重
2、的倒數(shù)和,采用Floyd 最短路徑算法求解結(jié)點(diǎn)之間的最短距離,并且定義書(shū)籍結(jié)點(diǎn)和用戶(hù)結(jié)點(diǎn)的距離為用戶(hù)和書(shū)籍的適應(yīng)度指標(biāo)。其次,我們根據(jù)可能影響用戶(hù)對(duì)書(shū)籍的評(píng)分的因素,還定義了網(wǎng)絡(luò)結(jié)點(diǎn)的強(qiáng)度,網(wǎng)絡(luò)結(jié)點(diǎn)影響力,相對(duì)強(qiáng)度,適應(yīng)度等指標(biāo)以便更好地衡量用戶(hù)與書(shū)籍間的有向 。結(jié)點(diǎn)強(qiáng)度分為閱讀強(qiáng)度和評(píng)價(jià)強(qiáng)度問(wèn)題一和問(wèn)題二,本文把影響用戶(hù)對(duì)書(shū)籍評(píng)價(jià)的因素分為用戶(hù)評(píng)價(jià)特征,書(shū)籍受評(píng)特征和用戶(hù)書(shū)籍特征三大類(lèi);其中用戶(hù)評(píng)價(jià)特征和書(shū)籍受評(píng)特征分別包括用戶(hù)評(píng)分均值,用戶(hù)評(píng)分偏移均值,書(shū)籍受評(píng)均值,書(shū)籍受評(píng)偏移量等四項(xiàng)指標(biāo),而用戶(hù)-書(shū)籍主要是基于網(wǎng)絡(luò)評(píng)價(jià)產(chǎn)生的強(qiáng)度影響力,相對(duì)強(qiáng)度和適應(yīng)度等九項(xiàng)指標(biāo)。隨后采用SPSS 對(duì)上
3、述 13 項(xiàng)因素進(jìn)行因子分析,提取出四共因子,以方差貢獻(xiàn)率為權(quán)重把四共因子綜合指標(biāo)。在對(duì)綜合指標(biāo)做了無(wú)量綱化運(yùn)算后,結(jié)合書(shū)籍評(píng)價(jià)的極大值與極小值區(qū)間產(chǎn)生用戶(hù)對(duì)書(shū)籍的評(píng)價(jià)。問(wèn)題三,本文建立了智能推薦算法進(jìn)行最佳書(shū)籍推薦。在問(wèn)題二的基礎(chǔ)上,依靠復(fù)雜網(wǎng)絡(luò)算法和因子分析法,建立起以四共因子為基礎(chǔ)的綜合指標(biāo), 用來(lái)生成用戶(hù)對(duì)書(shū)籍的評(píng)價(jià)矩陣。然后依照評(píng)分矩陣和閱讀對(duì)未讀書(shū)籍進(jìn)行擇優(yōu)篩選,產(chǎn)生了最優(yōu)推薦結(jié)果,題目中六位讀者第一推薦書(shū)籍 ID 分別為: 698573,698573,794171,702699,698573,776002。最后,我們?cè)u(píng)價(jià)模型的優(yōu)缺點(diǎn),提出了復(fù)雜網(wǎng)絡(luò)算法的降維聚類(lèi)處理,用戶(hù)評(píng)分的標(biāo)
4、準(zhǔn)化以及冷啟動(dòng)推薦等拓展性算法。關(guān)鍵字:復(fù)雜網(wǎng)絡(luò)算法 最短路徑算法 適應(yīng)度指標(biāo) 因子分析 智能推薦算法基于復(fù)雜網(wǎng)絡(luò)和因子分析的智能推薦1. 問(wèn)題重述和互聯(lián)網(wǎng)的發(fā)展已經(jīng)充斥著我們的生活,人類(lèi)形色各異的信息隨著也早已從信息匱乏的信息過(guò)載的。在處理信息的過(guò)程中,信息消費(fèi)者還是信息生產(chǎn)者都遇到了很大的:信息消費(fèi)者從大量信息中找到感興趣的信息開(kāi)始變得越來(lái)越;同樣的,信息生產(chǎn)者需要解決的最大的問(wèn)題則是如何讓生產(chǎn)的信息脫穎而出在大量信息檢索和推薦的過(guò)程中脫穎而出,醒目的呈現(xiàn)在需求者的面前,得到消費(fèi)者的認(rèn)可。人們開(kāi)始探索各種可能解決這一的工具,推薦由此應(yīng)運(yùn)而生。在互聯(lián)網(wǎng)的和應(yīng)用中被廣泛采用,包括大家經(jīng)常使用的
5、相關(guān)搜索、話題推薦、電子商務(wù)的各種推薦、社交網(wǎng)絡(luò)上的交友推薦等。在本題中,我們首先獲得了一個(gè)著名網(wǎng)店的大量的用戶(hù)及用戶(hù)行為信息,包括對(duì)于書(shū)籍的評(píng)分?jǐn)?shù)據(jù),書(shū)籍的息。我們需要解決如下的問(wèn)題:信息以及用戶(hù)的社交關(guān)系等大量的數(shù)據(jù)信(1)分析影響用戶(hù)對(duì)書(shū)籍評(píng)分的因素;(2)建立一個(gè)模型,predict.txt 附件中的用戶(hù)對(duì)未看過(guò)書(shū)籍的評(píng)分;(3)predict.txt 附件中的用戶(hù),給每個(gè)用戶(hù)推薦 3 本沒(méi)看過(guò)的書(shū)籍。2. 模型假設(shè)假設(shè)一:用戶(hù)對(duì)書(shū)籍的評(píng)價(jià)是客觀且僅僅對(duì)其有偏好的書(shū)籍評(píng)價(jià)假設(shè)二:用戶(hù)社交網(wǎng)絡(luò)的形成是基于用戶(hù)對(duì)相似度的人群的偏好,即用戶(hù)社交網(wǎng)絡(luò)能較為準(zhǔn)確地反映用戶(hù)群的偏好特征。假設(shè)三:用
6、戶(hù)對(duì)書(shū)的偏好受其他讀者的影響,用戶(hù)群體的偏好是趨同的。3.符號(hào)說(shuō)明1符號(hào)意義𝑒𝑖Nb i j𝑑𝑖𝑗𝐼𝑒𝑃𝑎𝑡𝑖𝑗𝑋1𝑋2𝑋3𝑋4𝑋6用戶(hù) i 對(duì)于書(shū)籍的評(píng)價(jià)次數(shù)用戶(hù)書(shū)籍網(wǎng)絡(luò)的有向權(quán)重i 和 j 結(jié)點(diǎn)間的緊密程度用戶(hù)評(píng)價(jià)影響力i 到 j 路徑上的后繼點(diǎn)用戶(hù) i 的評(píng)價(jià)均值用戶(hù) i 的評(píng)價(jià)偏移量第 j 本書(shū)籍的被評(píng)價(jià)的均值第 j
7、本書(shū)籍的被評(píng)價(jià)的偏移量用戶(hù) i 對(duì)用戶(hù) j 的影響力4. 問(wèn)題分析基于社交網(wǎng)絡(luò)關(guān)系的數(shù)據(jù)挖掘是當(dāng)前研究的熱點(diǎn)。社交網(wǎng)絡(luò)的構(gòu)建使得互聯(lián)網(wǎng)中多因素的數(shù)據(jù)有機(jī)的結(jié)合起來(lái),形成了一個(gè)巨型多層次數(shù)據(jù)網(wǎng)絡(luò),如何有效的管理這些數(shù)據(jù)網(wǎng)絡(luò)和利用這些數(shù)據(jù)網(wǎng)絡(luò)的信息創(chuàng)造最大的效益是數(shù)據(jù)挖掘的意義所在。本題基于有向復(fù)雜網(wǎng)絡(luò)模型,在分析解決客戶(hù)關(guān)系和書(shū)籍信息的系統(tǒng)評(píng)價(jià)問(wèn)題中,嘗試尋找各個(gè)已知數(shù)據(jù)之間的,把所有已知因素綜合性地表現(xiàn)在復(fù)雜網(wǎng)絡(luò)算法中,以實(shí)現(xiàn)書(shū)籍評(píng)分系統(tǒng)的全面化、客觀化和智能化。在書(shū)籍評(píng)分的中,我們必須考慮所有可能影響用戶(hù)對(duì)書(shū)籍評(píng)分的因素,主要包括用戶(hù)個(gè)人的評(píng)分結(jié)構(gòu),用戶(hù)對(duì)該書(shū)籍現(xiàn)有的評(píng)分結(jié)構(gòu),用戶(hù)與書(shū)籍的匹
8、配程度。本文對(duì)上述三種因素進(jìn)行分析,在分析過(guò)程中,用戶(hù)評(píng)分結(jié)構(gòu)與書(shū)籍的評(píng)分結(jié)構(gòu)比較容易衡量,而用戶(hù)與書(shū)籍的匹配程度則是該系統(tǒng)評(píng)價(jià)的,也是算法設(shè)計(jì)中的重點(diǎn)和難點(diǎn),它是基于用戶(hù)社交網(wǎng)絡(luò)和書(shū)籍的網(wǎng)絡(luò)進(jìn)行提取的。用戶(hù)與書(shū)籍的匹配程度主要考慮用戶(hù)與書(shū)籍在網(wǎng)絡(luò)中的距離,用戶(hù)的影響力,書(shū)籍本身的影響力等指標(biāo)。所以本題的總體思路分為社交網(wǎng)絡(luò)的構(gòu)建、指標(biāo)分析以及部分,其中,社交網(wǎng)絡(luò)構(gòu)建是解決該問(wèn)題的基礎(chǔ)。4.1 復(fù)雜網(wǎng)絡(luò)構(gòu)建和智能推薦三基于社交關(guān)系的復(fù)雜網(wǎng)絡(luò)系統(tǒng)是構(gòu)建評(píng)分模型的基礎(chǔ),本文采用的網(wǎng)絡(luò)構(gòu)架在傳統(tǒng)的有向圖的基礎(chǔ)上實(shí)現(xiàn)合理的網(wǎng)絡(luò)分層,每層網(wǎng)絡(luò)結(jié)點(diǎn)包括讀者和書(shū)籍,除了讀者與讀者的網(wǎng)絡(luò),書(shū)籍與書(shū)籍的網(wǎng)絡(luò),還
9、包括讀者與書(shū)籍之間單向關(guān)系,由此組成雙層有向圖,并依照改進(jìn)的復(fù)雜網(wǎng)絡(luò)算法進(jìn)行計(jì)算。4.2 讀者有向網(wǎng)絡(luò)讀者層的網(wǎng)絡(luò)依照讀者之間的關(guān)注進(jìn)行構(gòu)建,并以讀者之間相同的閱讀歷史次數(shù)作為兩讀者之間的有向權(quán)重,其含義為兩個(gè)讀者的偏好相似度。網(wǎng)絡(luò)圖主要體現(xiàn)在閱讀過(guò)程中,讀者之間通過(guò)關(guān)注這個(gè)行為產(chǎn)生的相互影響關(guān)系。并且在實(shí)際中,讀者之間相同越多,其產(chǎn)生的影響越大,在讀者層網(wǎng)絡(luò)中體現(xiàn)的共同閱讀越多,讀者結(jié)點(diǎn)權(quán)重值越大,結(jié)點(diǎn)間距離越小。4.3 讀者書(shū)籍交叉網(wǎng)絡(luò)材料中的信息包括讀者閱讀的歷史和評(píng)價(jià),依據(jù)這兩項(xiàng)數(shù)據(jù)可建立讀者與書(shū)籍間的有向整個(gè)系統(tǒng)中評(píng)價(jià)網(wǎng)絡(luò)圖。但通過(guò)對(duì)題中所給數(shù)據(jù)的簡(jiǎn)單分析可以發(fā)現(xiàn),總數(shù)遠(yuǎn)遠(yuǎn)大于閱讀即
10、有些讀者沒(méi)有閱讀該書(shū)籍但是卻對(duì)該書(shū)籍進(jìn)行評(píng)分),因此,這些評(píng)價(jià)數(shù)據(jù)是無(wú)法直接應(yīng)用的,必須剔除不合適評(píng)價(jià)邏輯的虛假評(píng)價(jià)(無(wú)閱讀單有評(píng)價(jià)),將剩余的有效數(shù)據(jù)進(jìn)行讀者書(shū)籍的交叉網(wǎng)絡(luò)評(píng)價(jià)。所有書(shū)籍的信息位于不同于讀者有向2網(wǎng)絡(luò)的新的網(wǎng)絡(luò)𝑋7𝑋10F𝑆𝑐𝑜𝑟𝑒(𝑖, 𝑗)用戶(hù) i 的強(qiáng)度用戶(hù)評(píng)價(jià)均值的調(diào)整量綜合指標(biāo)矩陣評(píng)價(jià)分?jǐn)?shù)的修正值層,書(shū)籍之間暫不建立有向關(guān)聯(lián)關(guān)系。讀者書(shū)籍的交叉網(wǎng)絡(luò)拓?fù)鋱D以讀者對(duì)書(shū)籍的評(píng)分為基礎(chǔ)進(jìn)行構(gòu)建,評(píng)分反映了讀者對(duì)該書(shū)籍的喜愛(ài)程度。通過(guò)
11、評(píng)分,將讀者與各書(shū)籍起來(lái),進(jìn)而形成交叉的雙層網(wǎng)絡(luò)圖。而書(shū)籍自身的影響力通過(guò)書(shū)籍被評(píng)價(jià)次數(shù)來(lái)反映,定義其為書(shū)籍結(jié)點(diǎn)強(qiáng)度。4.4 Floyd 最短路徑算法基于上述讀者分層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),采用數(shù)據(jù)挖掘的方法分析該有向利用Floyd 最短距離算法計(jì)算第一層用戶(hù)結(jié)點(diǎn)和第二層書(shū)籍結(jié)點(diǎn)的最短網(wǎng)絡(luò)路徑,以此來(lái)表現(xiàn)書(shū)籍對(duì)讀者喜好的適應(yīng)度大小。4.5 因子分析法及網(wǎng)絡(luò),本文采用復(fù)雜網(wǎng)絡(luò)模型求解出書(shū)籍對(duì)不同讀者喜好的最佳適應(yīng)度。但通過(guò)行 為學(xué)分析,讀者對(duì)書(shū)籍的評(píng)價(jià)還取決于讀者的評(píng)分習(xí)慣,書(shū)籍的內(nèi)容,書(shū)籍自身的影響力等指標(biāo)。因此我們需要對(duì)所有可能影響到評(píng)價(jià)的各種因素進(jìn)行綜合考慮。由于因素間可能的共線和重疊關(guān)系,導(dǎo)致綜合
12、評(píng)估指標(biāo)難以量化,所以我們采用因子分析法提取公共因子,通過(guò)計(jì)算各因子的貢獻(xiàn)率來(lái)確定各個(gè)因素的權(quán)重體系,出讀者對(duì)書(shū)籍和評(píng)價(jià)。經(jīng)過(guò)前面的算法和 后為用戶(hù)進(jìn)行書(shū)籍推薦。評(píng)價(jià),問(wèn)題三的解決方法主要是對(duì)評(píng)價(jià)結(jié)果進(jìn)行排序網(wǎng)絡(luò)Floyd圖 1 系統(tǒng)流程圖5. 模型建立5.1 模型一:復(fù)雜網(wǎng)絡(luò)模型基于社交關(guān)聯(lián)關(guān)系建立書(shū)籍和讀者的有向網(wǎng)絡(luò),根據(jù)結(jié)點(diǎn)的兩大種類(lèi)進(jìn)行分層,設(shè)定網(wǎng)絡(luò)系統(tǒng)可以通過(guò)最短路徑算法來(lái)求解出書(shū)籍對(duì)讀者的最佳適應(yīng)度指標(biāo)。適應(yīng)度指標(biāo)是評(píng)價(jià)系統(tǒng)中較為重要的決定因素。評(píng)價(jià)的另一基本因素結(jié)點(diǎn)強(qiáng)度與影響力指標(biāo)可以通過(guò)社交網(wǎng)絡(luò)來(lái)定義。3書(shū)籍被評(píng)價(jià)特征智能推薦模型均值偏移量等指標(biāo)用戶(hù)評(píng)價(jià)特征影響力指標(biāo)書(shū)籍推薦用
13、戶(hù)-書(shū)籍網(wǎng)絡(luò)最短路徑用戶(hù)書(shū)籍評(píng)價(jià)因子分析法強(qiáng)度指標(biāo)分層有向加權(quán)網(wǎng)絡(luò)5.1.1 用戶(hù)層網(wǎng)絡(luò)記用戶(hù)間網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的有向鄰接矩陣為𝑈𝑅URUR111 jUR= ( )URURi 1i j其中,UR 表示第 i 個(gè)用戶(hù)對(duì)第j 個(gè)用戶(hù)鄰接關(guān)系的強(qiáng)弱程度。i j定義:UR = 表示結(jié)點(diǎn)自身之間強(qiáng)度最強(qiáng);。i j當(dāng)UR = 0時(shí)表示結(jié)點(diǎn)之間無(wú)i j在讀者用戶(hù)網(wǎng)絡(luò)中,用戶(hù)的結(jié)點(diǎn)強(qiáng)度用來(lái)反映用戶(hù)的活躍情況和用戶(hù)自身的影響力,共分為評(píng)價(jià)強(qiáng)度和閱讀強(qiáng)度,分別用𝑒𝑖和𝑣𝑖來(lái)表示。定義:矩陣E = (𝑒1 &
14、#119890;2 𝑒𝑛)𝑇 和矩陣V = (𝑣1 𝑣2 𝑣𝑛)𝑇其中𝑒𝑖:用戶(hù)的評(píng)價(jià)次數(shù)𝑣𝑖:用戶(hù)的閱讀次數(shù)𝑒𝑖和𝑣𝑖在一定程度上可反映用戶(hù)的影響力及活躍程度。5.1.2 用戶(hù)書(shū)籍交叉層網(wǎng)絡(luò)同理,依照用戶(hù)和書(shū)籍之間的關(guān)聯(lián)情況建立用戶(hù)和書(shū)籍之間的關(guān)聯(lián)網(wǎng)絡(luò)。設(shè)鄰接矩陣為𝑈𝐵𝑈𝑏
15、119880;𝑏111 𝑗𝑈𝐵 = 𝛼 ( )𝑈𝑏𝑈𝑏𝑖 1𝑖 𝑗矩陣中𝑈𝑏 為用戶(hù)書(shū)籍間的鄰接。𝑖 𝑗同理我們定義:Nb= b sI jI jijNb用戶(hù)書(shū)籍網(wǎng)絡(luò)的有向權(quán)重,它反映用戶(hù)i 對(duì)書(shū)籍 j 的偏好程度。i jb= 0第 i 個(gè)用戶(hù)未閱讀第j 本書(shū)第 i 個(gè)用戶(hù)已閱讀第j 本書(shū)i j1si j表示第 i 個(gè)用戶(hù)對(duì)第j 個(gè)書(shū)籍的評(píng)分,
16、無(wú)評(píng)價(jià)則默認(rèn)為是平均值。書(shū)籍結(jié)點(diǎn)的強(qiáng)度分別表示為評(píng)價(jià)強(qiáng)度𝑒和閱讀強(qiáng)度𝑣。𝑖𝑖其中𝑒為第 i 本書(shū)籍被評(píng)價(jià)的次數(shù)(校正后);v為第 i 本書(shū)籍的書(shū)簽數(shù)目。𝑖i評(píng)價(jià)強(qiáng)度𝑒和閱讀強(qiáng)度𝑣能反映出第i 本書(shū)籍的受歡迎程度,其中𝑒必須為校𝑖𝑖𝑖正后的評(píng)價(jià)次數(shù),因?yàn)樵陬}目中的數(shù)據(jù)存在虛假評(píng)價(jià)(前文中已解釋?zhuān)?圖 2 交叉網(wǎng)絡(luò)示意圖5.1.3 最短路徑算法(Floyd)(1)混合網(wǎng)絡(luò)用戶(hù)網(wǎng)絡(luò)和用戶(hù)書(shū)籍網(wǎng)絡(luò)可以組一個(gè)分層
17、的有向網(wǎng)絡(luò),把書(shū)籍和用戶(hù)等效成同一類(lèi)結(jié)點(diǎn),則新的網(wǎng)絡(luò)拓?fù)浼軜?gòu)的鄰接矩陣為U = 𝑈𝑅𝑈𝐵 00Ui j表示 i 結(jié)點(diǎn)到 j 結(jié)點(diǎn)的權(quán)重;其中,UR表示用戶(hù)的之間的結(jié)點(diǎn)權(quán)重;UB表示用戶(hù)與每一個(gè)書(shū)籍之間的結(jié)點(diǎn)權(quán)重。定義Ci j為網(wǎng)絡(luò)任意相鄰兩點(diǎn)間的距離。0i = j1Ui j U 0 且 i jC=i ji jUi j 0則任意兩點(diǎn)之間的最短距離為dij = minCik1 + Ck1 k2 + + Ckn jdij可以準(zhǔn)確衡量i 和j 結(jié)點(diǎn)間的緊密程度,如果 i 為用戶(hù)編號(hào),j 為書(shū)籍編號(hào),則dij(iusers,jbooks)表
18、示書(shū)籍為用戶(hù)偏好的適應(yīng)度。(2)Floyd 算法Floyd 算法是求解有向圖結(jié)點(diǎn)間最短路徑的法,它的思想是在鄰接矩陣中用定點(diǎn)的方法依次遞推地構(gòu)造出 n 個(gè)矩陣 D(1),D(2)D(n),D(n)為網(wǎng)絡(luò)模型的距離矩陣。同時(shí)引入一個(gè)后繼點(diǎn)矩陣Floyd 算法兩個(gè)重要屬性矩陣為D 和 Path。兩點(diǎn)間的最短距離。其中Pathij 為 i 到 j 路徑上的后繼點(diǎn),算法如下:Step1:輸入鄰接矩陣CStep2:賦初值,令dij = cij,Pathij = j,k=1.Step3:更新 D 和 Path;對(duì)一組 i 和 j,如果滿(mǎn)足D(i,k) + D(k,j) <D(i,j); 則 D(i,
19、j)=D(i,k) + D(k,j) ;5Path(i,j)=Path(i,k);Step4:K 值加 1 返回 Step3 直至 k=n+1(n 為總結(jié)點(diǎn)數(shù))。依據(jù)上述步驟,可準(zhǔn)確求解出D 和 Path。5.1.4 結(jié)點(diǎn)影響力和結(jié)點(diǎn)強(qiáng)度評(píng)定在混合網(wǎng)絡(luò)中,各個(gè)結(jié)點(diǎn)的影響力可以通過(guò)網(wǎng)絡(luò)中每個(gè)結(jié)點(diǎn)的強(qiáng)度和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)來(lái)進(jìn)行描述。對(duì)上述復(fù)雜網(wǎng)絡(luò)而言,每個(gè)結(jié)點(diǎn)均有兩種強(qiáng)度𝑒𝑖和𝑣𝑖,所有兩種,記𝐼𝑒為評(píng)價(jià)影響力,𝐼𝑣為閱讀影響力。n以結(jié)點(diǎn)eieI = (i j)jdiji=
20、1𝑛𝑝𝑖𝑣𝐼 = (i j)𝑗𝑑𝑖𝑗𝑖=1結(jié)點(diǎn)的影響要考慮了其他結(jié)點(diǎn)通過(guò)網(wǎng)絡(luò)傳遞效應(yīng)后對(duì)目標(biāo)結(jié)點(diǎn)影響程度的總和,而結(jié)點(diǎn)的強(qiáng)度則主要為目標(biāo)結(jié)點(diǎn)對(duì)外部的影響,用戶(hù)的強(qiáng)度采用用戶(hù)對(duì)書(shū)籍的有效評(píng)價(jià)次數(shù)來(lái)表示,書(shū)籍的強(qiáng)度則采籍被有效評(píng)價(jià)的次數(shù)。結(jié)點(diǎn)影響力和結(jié)點(diǎn)強(qiáng)度指標(biāo)既適用于用戶(hù)結(jié)點(diǎn),也適用于書(shū)籍結(jié)點(diǎn)。5.2 因子分析法5.2.1. 因素提取用戶(hù)對(duì)書(shū)籍的評(píng)價(jià)主要受各種因素制約,如下圖所示評(píng)價(jià)均值X1評(píng)價(jià)偏移量X2用戶(hù)評(píng)價(jià)特征評(píng)價(jià)調(diào)整均值X10評(píng)價(jià)
21、調(diào)整偏移量X11受評(píng)均值X3受評(píng)偏移量X4評(píng)價(jià)影響因素書(shū)籍受評(píng)特征受評(píng)調(diào)整均值X12受評(píng)調(diào)整偏移量X13用戶(hù)書(shū)籍適應(yīng)度X5用戶(hù)影響力X6用戶(hù)書(shū)籍特征用戶(hù)強(qiáng)度X7書(shū)籍影響力X8書(shū)籍強(qiáng)度X9圖 3 因素分解圖6其中,𝑋1(i,j):第 i 個(gè)用戶(hù)的所有評(píng)價(jià)的均值;𝑋2(i,j):第 i 個(gè)用戶(hù)的所有評(píng)價(jià)的偏移量;𝑋3(i,j):第 j 本書(shū)籍的被評(píng)價(jià)的均值;𝑋4(i,j):第 j 本書(shū)籍的被評(píng)價(jià)的偏移量;且|𝑇|𝑅 𝑋 (𝑖, 𝑗)|𝑋2(
22、i, j) = 𝑘=1𝑖𝑘1|𝑇|𝑖|𝑈|𝑅 𝑋 (𝑖, 𝑗)|𝑋4(i, j) = 𝑘=1𝑘𝑗3|𝑈|𝑖其中𝑅𝑖𝑘表示第 i 個(gè)用戶(hù)對(duì)第 k 本書(shū)籍打分(來(lái)自評(píng)價(jià)歷史),|𝑇|和|𝑈|分別指評(píng)價(jià)書(shū)籍的總個(gè)數(shù)和評(píng)價(jià)用戶(hù)的總數(shù)。𝑋5(𝑖
23、;, 𝑗) = 𝑑𝑖𝐼𝑓 𝑚𝑖𝑛(𝐼𝑓)𝐼𝑒 𝑚𝑖𝑛(𝐼𝑒)𝑋6(𝑖, 𝑗) =𝑖+𝑖max(𝐼𝑒) 𝑚𝑖𝑛(𝐼𝑒)max(Ү
24、68;𝑓) 𝑚𝑖𝑛(𝐼𝑓)為用戶(hù) i 對(duì)用戶(hù) j 的影響力,定義為相對(duì)閱讀影響力和相對(duì)評(píng)價(jià)影響力之𝑋6和。𝑒𝑖 𝑚𝑖𝑛(𝐸)𝑓𝑖 𝑚𝑖𝑛𝐹𝑋 (𝑖, 𝑗) =+7max(𝐸) 𝑚𝑖𝑛(
25、𝐸)max(𝐹) 𝑚𝑖𝑛(𝐹)𝑋7為用戶(hù) i 的強(qiáng)度,定義為相對(duì)閱讀強(qiáng)度和相對(duì)評(píng)價(jià)強(qiáng)度之和;𝑋8和𝑋9分別是書(shū)籍的影響力和強(qiáng)度,其定義方式如同𝑋6𝑋7;= 𝑋1𝑑𝑋10𝑋10是用戶(hù)評(píng)價(jià)均值的調(diào)整值,定義為;𝑖,𝑗= 𝑋2𝑑 ;𝑖 ,𝑗𝑋11是用戶(hù)評(píng)
26、價(jià)偏移量的調(diào)整值,定義為𝑋11= 𝑋3𝑑𝑋12是書(shū)籍被評(píng)價(jià)均值的調(diào)整值,定義為𝑋12;𝑖 ,𝑗= 𝑋4𝑑𝑋13是書(shū)籍被評(píng)價(jià)偏移量的調(diào)整值,定義為𝑋13。𝑖 ,𝑗上述十三大因素是影響評(píng)價(jià)結(jié)果的最主要的5.2.2 因子分析法基本理論,下面將對(duì)其進(jìn)行因子分析。因子分析法是從研究變量?jī)?nèi)部相關(guān)的依賴(lài)關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。采用這種方法我們
27、就可以對(duì)原始數(shù)據(jù)進(jìn)行分類(lèi)歸并性的分析提取,將相關(guān)度較為密切的變量歸納為多個(gè)綜合指標(biāo),同時(shí)令這些綜合指標(biāo)所綜合的信息相互不重疊。我們則把這些7綜合指標(biāo)定義為公共因子。因子分析法的基本思路是對(duì)研究變量進(jìn)行分類(lèi),將關(guān)聯(lián)度較高,比較緊密的人為的一起,相應(yīng)的,不同類(lèi)變量之間的關(guān)聯(lián)度較低。在這樣的方法下,每一類(lèi)變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),即公共因子.我們需要研究的就是試圖用最少個(gè)數(shù)的不可測(cè)的所謂公共因子的擬定函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。這樣,就能相對(duì)容易地以較少的幾個(gè)因子反映原資料的大部分信息,從而達(dá)到濃縮數(shù)據(jù),提取數(shù)據(jù)的作用和目的。因子分析法的是對(duì)若干綜合指標(biāo)進(jìn)行因子分析并提取公共因
28、子,再以每個(gè)因子的方差貢獻(xiàn)率作為與該因子的得分乘數(shù)之和構(gòu)造得分函數(shù)。因子分析法的數(shù)學(xué)表示為矩陣:X=AF+B,即:𝑥1 = 𝑎11 𝑓1 + 𝑎12𝑓2 + 𝑎13𝑓3 + + 𝑎1𝑘 𝑓𝑘 + 𝛽1𝑥2 = 𝑎21𝑓1 + 𝑎22𝑓2 + 𝑎23 𝑓3 + + 𝑎2Ү
29、96; 𝑓𝑘 + 𝛽2𝑥3 = 𝑎31𝑓1 + 𝑎32𝑓2 + 𝑎33 𝑓3 + + 𝑎3𝑘 𝑓𝑘 + 𝛽3𝑥𝑝 = 𝑎𝑝1𝑓1 + 𝑎𝑝2𝑓2 + 𝑎𝑝3𝑓3 + + ⻔
30、6;𝑝𝑘 𝑓𝑘 + 𝛽𝑝模型中,向量X = (x1, x2 , x3, , xp)是可觀測(cè)隨機(jī)向量,即原始觀測(cè)變量。F = (f1, f2, f3, , fk)是X = (x1, x2 , x3, , xp) 的公共因子,即各個(gè)原觀測(cè)變量的表共同出現(xiàn)的因子,是相互的不可觀測(cè)的理論變量。公共因子的具體含義必須結(jié)合實(shí)際研究問(wèn)題來(lái)界定。A(ij)是公共因子F = (f1, f2, f3, , fk)的系數(shù), 稱(chēng)為因子載荷矩陣,ij(i = 1,2, . . . , p; j = 1,2, . . . ,
31、k)稱(chēng)為因子載荷,是第i 個(gè)原有變量在第j 個(gè)因子上的負(fù)荷,或可將ij看作第 i 個(gè)變量在第 j 公共因子上的權(quán)重。ij是 xi和𝑓𝑗的協(xié)方差,也是xi和fj的相關(guān)系數(shù),表示xi對(duì)fj的依賴(lài)程度或相關(guān)程度。ij的絕對(duì)值越大,表明公共因子fj 對(duì)于xi的載荷量越= (1, 2, 3, , p)是X = (x1, x2 , x3, , xp)的特殊因子,是不能被前 k 個(gè)公共因子包含的部分,這種因子也是不可觀測(cè)的。各特殊因子之間以及特殊因子與所有公共因子之間都是相互的。5.2.3 模型的數(shù)學(xué)含義因子載荷矩陣A 中包含了兩個(gè)統(tǒng)計(jì)量,分別是變量共同度和公共因子的方差貢獻(xiàn)
32、度。(1)變量共同度變量共同度是因子載荷矩陣A 的第 i 行的元素的平方和。記為:h2 = k2(i = 1,2,3 p)。ij=1 ij它衡量全部公共因子對(duì)xi的方差所做出的貢獻(xiàn),反映全部公共因子對(duì)變量 xi的影響。h2越大,表明X 對(duì)于 F 每一分量的依賴(lài)程度大。i(2)方差貢獻(xiàn)度方差貢獻(xiàn)度因子載荷矩陣中各列元素的平方和。記為:g2 = p2(j = 1,2,. . . , k)。jiji=1g2稱(chēng)為公共因子F = (f , f , f , , f )對(duì)X = (x , x , x , , x )的方差貢獻(xiàn),表j1 2 3k123p示第 j 個(gè)公共因子𝑓𝑗對(duì)
33、于 x 的每一個(gè)分量𝑥𝑖 (i=1,2,.,p)所提供的方差的總和,是衡量公共因子相對(duì)重要性的指標(biāo)。(3)綜合指標(biāo)我們采用上述各因子的貢獻(xiàn)率占總貢獻(xiàn)率的比重作為權(quán)重w,對(duì)上述個(gè)影響因子,定義F,如下。8𝑓1𝑛𝑓2F = 𝑤1, 𝑤2, 𝑤𝑛 = 𝑤𝑖 𝑓𝑖𝑖=1𝑓𝑛f(i,j)為綜合指標(biāo),它是做評(píng)價(jià)系統(tǒng)的參考指標(biāo)。𝑓(
34、9894;, 𝑗) min(𝑓)max(𝑓) min(𝑓)𝑓(𝑖, 𝑗) =𝑓為 f 的修正指標(biāo),數(shù)值的含義為f(i,j)在所有 f 取值的相對(duì)位置。同理定義:評(píng)價(jià)分?jǐn)?shù)的修正值,表達(dá)式如下:𝑆𝑐𝑜𝑟𝑒(𝑖, 𝑗) = min(𝑆𝑐𝑜𝑟𝑒𝑗) + 𝑓
35、(𝑖, 𝑗)max(𝑆𝑐𝑜𝑟𝑒) min(𝑆𝑐𝑜𝑟𝑒)我們采用修正的綜合指標(biāo)作為分?jǐn)?shù)修正值的,數(shù)值的含義為某個(gè)具體分?jǐn)?shù)在整體評(píng)分中的一個(gè)相對(duì)位置,數(shù)值范圍在所有評(píng)分的最大與最小值之間。5.3 智能推薦模型定義矩陣 History 表示用戶(hù)對(duì)書(shū)籍的閱讀情況。𝐻𝑖𝑠𝑡𝑜𝑟𝑦(𝑖, &
36、#119895;) = 0用戶(hù) i 未閱讀書(shū)籍j1用戶(hù) i 已閱讀書(shū)籍j𝐻11𝐻𝑖1𝐻1𝑗𝐻𝑖𝑠𝑡𝑜𝑟𝑦 = 𝐻𝑖𝑗定義矩陣Score 為得分矩陣。Score(i,j) 表示用戶(hù) i 對(duì)書(shū)籍 j 的評(píng)價(jià)值。記 M 為一新矩陣,其中m(i, j) = score(i, j) × history(i, j)智能推薦系統(tǒng)致力于為用戶(hù)推薦 K(k=1,2,
37、3,n)個(gè)從未閱讀過(guò)的書(shū)籍。推薦系統(tǒng)的主要思想為,對(duì)所有的可能推薦的書(shū)籍的打分項(xiàng)進(jìn)行排序,根據(jù)排序結(jié)果系統(tǒng)自動(dòng)進(jìn)行推薦。詳細(xì)步驟如下:Step1:賦值 i,j,k=1,maxStep2:M 矩陣第 i 列最大值列表,并設(shè)為第K 個(gè)推薦結(jié)果。Step3:第 i 行第 C 列清零,并使k=k+1 直至 k>max Step4:返回 Step26. 模型求解6.1 問(wèn)題一:評(píng)分因素經(jīng)過(guò)建立復(fù)雜網(wǎng)絡(luò)模型和因子分析模型,影響用戶(hù)評(píng)分的因素主要有三大類(lèi),分別是用戶(hù)評(píng)價(jià)特征、書(shū)籍受評(píng)特征、用戶(hù)書(shū)籍釋如下:1、用戶(hù)評(píng)價(jià)特征特征。它們的細(xì)分指標(biāo)解(1) 評(píng)價(jià)均值:目標(biāo)用戶(hù)所產(chǎn)生的歷史評(píng)價(jià)(2) 評(píng)價(jià)偏移量
38、:目標(biāo)用戶(hù)所產(chǎn)生的各歷史評(píng)價(jià)的均值。的離差絕對(duì)值的平均數(shù)。(3) 評(píng)價(jià)調(diào)整均值:評(píng)價(jià)均值與復(fù)雜網(wǎng)絡(luò)中任意兩個(gè)結(jié)點(diǎn)的最短距離的比值。(4) 評(píng)價(jià)調(diào)整偏移量:評(píng)價(jià)偏移量與復(fù)雜網(wǎng)絡(luò)任意兩結(jié)點(diǎn)的最短距離的比值。2、書(shū)籍受評(píng)特征9(1) 受評(píng)均值:目標(biāo)書(shū)籍被用戶(hù)評(píng)價(jià)的歷史(2) 受評(píng)偏移量:目標(biāo)書(shū)籍被用戶(hù)評(píng)價(jià)的歷史的均值。的離差絕對(duì)值的平均數(shù)。(3) 受評(píng)調(diào)整均值:受評(píng)均值與復(fù)雜網(wǎng)絡(luò)中任意兩個(gè)結(jié)點(diǎn)的最短距離的比值。(4) 受評(píng)調(diào)整偏移量:受評(píng)偏移量與復(fù)雜網(wǎng)絡(luò)任意兩結(jié)點(diǎn)的最短距離的比值。3、用戶(hù)書(shū)籍特征(1) 用戶(hù)書(shū)籍適應(yīng)度:在交叉網(wǎng)絡(luò)模型中目標(biāo)用戶(hù)與目標(biāo)書(shū)籍兩結(jié)點(diǎn)之間的緊密程度,即兩結(jié)點(diǎn)之間的最短距離。
39、(2) 用戶(hù)影響力:分為用戶(hù)閱讀影響力和評(píng)價(jià)影響力,該影響力即為其他結(jié)點(diǎn)用過(guò)網(wǎng)絡(luò)關(guān)聯(lián)傳遞效應(yīng)后對(duì)目標(biāo)結(jié)點(diǎn)所產(chǎn)生的影響程度總和。(3) 用戶(hù)強(qiáng)度:為相對(duì)閱讀強(qiáng)度和相對(duì)評(píng)價(jià)強(qiáng)度之和,取自于用戶(hù)閱讀次數(shù)和用戶(hù)評(píng)價(jià)次數(shù)。(4) 書(shū)籍影響力:為書(shū)籍被閱讀和被評(píng)價(jià)的影響力的總和,即其他結(jié)點(diǎn)用過(guò)網(wǎng)絡(luò)關(guān)聯(lián)傳遞效應(yīng)后對(duì)目標(biāo)結(jié)點(diǎn)所產(chǎn)生的影響程度總和。(5) 書(shū)籍強(qiáng)度:為書(shū)籍的相對(duì)閱讀強(qiáng)度和相對(duì)評(píng)價(jià)強(qiáng)度之和,取自于目標(biāo)書(shū)籍被用戶(hù)閱讀次數(shù)和評(píng)價(jià)次數(shù)。6.2 問(wèn)題二:評(píng)價(jià)6.2.1 復(fù)雜網(wǎng)絡(luò)構(gòu)建題目中數(shù)據(jù)建立分層復(fù)雜網(wǎng)絡(luò)模型,由于數(shù)據(jù)用戶(hù)數(shù)和書(shū)籍?dāng)?shù)目較大, 不利于畸形完整網(wǎng)絡(luò)的計(jì)算。由于模型中只是利用結(jié)點(diǎn)間的最短路徑進(jìn)
40、行評(píng)估, 所以局部拓?fù)鋱D 的構(gòu)建已 經(jīng)是以進(jìn)行 結(jié)點(diǎn)間路徑 的評(píng)估。 我們選取7245481 ,7625225, 4156658, 5997834, 9214078 和 251537 六個(gè)待評(píng)價(jià)結(jié)點(diǎn)以及與它們相隔結(jié)點(diǎn)不超過(guò)兩個(gè)的所有用戶(hù)共 1168 個(gè),選取待評(píng)價(jià)的 34 本書(shū)籍為第二層結(jié)點(diǎn),對(duì)它們進(jìn)行統(tǒng)一編號(hào)如下表:表 1 編號(hào)分類(lèi)6.2.2 數(shù)據(jù)準(zhǔn)備基于上述復(fù)雜網(wǎng)絡(luò)模型,利用Floyd 算法求解出用戶(hù)書(shū)籍的最短距離,并基于此可求得結(jié)點(diǎn)影響力以及結(jié)點(diǎn)的相對(duì)強(qiáng)度等指標(biāo),部分的計(jì)算數(shù)據(jù)如下所示(完整表格見(jiàn)附錄):表 2 因素一覽表10編號(hào)X1X2X3X4X5X6X7X8X9X10X11X12X1
41、313.350.544.220.5314.580.630.580.770.860.230.040.290.0423.350.543.930.3817.140.630.580.490.370.20.030.230.0233.350.544.280.4916.250.630.5810.850.210.030.260.0343.350.544.230.4416.250.630.580.850.730.210.030.260.0353.350.543.930.1622.50.630.580.010.20.150.020.170.0163.350.543.870.5516.250.630.580.420
42、.490.210.030.240.0373.890.723.830.3919.640.830.60.010.130.20.040.190.02結(jié)點(diǎn)類(lèi)型編號(hào)用戶(hù)11168書(shū)籍11681202注 1:X1,X2,X3,X13 為 13 個(gè)相關(guān)因素的指標(biāo),具體含義前文中已經(jīng)解釋過(guò); 注 2:表格中編號(hào)依次表示題目中要求的評(píng)價(jià)組合序列;注 3:完整表格見(jiàn)附錄。6.2.3 因子分析對(duì)上述 13 列數(shù)據(jù)利用 SPSS 進(jìn)行因子分析,首先對(duì)其進(jìn)行相關(guān)系數(shù)及 KMO 和 Bartlett 檢驗(yàn),相關(guān)矩陣及相關(guān)矩陣的逆矩陣的詳細(xì)結(jié)果見(jiàn)附錄。KMO 和Bartlett 的檢驗(yàn)如下表所示:表 3 KMO 和 Bar
43、tlett 的檢驗(yàn)在附錄的相關(guān)矩陣的表格中可以得到相關(guān)系數(shù)絕大多數(shù)均在 0.4 以上,具有相關(guān)性,且 KMO 和 Bartlett 的檢驗(yàn)中的 sig 值為 0,所以拒絕相關(guān)系數(shù)為 0 的原假設(shè)。說(shuō)明變量間存在相關(guān)性,可以做因子分析處理。表 4 公因子方差由上表可知,公共因子對(duì)各項(xiàng)指標(biāo)方差的反應(yīng)程度都達(dá)到了 0.85 以上,用因子來(lái)表示 13 項(xiàng)指標(biāo)是可行的且程度較高。下表為 SPSS 提取因子解釋的總方差。表 5 解釋的總方差四11成份初始特征值提取平方和載入合計(jì)方差的 %累積 %合計(jì)方差的 %累積 %15.08539.11539.1155.08539.11539.11523.44226.4
44、7965.5943.44226.47965.59431.42210.93576.5291.42210.93576.52941.39110.70287.2311.39110.70287.2315.8856.80494.0356.4243.26597.3007.2051.57998.8798.070.53899.417指標(biāo)初始提取指標(biāo)初始提取x11.0000.739x81.0000.729x21.0000.877x91.0000.893x31.0000.753x101.0000.924x41.0000.872x111.0000.929x51.0000.931x121.0000.984x61.000
45、0.926x131.0000.895x71.0000.888取樣足夠度的 Kaiser-Meyer-Olkin 度量。0.577近似卡方789.969Bartlett 的球形度檢驗(yàn)Df78Sig.0.00083.890.724.040.214.220.830.60.780.540.270.050.280.0193.890.723.730.4915.880.830.60.350.150.240.050.230.03103.890.723.80.3818.330.830.60.250.010.210.040.210.02上表中第一列為特征值(主成分的方差),第二列為各個(gè)主成分的貢獻(xiàn)率,第三列為累積
46、貢獻(xiàn)率,由上表看出前 4 個(gè)主成分的累計(jì)貢獻(xiàn)率就達(dá)到了87.231%>85%,所以選取主成分個(gè)數(shù)為 4。選 x1 為第一主成分,x2 為第二主成分,x3 為第三主成分。且這四個(gè)主成分的方差和占全部方差的 87.231%,即基本上保留了原來(lái)指標(biāo)的信息。這樣由原來(lái)的 13 個(gè)指標(biāo)變?yōu)榱?4 個(gè)指標(biāo)。圖 4 碎石圖上圖為因子分析法碎石圖,可見(jiàn)因子數(shù)達(dá)到 4 以上時(shí),特征值小于 1,特征值的變化曲線趨于平緩,所以由碎石圖也可大致確定出主成分個(gè)數(shù)為 4。與按累計(jì)貢獻(xiàn)率確定的主成分個(gè)數(shù)是一致的。表 6成份得分系數(shù)矩陣12成份1234x1-0.0980.0540.317-0.363x2-0.024-0
47、.1850.4380.187x30.0700.227-0.085-0.026x40.0840.1320.1960.459x5-0.1820.051-0.0390.137x60.141-0.150-0.2590.062x70.153-0.113-0.2560.005x80.0850.2000.130-0.126x90.0590.2550.116-0.041x100.143-0.0370.183-0.402x110.097-0.1800.3840.027x120.189-0.001-0.013-0.172x130.1470.0850.1400.3309.051.38999.80610.014.11
48、199.91711.006.04499.96112.004.03299.99213.001.008100.00上述表格代表了各指標(biāo)與公共因子的線性關(guān)系,上述數(shù)據(jù)了A 矩陣的元素,由上述表格可求得各公共因子見(jiàn)表 7。為了評(píng)價(jià)各項(xiàng)用戶(hù)-書(shū)籍評(píng)分,取各因子的方差貢獻(xiàn)率為權(quán)重對(duì)因子加總得到各評(píng)分如下表所示:表 7公共因子和評(píng)分結(jié)果表6.3 智能推薦13用戶(hù) ID書(shū)籍 IDf1f2f3f4ff 修正后評(píng)價(jià)得分2515537900197 1.200.780.751.281.030.994.982515537680158 -0.16-0.47-0.461.07-0.140.483.9625155377703
49、09 0.771.050.291.160.850.914.822515537424691 0.570.650.050.950.580.804.602515537573732 -1.68-1.10-2.120.78-1.260.004.002515537210973 0.32-0.240.252.080.360.704.404156658175031 -0.79-1.660.601.38-0.610.282.564156658422711 0.63-1.171.74-1.63-0.060.524.044156658585783 0.28-1.621.911.210.020.564.1241566
50、58412990 -0.53-1.760.870.96-0.540.314.004156658134003 0.64-1.512.03-0.640.000.553.204156658443948 -0.81-1.830.24-0.42-0.940.143.145997834346935 -1.300.950.86-1.73-0.400.373.745997834144718 -0.882.071.360.100.420.734.465997834827305 -1.480.620.90-0.01-0.360.394.395997834219560 -0.731.731.49-0.210.360
51、.704.405997834242057 -1.351.100.84-0.28-0.200.463.925997834803508 -1.860.130.35-0.93-0.870.173.177245481794171 1.05-0.25-0.74-0.170.280.674.347245481381060 1.620.47-0.29-0.320.800.894.787245481776002 1.491.31-0.400.301.051.005.007245481980705 1.72-0.14-0.15-0.460.660.834.667245481354292 1.30-0.65-0.
52、36-1.440.160.624.247245481738735 1.27-0.54-0.71-2.140.050.574.147625225473690 0.12-0.28-0.651.160.030.564.127625225929118 -0.09-0.31-1.270.26-0.260.434.437625225235338 0.280.32-0.850.290.150.614.227625225424691 0.590.82-0.580.800.540.784.567625225916469 0.48-0.17-0.56-0.300.050.574.147625225793936 0
53、.160.12-1.06-0.14-0.040.534.069214078310411 0.320.950.050.010.440.744.489214078727635 -0.82-0.74-1.20-1.12-0.880.164.009214078724917 -1.680.34-1.660.51-0.800.203.409214078325721 -0.46-0.22-0.82-1.49-0.560.303.609214078105962 0.100.53-0.17-0.310.150.614.229214078235338 -0.320.73-0.54-0.56-0.060.524.0
54、46.3.1 構(gòu)建網(wǎng)絡(luò)題目中的六個(gè)用戶(hù)進(jìn)行推薦活動(dòng),首先需要構(gòu)建基于用戶(hù)社交的復(fù)雜分層網(wǎng)絡(luò),有于距離太遠(yuǎn)的書(shū)籍和用戶(hù)適應(yīng)度較差,對(duì)智能推薦效果不佳,所以建立局部的拓?fù)渚W(wǎng)絡(luò)進(jìn)行智能推薦。選取與目標(biāo)用戶(hù)相鄰的用戶(hù)結(jié)點(diǎn)以及所有與其關(guān)林的書(shū)籍結(jié)點(diǎn)情如下:一個(gè)網(wǎng)絡(luò),其中書(shū)籍結(jié)點(diǎn) 2434 個(gè),用戶(hù)結(jié)點(diǎn) 78 個(gè),詳表 8 編號(hào)分配網(wǎng)絡(luò)的局部鄰接矩陣(局部) 5631731312318318888931910386910 31 3131 𝑃𝑎𝑡(𝑖, 𝑗) = 5610 10 10 10 362 6 38656最短距離矩陣(局
55、部): 17.1412.507.1410.008.3333.336.670.0012.5014.2917.6945.8310.0012.500.006.678.3338.604.7614.296.670.0011.1141.307.1417.69 7.148.33 min𝑑(𝑖, 𝑗) = 10.0011.11 0.00 40.00 9.09 11.11 40.48 8.33通過(guò)進(jìn)行復(fù)雜網(wǎng)絡(luò)計(jì)算,根據(jù) 13 類(lèi)因素指標(biāo)并沿用問(wèn)題二中的權(quán)重比例預(yù)測(cè)出用戶(hù)對(duì)所有書(shū)籍的評(píng)分。利用智能推薦算法進(jìn)行推薦,結(jié)果如下表:表 9 推薦結(jié)果表7. 模型總結(jié)7.1
56、模型優(yōu)點(diǎn)(1) 該模型充分利用社交網(wǎng)絡(luò)信息對(duì)書(shū)籍和用戶(hù)的適應(yīng)性進(jìn)行評(píng)價(jià),能夠在評(píng)價(jià)和推薦過(guò)程中基于數(shù)據(jù)關(guān)聯(lián)分析。14用戶(hù) ID推薦一推薦二推薦三書(shū)籍 ID最短路徑書(shū)籍 ID最短路徑書(shū)籍 ID最短路徑251553769857316.2551601218.7570964418.75415665869857315.8851601218.3870964418.38599783479417123.4528455034.3228455036.74724548170269924.5696272929.1364225631.78762522569857316.2551601218.7570964418.759
57、21407877600227.2555164332.2551037232.25結(jié)點(diǎn)類(lèi)型編號(hào)用戶(hù)178書(shū)籍792512(2) 本文在書(shū)籍關(guān)聯(lián)評(píng)分過(guò)程中綜合考慮,用戶(hù)打分習(xí)慣,書(shū)籍受評(píng)特征,用戶(hù)和面共計(jì) 13 種指標(biāo),較全面地反映了用戶(hù)與書(shū)籍間的關(guān)聯(lián)強(qiáng)度,且對(duì)每一個(gè)結(jié)點(diǎn)根據(jù)網(wǎng)絡(luò)重要性賦予強(qiáng)度值,立足于社交網(wǎng)絡(luò)來(lái)評(píng)價(jià)書(shū)籍。(3) 本文在評(píng)分模型中采用因子分析法,解決了指標(biāo)間多重共線性的問(wèn)題生成了 4共因子,并以其對(duì)方差的貢獻(xiàn)率為權(quán)重得到綜合指標(biāo),較準(zhǔn)確地衡量了讀者對(duì)書(shū)籍的評(píng)價(jià)。(4) 智能推薦模型中,建立局部網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)先便利整個(gè)拓?fù)鋱D對(duì)指定用戶(hù)利用綜合指標(biāo)評(píng)價(jià),再優(yōu)先選擇評(píng)價(jià)較高的書(shū)籍作為推薦結(jié)果,實(shí)現(xiàn)了推薦的智能, 客觀,全面。7.2 模型缺點(diǎn)(1)模型是基于社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行的評(píng)價(jià)撲結(jié)構(gòu)較為復(fù)雜且很難實(shí)現(xiàn)全網(wǎng)的最有評(píng)估。和智能推薦,但社交網(wǎng)絡(luò)拓(2)該
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年體育休閑廣場(chǎng)健身俱樂(lè)部市場(chǎng)分析初步評(píng)估報(bào)告
- 藥品調(diào)劑分裝管理制度
- 藥品間接銷(xiāo)售管理制度
- 藥店員工獎(jiǎng)罰管理制度
- 藥店督導(dǎo)各項(xiàng)管理制度
- 菜園農(nóng)藥使用管理制度
- 設(shè)備人員技能管理制度
- 設(shè)備單獨(dú)使用管理制度
- 設(shè)備技術(shù)檔案管理制度
- 設(shè)備檢測(cè)檢驗(yàn)管理制度
- 2025年全國(guó)新高考II卷高考全國(guó)二卷真題英語(yǔ)試卷(真題+答案)
- 《老年人認(rèn)知記憶訓(xùn)練》課件
- 經(jīng)濟(jì)法學(xué)-001-國(guó)開(kāi)機(jī)考復(fù)習(xí)資料
- 2024年廣東省中考生物+地理試卷(含答案)
- 內(nèi)蒙古自治區(qū)安全評(píng)價(jià)收費(fèi)指導(dǎo)性意見(jiàn)(試行)(2006年)
- 食品中日文加工用語(yǔ)
- 小班化教育課堂教學(xué).ppt
- ISO 鑄件尺寸公差標(biāo)準(zhǔn) ISO8062
- 巧克力糖自動(dòng)包裝機(jī)說(shuō)明書(shū)
- 等效內(nèi)摩擦角計(jì)算表
- 繼承不動(dòng)產(chǎn)登記具結(jié)書(shū)
評(píng)論
0/150
提交評(píng)論