數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav課件_第1頁
數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav課件_第2頁
數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav課件_第3頁
數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav課件_第4頁
數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav課件_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘在優(yōu)化中的應用 -決策樹 -神經(jīng)網(wǎng)絡 1 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘解釋 數(shù)據(jù)挖掘,又稱為數(shù)據(jù)庫中知識發(fā)現(xiàn)(Knowledge discovery from database,簡稱KDD),它是一個從大量數(shù)據(jù)中抽取挖掘 出未知的、有價值的模式或規(guī)律等知識的復雜過程。數(shù)據(jù)挖掘 的全過程定義描述如下: 2數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 常用模型 決策樹:該模型常??梢杂脕頇z驗、預 測離散型的數(shù)據(jù)。如客戶的信用等級, 貸款的優(yōu)良與否等等。 人工神經(jīng)網(wǎng)絡:這是對人體大腦

2、的模擬. 該方法利用隱藏的一到兩層,對數(shù)據(jù)進 行分類或預測。但是速度比較慢。 多元回歸:主要用于處理連續(xù)型的自變量和 應變量,并可用于預測和其他分析。 Logistic 回歸:與線性回歸類似,但處理離 散型的應變量比較合適 K-means和聚類分析:主要用于分類 Kohonen self-organizing maps:是一種類似 神經(jīng)網(wǎng)絡,但主要用于聚類的分析工具。 關聯(lián)準則:主要用于尋找在數(shù)據(jù)中頻繁發(fā)生 的記錄間的關系,并可用于預測。 分類 (classification); 估計(estimation); 預測(prediction); 關聯(lián)分組(affinity grouping);

3、聚類(clustering)。 數(shù)據(jù)挖掘功能與模型數(shù)據(jù)挖掘功能與模型 3數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 決策樹的應用決策樹的應用Link AdaptionLink Adaption優(yōu)化優(yōu)化 神經(jīng)網(wǎng)絡的應用TDMR的定位 數(shù)據(jù)挖掘的應用 4數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 決策樹的概念 所謂決策樹就是一個類似流程圖的樹型結(jié)構(gòu),其中樹 的每個內(nèi)部結(jié)點代表對一個屬性(取值)的測試,其分支就代 表測試的每個結(jié)果;而樹的每個葉結(jié)點就代表一個類別。樹的 最高層結(jié)點就是根結(jié)點. 5數(shù)據(jù)挖掘的應用決策

4、樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 類別型 6數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)值型 7數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 應用場景 兩者關系很難通過其它函數(shù)關系不明確,難以建立映射. 一條直線或者簡單的曲線很難將內(nèi)容分割 8數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 決策樹生成方法 找出找出起起始的分隔始的分隔 : : 用來評估一個分隔數(shù)的衡量標準是分散度(diversity)。 分散度指標(index of

5、 diversity)很高,表示這個組合中包含平 均分配到多個類別,而分散度指標很低則表示一個單一類別的成員 居優(yōu)勢。 最好的分隔變數(shù)是能夠降低一個組的分散度,而且降得最 多。即下面式子最大化: 分散度(分隔前)分散度(分隔前)分散度(分隔分散度(分隔后后左左邊邊子集子集 合)分散度(分隔合)分散度(分隔后后右右邊邊子集合)子集合) 9數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)業(yè)務對語音的影響 數(shù)據(jù)對業(yè)務信道的擠占,造成語音半速率比例增加, MOS值的下降,影響用戶的感受; 數(shù)據(jù)對業(yè)務信道擠占的同時,與語音共享頻率資源, 對語音質(zhì)量的影響; 數(shù)

6、據(jù)對公共信道的擠占,造成尋呼的負荷增加,影響 語音業(yè)務的被叫; 提高單時隙的傳輸數(shù)據(jù)效率提高單時隙的傳輸數(shù)據(jù)效率, ,減小數(shù)據(jù)占用信道的減小數(shù)據(jù)占用信道的 時間時間, ,改善對語音的影響改善對語音的影響! ! 減少數(shù)據(jù)對公共信道資源的擠占,增加公減少數(shù)據(jù)對公共信道資源的擠占,增加公 共信道資源的容量共信道資源的容量! ! 合理分配數(shù)據(jù)和語音對頻率資源的占用合理分配數(shù)據(jù)和語音對頻率資源的占用, ,讓語音占讓語音占 用更好的頻率資源用更好的頻率資源! ! 10數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 如何提高單時隙的傳輸數(shù) 據(jù)效率 信道分配和釋放機制的

7、優(yōu)化: 信道分配: 優(yōu)先保證語音信道的分配; 合理壓縮數(shù)據(jù)信道的資源,提升數(shù)據(jù)信道效率,減少語音半速率的觸發(fā); 信道釋放: 加快數(shù)據(jù)下行信道的釋放,提升信道效率; 增加EDGE資源的投入, 使更多的用戶使用EDGE, 提高整體的單時隙的吞吐率; 自適應鏈路的優(yōu)化研究 分析高編碼比例和重傳率對單時隙吞吐率的影響; 研究在不同無線環(huán)境下, 編碼方式的調(diào)度修正值對高編碼比例和重傳率的影響; 建立在不同無線環(huán)境下,自適應鏈路的參數(shù)與單時隙吞吐率的模型關系; 找到最匹配的參數(shù)設置,來提高單時隙的傳輸效率; 11數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 鏈路自

8、適應工作機制1/2 數(shù)據(jù)傳輸剛啟動所應用的編碼方 式,是通過參數(shù)預先設定的。以 下是諾基亞系統(tǒng)內(nèi)的相應參數(shù), 為BTS級參數(shù): InitMCSAckMode 1至9 (默認 值為9 = MCS9) InitMCSUnackMode 1至9 (默 認值為6 = MCS6) 由于MCS14為GMSK調(diào)制方式,而MCS59為 8PSK調(diào)制。所以,應對無線環(huán)境的變化,首 先要確定采用哪種調(diào)制方式。 諾基亞系統(tǒng)在進行上述判斷時,首先根據(jù)以 下兩個測量值: 8PSK MEAN_BEP 8PSK CV_BEP 來對照下表,獲取BEP查表值: 然后,把這個BEP查表值與GMSK MEAN_BEP測量值比較,如

9、果: BEP查表值 GMSK MEAN_BEP測量值, 則采用8PSK調(diào)制方式 啟動信道編碼的設置啟動信道編碼的設置 調(diào)制方式的動態(tài)選擇調(diào)制方式的動態(tài)選擇 12數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 鏈路自適應工作機制2/2 在在ACK ACK 模式的模式的MCSMCS編碼選擇方式編碼選擇方式 重傳的重傳的MCSMCS編碼選擇方式編碼選擇方式 針對每個RLC數(shù)據(jù)塊,PCU都能拿 到測量報告,上行鏈路系統(tǒng)測量、 下行鏈路手機上報,這樣,PCU通 過查找內(nèi)置表格,如下圖所示, 來確定下一個RLC傳送的編碼。 在EGPRS系統(tǒng),重傳數(shù)據(jù)的編碼方式是可以

10、 改變,這與GPRS技術有所不同。系統(tǒng)通過 降低編碼速率,提高數(shù)據(jù)的強壯性,來對 抗惡化的無線環(huán)境,最終達到提高成功率 的目的。而編碼方式的改變,將涉及到數(shù) 據(jù)塊的重新組裝,只有屬于相同Coding Family的編碼方式才可以達到這種兼容性 。在EGPRS系統(tǒng)中,9種編碼分別屬于三個 FAMILY,如下圖所示: 13數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 優(yōu)化思路 通過LA提高數(shù)據(jù)傳送效率,一方面可以減少數(shù)據(jù)業(yè)務PDCH的資 源占用,另一方面占用時間減少后,能夠降低對語音業(yè)務的干 擾。 優(yōu)化目標的選擇:(主要優(yōu)化參數(shù)MBP) 每時隙吞吐率 =總

11、流量/平均占用PDCH數(shù) 該指標受平均占用PDCH數(shù)影 響很大,如果小區(qū)的CDED配 置較小,那么每時隙吞吐率 必定會較大,無法反映傳送 效率。 數(shù)據(jù)業(yè)務等效話務量 =傳送的總塊數(shù)/每時隙 每小時能夠傳送的塊數(shù) 該指標只能反映數(shù)據(jù)業(yè) 務的流量大小。 每塊傳送字節(jié)數(shù) =總字節(jié)/總塊數(shù)(包括 重傳的塊數(shù)) 該指標的分子部分隱含 意義是是否高編碼占比 高,分母部分將重傳率 也納入考慮,該指標最 能體現(xiàn)數(shù)據(jù)傳送效率。 14數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 相關性分析 -尋找影響每塊傳送效率 的主要因素 每塊傳送效率和重傳率以及高編碼占比,每塊傳送效

12、率和重傳率以及高編碼占比, 而重傳率和高編碼占比需要而重傳率和高編碼占比需要LALA和和IRIR參數(shù)優(yōu)參數(shù)優(yōu) 化來解決化來解決 通過相關性分析降緯通過相關性分析降緯 每塊重傳效率和下行平均質(zhì)量相關度最大每塊重傳效率和下行平均質(zhì)量相關度最大 ,其次是下行,其次是下行1-51-5級質(zhì)量占比,下行級質(zhì)量占比,下行Path Path lossloss和下行接收電平相關性很小。和下行接收電平相關性很小。 下行平均質(zhì)量和下行平均質(zhì)量和1-51-5級質(zhì)量占比自相關度比級質(zhì)量占比自相關度比 較大,因此將下行平均質(zhì)量作為決策樹的較大,因此將下行平均質(zhì)量作為決策樹的 因子。因子。 15數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡

13、Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 決策樹尋找最優(yōu)MBP 當平均接收接收質(zhì)量當平均接收接收質(zhì)量 小于小于0.190.19時(也就是時(也就是 無線質(zhì)量非常良好時無線質(zhì)量非常良好時 ,MBPMBP取取6 6能夠得到最能夠得到最 大的塊傳送效率大的塊傳送效率 0.12kyte/block. 0.12kyte/block. (960bit(960bit每塊)每塊) 當平均接收接收質(zhì)量大當平均接收接收質(zhì)量大 于于0.190.19且小于且小于0.550.55時,時, MBPMBP取取5 5能夠得到最大的能夠得到最大的 塊傳送效率塊傳送效率 0.11kyte/block. 0.11

14、kyte/block. (880bit(880bit每塊)每塊) MBP是離散的, Quality是連續(xù)的,其它的函數(shù) 較難映射 16數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 決策樹結(jié)果理解 將選擇質(zhì)量較差至少9個小區(qū),分別設置- 6,-5,-4,-3,-2,-1,0,1,2來觀察每塊傳送效 率, 17數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav LA參數(shù)調(diào)整后效果評估 參考尋優(yōu)結(jié)果后參考尋優(yōu)結(jié)果后, ,調(diào)整調(diào)整MBPMBP設置后設置后, , 每塊傳送字節(jié)數(shù)從每塊傳送字節(jié)數(shù)從112112字節(jié)上升到字節(jié)上升到

15、118118字節(jié)字節(jié). . 18數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用 決策樹的應用決策樹的應用Link AdaptionLink Adaption優(yōu)化優(yōu)化 神經(jīng)網(wǎng)絡的應用神經(jīng)網(wǎng)絡的應用TDMRTDMR的定位的定位 19數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 生物神經(jīng)元 人工神經(jīng)網(wǎng)絡的研究出發(fā)點是以生物神經(jīng)元學說為基礎的 20數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 神經(jīng)網(wǎng)絡處理信息的特點 在在微觀內(nèi)部結(jié)構(gòu)微觀內(nèi)部結(jié)構(gòu)上模仿人腦的神經(jīng)上模

16、仿人腦的神經(jīng),并行分布系統(tǒng)處理的工作并行分布系統(tǒng)處理的工作 模式模式: 實際上大腦中單個神經(jīng)元的信息處理速度是很慢的,每次約1毫秒(ms),比 通常的電子門電路要慢幾個數(shù)量級。每個神經(jīng)元的處理功能也很有限,估計不會 比計算機的一條指令更復雜。 但是人腦對某一復雜過程的處理和反應卻很快,一般只需幾百毫秒。 例如要判定人眼看到的兩個圖形是否一樣,實際上約需400 ms,而在這個處理過 程中,與腦神經(jīng)系統(tǒng)的一些主要功能,如視覺、記億、推理等有關。按照上述神 經(jīng)元的處理速度,如果采用串行工作模式,就必須在幾百個串行步內(nèi)完成,這實 際上是不可能辦到的。因此只能把它看成是一個由眾多神經(jīng)元所組成的超高密度

17、的并行處理系統(tǒng)。例如在一張照片尋找一個熟人的面孔,對人腦而言,幾秒鐘便 可完成,但如用計算機來處理,以現(xiàn)有的技術,是不可能在短時間內(nèi)完成的。由 此可見,大腦信息處理的并行速度已達到了極高的程度。 21數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 神經(jīng)網(wǎng)絡模型 x2 w2 xn wn x1 w1 Fy 特性函數(shù)F )xwF(F(x)y xwx n 1iii n 1iii 22數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav F特性函數(shù) x0 x1 y y x 0 x e1 1 y 非線性 階躍 23數(shù)據(jù)挖掘的應用決策

18、樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 人工神經(jīng)網(wǎng)絡的自我學習 (訓練) 這種學習歸結(jié)為神經(jīng)元連接權的變化。調(diào)整Wij的原則為:若第i和第 j個神經(jīng)元同時處于興奮狀態(tài),則它們之間的連接應當加強,這一 規(guī)則與“條件反射”學說一致,并已得到神經(jīng)細胞學說的證實。 24數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav TDMR的定位應用 TDMR的定位數(shù)據(jù): MR數(shù)據(jù)(OSS): 頻點 擾碼 電平 網(wǎng)絡基礎數(shù)據(jù) 小區(qū)信息 經(jīng)/緯度 小區(qū)方向 頻率 擾碼 天線參數(shù) 包括主服務小區(qū)和相鄰小區(qū)的 訓練樣本數(shù)據(jù)(DT): 頻點 擾碼 電平 樣

19、本經(jīng)緯度 原理 利用訓練樣本數(shù)據(jù),結(jié)合網(wǎng)絡基 礎數(shù)據(jù),訓練模型 將MR數(shù)據(jù)代入, 得到待定位MR 數(shù)據(jù)的經(jīng)緯度. 25數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav MRMR數(shù)據(jù)數(shù)據(jù)(OSS):(OSS):即,實際測量中待定位樣本測得的臨近小區(qū)的場強分貝數(shù),其 中每行表示一個樣本,前14列表示每個樣本測得的臨近7個小區(qū)的小區(qū)號和相應 場強值。 訓練樣本數(shù)據(jù)訓練樣本數(shù)據(jù)(DT):(DT): 用于提供訓練樣本,構(gòu)建訓練樣本庫,訓練模型。其 中每行表示一個樣本,前14列表示每個樣本測得的臨近7個小區(qū)的小區(qū)號 和相應場強值;第15-16列為該樣本的經(jīng)度和緯度。 26數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 數(shù)據(jù)挖掘的應用決策樹神經(jīng)網(wǎng)絡Autosav 小區(qū)信息小區(qū)信息: : 提供所有小區(qū)的信息, 其中每行提供一個小區(qū)的信息,第1 列為小區(qū)號,第2-3列為小區(qū)的經(jīng)緯 度、第4列為該小區(qū)的方向角(單位: 度),第5列為該小區(qū)的類型(1表示 室外小區(qū),0表示室內(nèi)或全

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論