數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述_第1頁
數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述_第2頁
數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述_第3頁
數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述_第4頁
數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘在體育領(lǐng)域中的應(yīng)用研究綜述摘要 :隨著計算機(jī)技術(shù)的發(fā)展 , 數(shù)據(jù)挖掘作為快速有效地從海量數(shù)據(jù) 中提取信息的工具得到了日趨廣泛的應(yīng)用。 本文立足于數(shù)據(jù)挖掘的新 興應(yīng)用領(lǐng)域體育領(lǐng)域 , 綜述了數(shù)據(jù)挖掘在體育產(chǎn)業(yè)、體質(zhì)數(shù)據(jù)及 競技體育中的應(yīng)用 , 為數(shù)據(jù)挖掘在體育中的進(jìn)一步應(yīng)用研究提供了參 考。關(guān)鍵詞 :體育數(shù)據(jù)挖掘 ; 矩陣 ; 數(shù)據(jù)流1引言信息時代 , 伴隨著計算機(jī)技術(shù)的飛速發(fā)展 , 特別是數(shù)據(jù)庫技術(shù)應(yīng)用 的日益普及 , 人們正面臨著飛速增長的海量數(shù)據(jù) , 而如何有效地利用 這一大量豐富數(shù)據(jù) , 以便更好地為人類服務(wù) , 已日趨成為眾多信息科 技工作者所關(guān)注的焦點之一。 在數(shù)據(jù)管理技術(shù)與

2、工具軟件日趨成熟的 同時 , 人們之前所使用的數(shù)據(jù)分析技術(shù)和軟件 , 卻已經(jīng)無法有效地為 決策者們提供相關(guān)知識 , 以支持他們做出正確決策 , 至此導(dǎo)致了一種 獨特的現(xiàn)象:“豐富的數(shù)據(jù) , 貧乏的知識” 。數(shù)據(jù)挖掘 (Data Mining的功能就是快速有效地從海量數(shù)據(jù)中提 取出所需要的答案 , 實現(xiàn)“數(shù)據(jù) -信息 -知識 -價值 ”的轉(zhuǎn)變過 程 , 這一技術(shù)作為一個新興的多學(xué)科交叉技術(shù) , 正在各行各業(yè)的決策 支持活動中扮演日趨重要的角色。2數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘 (簡稱 DM, 簡單地講就是從大量數(shù)據(jù)中挖掘或抽取出知 識 , 有關(guān)數(shù)據(jù)挖掘概念的定義有多種版本 , 而目前被普遍采用的定義 描述

3、為:數(shù)據(jù)挖掘 , 又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn) (Knowledge Discovery from Database,簡稱 KDD, 是一個從海量看似無關(guān)的數(shù)據(jù)中挖掘抽取 出有效的、新穎的、潛在有用的、以及最終可理解的模式或規(guī)律等知 識的復(fù)雜過程。由于數(shù)據(jù)挖掘是一門受到來自各種不同領(lǐng)域的研究者關(guān)注的交叉 性學(xué)科 , 因此導(dǎo)致了很多不同的術(shù)語名稱。 其中 , 最常用的術(shù)語是 “知 識發(fā)現(xiàn)”和“數(shù)據(jù)挖掘” 。相對來講 , 數(shù)據(jù)挖掘主要流行于統(tǒng)計界 (最 早出現(xiàn)于統(tǒng)計文獻(xiàn)中 、 數(shù)據(jù)分析、 數(shù)據(jù)庫和管理信息系統(tǒng)界 ; 而知識 發(fā)現(xiàn)則主要流行于人工智能和機(jī)器學(xué)習(xí)界。數(shù)據(jù)挖掘任務(wù)通??煞譃閮深?描述和預(yù)測。描

4、述性挖掘任務(wù)在于刻畫數(shù)據(jù)庫中數(shù)據(jù)的一特性 , 而預(yù)測性挖掘任務(wù)則以當(dāng)前數(shù)據(jù)為基 礎(chǔ) , 通過假設(shè)推斷的方法 , 進(jìn)行預(yù)測。數(shù)據(jù)挖掘的實施步驟通??煞譃?(1問題的理解和提出:在開始數(shù)據(jù)挖掘之前最基礎(chǔ)的就是理解數(shù)據(jù) 和實際需要解決的業(yè)務(wù)問題 , 在這個基礎(chǔ)之上提出問題 , 并明確地定 義目標(biāo)。(2數(shù)據(jù)準(zhǔn)備:獲取原始的數(shù)據(jù) , 并從中抽樣一定數(shù)量的樣本 , 形成數(shù) 據(jù)挖掘庫。 一般而言 , 很大型企業(yè)都搭建了數(shù)據(jù)倉庫 , 能很好地滿足數(shù) 據(jù)挖掘的要求。(3數(shù)據(jù)整理:由于數(shù)據(jù)可能是不完整的、有噪音的、隨機(jī)的、且有 復(fù)雜的數(shù)據(jù)結(jié)構(gòu) , 故需要對數(shù)據(jù)進(jìn)行初步的整理 , 清洗不完整的數(shù)據(jù) , 做初步的描述

5、分析 , 選擇與數(shù)據(jù)挖掘有關(guān)的變量 , 或者轉(zhuǎn)換派生相關(guān) 變量。(4建立模型:根據(jù)數(shù)據(jù)挖掘的目標(biāo)和所研究數(shù)據(jù)的特征 , 選擇合適 的算法構(gòu)建模型。(5評價和解釋:對數(shù)據(jù)挖掘的結(jié)果進(jìn)行評價 , 從多個候選模型中選 擇最優(yōu)的 , 作出評價 , 并要結(jié)合專業(yè)知識對結(jié)果進(jìn)行解釋。以上的步驟并不是一次能夠完成的 , 可能其中某個或全部步驟要反復(fù) 迭代進(jìn)行。數(shù)據(jù)挖掘應(yīng)用廣泛 , 其產(chǎn)生的知識可以用于決策支持、信息管理、 科學(xué)研究等許多領(lǐng)域 , 因而數(shù)據(jù)挖掘技術(shù)與各個行業(yè)形成了有機(jī)的結(jié) 合 , 并體現(xiàn)了蓬勃的生命力。數(shù)據(jù)挖掘目前主要應(yīng)用于銷售、生物醫(yī) 學(xué)、電信業(yè)、金融、軍事、教育等應(yīng)用領(lǐng)域。3數(shù)據(jù)挖掘在體育

6、領(lǐng)域中的應(yīng)用伴隨著數(shù)據(jù)挖掘在傳統(tǒng)應(yīng)用領(lǐng)域不斷取得豐碩成果 , 近年來體育 等新興領(lǐng)域也開始嘗試使用數(shù)據(jù)挖掘技術(shù) , 并取得了一定的進(jìn)展。 3.1體育產(chǎn)業(yè)在體育產(chǎn)業(yè)中 , 數(shù)據(jù)挖掘技術(shù)可以判斷哪些是它們潛在的最有價 值客戶、支持修改或重新制定產(chǎn)品推廣策略 , 從而把合適的產(chǎn)品推銷 給最需要它們的客戶群 , 以便用最經(jīng)濟(jì)的促銷獲得最好的銷售結(jié)果。 例如 , 在體育廣告中 , 通過對不同體育運動廣告業(yè)務(wù)的數(shù)據(jù)進(jìn)行挖掘 , 獲得有意義的信息 , 一定程度地提高體育廣告的效益:如發(fā)現(xiàn)了做某 類體育廣告的單位或公司的具體特征 , 就可以向具有這些特征但還未成為客戶的類似單位推銷這類廣告 ; 在防范客戶流失

7、的過程中 , 如果 通過挖掘找到流失客戶的共同特征 , 就可以對那些具有類似特征但目 前還未流失的客戶進(jìn)行針對性的彌補(bǔ) , 而不必盲目行動。因此 , 及時、 有效地利用數(shù)據(jù)挖掘技術(shù) , 可以更好推動體育產(chǎn)業(yè)的進(jìn)一步發(fā)展。 3.2體育課程考核在高校體育課程教學(xué)中 , 考試不僅是衡量學(xué)生學(xué)習(xí)好壞的手段 , 也 是指導(dǎo)學(xué)生平時學(xué)習(xí)及培養(yǎng)終身體育觀的內(nèi)在動力。因此 , 適合學(xué)生 的考試內(nèi)容、 方法和手段對培養(yǎng)和提高學(xué)生學(xué)習(xí)的積極性有很大的促 進(jìn)作用 , 同時也可以推動高校體育向素質(zhì)教育的轉(zhuǎn)變。 在實踐中 , 可以 匯總整理學(xué)生的各項體育 (理論、技能、素質(zhì)等 成績 , 建立數(shù)據(jù)庫 , 然后采用數(shù)據(jù)挖掘

8、技術(shù) , 發(fā)掘出隱藏在這些數(shù)據(jù)背后的內(nèi)涵和規(guī)律。 如考試內(nèi)容的繁雜程度、 考試方法手段是否公平、 考試標(biāo)準(zhǔn)是否合理 等等。根據(jù)這些結(jié)果 , 就可以有針對行地對現(xiàn)有的考核模式進(jìn)行逐步 改善或改革 , 以便更好地體現(xiàn)考試在檢驗教學(xué)效果、提高教學(xué)質(zhì)量等 方面所起到的重要作用。3.3體質(zhì)數(shù)據(jù)分析我國政府十分重視國民健康 , 采用各種措施增強(qiáng)國民體質(zhì) , 而且每 年都會進(jìn)行大量的體質(zhì)測試 , 這就積累了大量的體質(zhì)數(shù)據(jù)。 目前 , 現(xiàn)有 的很多分析評價軟件對這些數(shù)據(jù)的分析幾乎只停留在統(tǒng)計層面 , 即通 過均值分析以及套用規(guī)定的評價公式進(jìn)行分析和評價。當(dāng)然 , 這些分 析對體質(zhì)數(shù)據(jù)分析有一定的貢獻(xiàn) , 但只

9、能局限于對數(shù)據(jù)本身的大小進(jìn) 行比較 , 而且產(chǎn)生的結(jié)果一般只能為少部分專業(yè)人員所理解 , 同時 , 使 用統(tǒng)計方法進(jìn)行數(shù)據(jù)之間潛在聯(lián)系的挖掘分析也十分有限。 而利用數(shù) 據(jù)挖掘?qū)w質(zhì)數(shù)據(jù)進(jìn)行挖掘 , 則容易獲得統(tǒng)計方法難以得到的有意義 結(jié)果。例如 , 根據(jù)不斷收集積累的數(shù)據(jù) , 再結(jié)合營養(yǎng)學(xué)方面的知識 , 不 但可以發(fā)現(xiàn)不同地區(qū)體質(zhì)的差異 , 而且還可以挖掘分析出導(dǎo)致差異的 營養(yǎng)方面的原因 ; 同樣 , 結(jié)合醫(yī)學(xué)方面的知識 , 能夠判斷人們的健康狀 況 , 甚至分析出導(dǎo)致各種非正常健康狀況的疾病原因 , 從而更好地為 人們自我保健和健身等方面提供強(qiáng)有力的指導(dǎo) ; 此外 , 采用數(shù)據(jù)挖掘 對知名運

10、動員的早期體質(zhì)數(shù)據(jù)進(jìn)行挖掘分析 , 能夠總結(jié)出它們的共同 特點 , 從而為今后的體育選材提供有力的參考依據(jù)。體質(zhì)數(shù)據(jù)庫正如 一個信息寶庫 , 采用數(shù)據(jù)挖掘技術(shù)進(jìn)行深入分析 , 能夠獲得很多無法 想象的寶藏。3.4競技體育競技體育特別是對抗性質(zhì)的競技 , 通常不但要求運動員自身實際水平 高 , 而且戰(zhàn)術(shù)策略也相當(dāng)重要 , 甚至有時技戰(zhàn)術(shù)地合理運用能起到?jīng)Q 定性作用?,F(xiàn)代信息技術(shù)被廣泛應(yīng)用于競技體育的技術(shù)分析中 , 在分析和改進(jìn)運 動員技術(shù)動作的方面 , 可以發(fā)揮其他儀器無法比擬的作用。研究人員 可以將每名運動員或運動隊在各個階段的訓(xùn)練計劃、 比賽成績、 素質(zhì) 指標(biāo)、技術(shù)指標(biāo)、心理狀況等大量數(shù)據(jù)存

11、入預(yù)先建立好的數(shù)據(jù)庫中 , 運用數(shù)據(jù)挖掘技術(shù) , 對各種因素進(jìn)行綜合計算和處理 , 并加以對比和 分析 , 診斷技術(shù)動作中的缺陷 , 進(jìn)而找出改善技術(shù)的關(guān)鍵和手段并加 以指導(dǎo)實際的訓(xùn)練。眾所周知 , 競技體育的技術(shù)動作是在短暫的瞬間 內(nèi)完成的 , 人的肉眼難以準(zhǔn)確地分析判斷出運動員動作的規(guī)范程度。 例如跳遠(yuǎn)從助跑、起跳、騰空到落地整個技術(shù)動作只有幾秒鐘 , 肉眼 根本無法準(zhǔn)確識別分析 , 而利用計算機(jī)技術(shù)儀器就能對運動員的技術(shù) 動作進(jìn)行精確捕捉并分析。 技術(shù)工作者可以先用攝像機(jī)將運動員的技 術(shù)動作錄下來 , 再通過視頻捕捉卡將其輸入計算機(jī) , 采集技戰(zhàn)術(shù)數(shù)據(jù) , 再利用數(shù)據(jù)挖掘技術(shù)進(jìn)行技戰(zhàn)術(shù)分

12、析 , 以便正確指導(dǎo)今后的訓(xùn)練和比 賽。同樣 , 利用數(shù)據(jù)挖掘技術(shù)也可以分析籃球、足球、排球、羽毛球、 網(wǎng)球等類似對抗性的競技運動 , 從中發(fā)現(xiàn)對手的弱點 , 以便有針對性 地制定出更有效的戰(zhàn)術(shù)。(1籃球。美國 NBA 籃球隊的教練 , 就利用 IBM 公司提供的數(shù)據(jù)挖掘工具臨場決 定替換隊員 , 目前已有大約 20個 NBA 球隊借助 IBM 公司開發(fā)的數(shù)據(jù)挖 掘應(yīng)用軟件 Advanced Scout系統(tǒng)來優(yōu)化他們的戰(zhàn)術(shù)組合。 Advanced Scout 是一個數(shù)據(jù)分析工具 , 教練可以在家里或在工作途中運用此工 具對儲存在 NBA 中心服務(wù)器上的數(shù)據(jù)進(jìn)行挖掘。在系統(tǒng)中 , 每一場比 賽的

13、事件都按得分、搶斷、助攻、失誤等等指標(biāo)被統(tǒng)計分類 , 且時間 標(biāo)記讓教練方便地借助回放和定位 NBA 比賽的錄像片斷來幫助理解 統(tǒng)計結(jié)果的含義。 例如魔術(shù)隊就因為運用 Scout 研究了隊員不同的布 陣安排 , 在與邁阿密熱隊的比賽中找到了獲勝的機(jī)會。系統(tǒng)分析顯示 魔術(shù)隊先發(fā)陣容中的兩個后衛(wèi)安佛尼 .哈德衛(wèi) (Anfernee Hardaway和伯蘭 . 紹 (Brian Shaw在前兩場中被評為-17分 , 這意味著他倆在場上本隊輸?shù)舻姆謹(jǐn)?shù)比得到的分?jǐn)?shù)多 17分。 然而 , 當(dāng)哈德衛(wèi)與替補(bǔ)后 衛(wèi)達(dá)利爾 . 阿姆斯創(chuàng) (Darrell Armstrong組合時 , 魔術(shù)隊得分為正 14分。在下

14、一場中 , 魔術(shù)隊增加了阿姆斯創(chuàng)的上場時間。此著果然見 效:阿姆斯創(chuàng)得了 21分 , 哈德衛(wèi)得了 42分 , 魔術(shù)隊以 88比 79獲勝。 魔術(shù)隊在第四場讓阿姆斯創(chuàng)進(jìn)入先發(fā)陣容 , 再一次打敗了熱隊。在第 五場比賽中 , 這個靠數(shù)據(jù)挖掘支持的陣容沒能拖住熱隊 , 但數(shù)據(jù)挖掘 畢竟幫助了魔術(shù)隊贏得了打滿 5場 , 直到最后才決出勝負(fù)的機(jī)會。 (2足球。意大利 AC 米蘭隊是歐洲一流的球隊之一 , 它采用了預(yù)測模型 , 通過分 析不同渠道的生理、 整形外科以及心理數(shù)據(jù)來防止球員受傷。 它的米 蘭實驗室明確地識別出可能與每個球員受傷相關(guān)的風(fēng)險要素 , 這個實 驗室還對有可能加盟球隊的球員進(jìn)行分析評價

15、 , 曾贏得 2006年世界 杯冠軍的意大利國家隊就有好幾位球員在米蘭實驗室接受過訓(xùn)練。 博 爾頓隊是一支成長迅速的英國職業(yè)足球隊 , 它很有名的一點就是其經(jīng) 理利用大量的數(shù)據(jù)來分析評價球員的表現(xiàn)和球隊的戰(zhàn)略 , 并利用數(shù)據(jù) 挖掘手段來識別出最有價值的客戶 , 通過讓他們獲益來提高他們的忠 誠度。(3棒球。美國圣路易斯紅雀隊的教練 Tony La Russa率領(lǐng)球隊獲得了 2006年 賽季棒球世界系列賽的冠軍 , 他被認(rèn)為是該項運動中最優(yōu)秀的教練之 一 , 他天才地將數(shù)據(jù)挖掘分析結(jié)果和直覺結(jié)合起來 , 決定何時把擊球 手當(dāng)中情緒激動的隊員換下去 , 何時用一名性格火爆的隊員來提升全 隊的士氣。

16、(4橄欖球。美國新英格蘭愛國者隊近來就非常成功 , 四年中有三次在超級碗杯決 賽中獲勝。這支球隊廣泛地采用數(shù)據(jù)和分析模型 , 無論在場上還是在 場下。深入的數(shù)據(jù)分析與挖掘幫助了這支球隊選擇球員 , 并且使其付 給球員的工資低于行業(yè)工資的上限。 該球隊在選擇球員時不像其他球 隊那樣采用球探 , 而是將一些非傳統(tǒng)的球員潛力評價指標(biāo)進(jìn)行排序 , 例如智力因素以及是否愿意將自身融入球隊等等。(5曲棍球。美國另一個正式的體育聯(lián)盟 , 國家曲棍球聯(lián)盟 , 正在開發(fā)自己的數(shù)據(jù) 挖掘應(yīng)用 NHL-ICE, 聯(lián)盟與 IBM 建立了一個技術(shù)型的合資公司 ,2007年 11 月推出一個電子實時的比賽計分和統(tǒng)計系統(tǒng)。

17、在原理上是一個 與 Advanced Scout 相似的數(shù)據(jù)挖掘應(yīng)用,可以讓教練、廣播員、新聞 記者及球迷挖掘 NHL 的統(tǒng)計。當(dāng)他們訪問 NHL 的 Web 站點時,球迷能 夠使用該系統(tǒng)循環(huán)看聯(lián)盟的比賽,同時廣播員和新聞記者可以挖掘統(tǒng) 計數(shù)據(jù),找花邊新聞為他們的實況評述添油加醋。 (6田徑。 美籍以色列體育科學(xué)家吉登·埃里爾在美國開設(shè)了一家“生物力學(xué)計 算機(jī)分析”公司,并對許多運動員的技術(shù)給予分析。在蒙特利爾奧運 會之前,他分析研究了美國鐵餅運動員維爾金斯的投擲技術(shù),發(fā)現(xiàn)維 爾金斯在鐵餅出手前,沒有充分利用制動腿的作用,從而失去了一部 分本應(yīng)傳到鐵餅上的力量,影響了運動成績。 經(jīng)過計算機(jī)的模擬計算, 如果糾正了這個錯誤,則他的預(yù)測成績還可提高 3 米左右。維爾金斯 按照埃里爾的建議改進(jìn)了投擲技術(shù),成績竟一下提高了 3 米多,還創(chuàng) 造了新的世界紀(jì)錄。 4 結(jié)語 數(shù)據(jù)挖掘技術(shù)是伴隨著行業(yè)數(shù)據(jù)量迅速膨脹和對知識發(fā)現(xiàn)的迫切 需要所出現(xiàn)的產(chǎn)物,目前在體育領(lǐng)域也已經(jīng)積累了大量的數(shù)據(jù),而且 都涉及很有才能而且價值不菲的人力資源,即運動員,對如何實現(xiàn)關(guān) 鍵資源最大化、 如何盡可能取得勝利的渴求必將推動數(shù)據(jù)挖掘在體育 領(lǐng)域的進(jìn)一步應(yīng)用。 參考文獻(xiàn) 1 朱小棟等. 數(shù)據(jù)流中基于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論