試論本體的應(yīng)用及其發(fā)展

上傳人：灰*** IP屬地：寧夏上傳時(shí)間：2021-12-06 格式：DOCX 頁數(shù)：8 大?。?8.15KB 積分：10.8 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、試論本體應(yīng)用及其發(fā)展【摘要】本文首先介紹了本體的概念，然后對本體的應(yīng)用情況做了分析：本體應(yīng)用研究主要集屮于本體在信息檢索、信息抽取、異構(gòu)信息系統(tǒng)的互操作和集成、語義web四個(gè)領(lǐng)域的應(yīng)用, 并表現(xiàn)出以下特點(diǎn):本體在信息檢索、信息抽取、異構(gòu)信息系統(tǒng)的互操作和集成3個(gè)領(lǐng)域的應(yīng)用研究以方法論探索為中心，研究方法以算法、建模和系統(tǒng)架構(gòu)為主。最后，本文對本體的發(fā)展趨勢進(jìn)行了總結(jié)?！娟P(guān)鍵字】本體；語義網(wǎng)；本體應(yīng)用；本體發(fā)展趨勢1本體的概念古希臘百科全書式的思想家亞里士多德(前384前322年)首先把哲學(xué)規(guī)定為關(guān)于“本體”之學(xué)，西方哲學(xué)中近代德國哲學(xué)家沃爾夫(christian wolff, 1679

2、-1754)第一次提出“本體”(ontology),黑格爾(17701831)曾轉(zhuǎn)述過它的定義：“本體，論述各種有關(guān) '存在'的、抽象的、完全普遍的哲學(xué)范疇，認(rèn)為存在是唯一的、完善的；其中出現(xiàn)了唯一者、偶性、實(shí)體、因果諸范疇；這是抽象的形而上學(xué)。根據(jù)韋氏詞典的解釋，本體是形而上學(xué)的一個(gè)分支，研究關(guān)于自然和存在的關(guān)系。它試圖冋答“什么是存在”，“存在的性質(zhì)是什么”等等。在哲學(xué)界，本體作為表述哲學(xué)理論的術(shù)語，是指形成現(xiàn)象的根本實(shí)體。20世紀(jì)末，隨著計(jì)算機(jī)技術(shù)的發(fā)展，本體被引入到信息學(xué)和人工智能領(lǐng)域。信息學(xué)和人工智能中所指的本體，從概念上劃分，可以有兩種理解：本體和狹義本體

3、。本體的定義，它在計(jì)算機(jī)學(xué)界的定義和內(nèi)涵經(jīng)歷了一系列的發(fā)展過程： 1991年，neches指出：“一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系，以及用于組合術(shù)語和關(guān)系以定義詞匯的外延的規(guī)則。” 該定義只是給出了建立一個(gè)本體的基本要素，即：要建立一個(gè)本體，首先要識別所處理領(lǐng)域的基本術(shù)語和這些術(shù)語之間的關(guān)系, 而后識別組合這些術(shù)語和關(guān)系的規(guī)則，并提供這些術(shù)語和關(guān)系的定義。 1993年，gruber指出："本體是概念化(conceptualization)的一個(gè)顯式的規(guī)格說明?！?;1997年，borst對該定義進(jìn)行了修改，提出：“本體是被共享的概念化的一個(gè)顯式的規(guī)格說明。”。

4、概念化(conceptualization)指某一概念系統(tǒng)所蘊(yùn)涵的語義結(jié)構(gòu)，它是對某一事實(shí)結(jié)構(gòu)的一組非正式的約束規(guī)則。它可以理解或表達(dá)為一組概念(如實(shí)體、屬性、過程)及其定義和相互關(guān)系。概念化的清楚的詳細(xì)說明是指：一個(gè)本體是対概念和關(guān)系的描述(就像程序的詳細(xì)說明書)，而這些概念和關(guān)系可能是針對一個(gè)代理或代理群體而存在的。這兩個(gè)定義后來成為人們經(jīng)常引用的定義，它們都特別強(qiáng)調(diào)了給出顯式解釋的可能性。 1999年，w訂liam和austin指出："本體是用于描述或表達(dá)某一領(lǐng)域知識的一組概念或術(shù)語，可用于組織知識庫較髙層次的知識抽象，也可用來描述特定領(lǐng)域的知識”。這種術(shù)語詞匯表可

5、以應(yīng)用于特定領(lǐng)域或者主題。本體不僅僅是詞匯表，而是整個(gè)上層知識庫（包插用于描述這個(gè)知識庫的詞匯）。它把本體看作知識的內(nèi)主體，而不是描述知識的途徑。 1999年，chandrasekaran等人認(rèn)為：“本體是屬于人工智能領(lǐng)域中的內(nèi)容理論，它研究特定領(lǐng)域知識的對象分類、對象屬性和對象間的關(guān)系，為領(lǐng)域知識的描述提供術(shù) 語?！?o在以上不同研究者的定義中，gruber的觀點(diǎn)是學(xué)術(shù)界普遍認(rèn)可、引用度最高的一種定義。其實(shí)從以上不同研究者的定義，也可以總結(jié)本體涉及到的概念為：術(shù)語（詞匯）、術(shù)語關(guān)系、規(guī)則、概念化、形式化的規(guī)格說明、領(lǐng)域知識、表達(dá)和共亨。其實(shí)，本體就是指通過對于概念、術(shù)語及其相互關(guān)系的

6、規(guī)范化描述，勾畫出某一領(lǐng)域的基本知識體系和描述語言。一個(gè)概念化對象就是對世界的一些抽象且簡明化的觀點(diǎn)。概念化對象可由部分表示領(lǐng)域，該領(lǐng)域屮相關(guān)事物狀態(tài)的集合和領(lǐng)域空間上的概念關(guān)系。也就是說，本體是對客觀世界全部或某一部分的概念化和結(jié)構(gòu)化的明確表示和描述。2木體的應(yīng)用隨著互聯(lián)網(wǎng)應(yīng)用逐漸向智能化和口動(dòng)化方向發(fā)展，本體作為概念模型和概念間關(guān)系的規(guī) 范描述，被廣泛應(yīng)用于信息系統(tǒng)和下一代互聯(lián)網(wǎng)語義網(wǎng)領(lǐng)域。本體在信息系統(tǒng)領(lǐng)域的應(yīng)用，主要集中在信息檢索、信息抽取、異構(gòu)信息、系統(tǒng)的互操作和集成，為其提供語義層的操作支持；木體作為一種能在知識層提供知識共享、重用的工具，在語義網(wǎng)屮的應(yīng)用研究也較為普遍

7、。2. 1本體在信息檢索中的應(yīng)用目前，國外對本體在信息檢索領(lǐng)域的應(yīng)用的研究較多，不少研究利用單個(gè)領(lǐng)域本體來改善特定學(xué)科領(lǐng)域的信息檢索效果。休斯頓大學(xué)提出一種基于用戶詢問的文本摘要技術(shù)來改善醫(yī)學(xué)信息檢索效果。他們選擇美國國家醫(yī)學(xué)圖書館開發(fā)的umls （一體化醫(yī)學(xué)語言系統(tǒng)）作為其主要的醫(yī)學(xué)本體知識庫，umls能幫助醫(yī)學(xué)信息系統(tǒng)理解生物醫(yī)學(xué)和健康領(lǐng)域的概念和術(shù)語的內(nèi)涵以及相互z間的關(guān)系。首先，研究人員選取數(shù)個(gè)在線醫(yī)學(xué)數(shù)據(jù)庫作為醫(yī)學(xué)資源信息來源,并通過網(wǎng)絡(luò)爬蟲從所選取的數(shù)據(jù)庫中抽取文檔并保存在本地文檔庫中，利用umls 對本地文檔進(jìn)行數(shù)據(jù)清洗，生成新的文檔摘要，建立基于概念的文檔索引；其次，

8、利用umls 對用戶輸入的關(guān)鍵詞進(jìn)行關(guān)鍵詞擴(kuò)展，增加縮寫關(guān)鍵詞、語義相近或相關(guān)的醫(yī)學(xué)術(shù)語等，刪除冗余關(guān)鍵詞，并反饋給用戶，由用戶最后決定；最后，根據(jù)用戶最終確定的擴(kuò)展關(guān)鍵詞對本地文檔庫的文檔摘要進(jìn)行語義匹配度運(yùn)算，檢索結(jié)果按相關(guān)度高低排列返回給用戶。此外，也有研究采用多本體整合的方式提高信息檢索性能。aijun dong提出一個(gè)基于多本體的多媒體注解模型，通過對領(lǐng)域無關(guān)的多媒體本體與領(lǐng)域本體進(jìn)行整合，實(shí)現(xiàn)從多個(gè) 特定領(lǐng)域角度對多媒體內(nèi)容進(jìn)行描述，從而使得用戶能更好地表達(dá)其對不同多媒體信息的需求。研究者基于多媒體內(nèi)容描述工具mpeg-7 （活動(dòng)圖象專家組）開發(fā)一個(gè)多媒體本體，提出一個(gè)整

9、合多領(lǐng)域本體的策略，設(shè)計(jì)一個(gè)術(shù)語抽取程序來自動(dòng)從多媒體數(shù)據(jù)的文木資源屮抽取特定領(lǐng)域的本體術(shù)語。初步實(shí)驗(yàn)表明，基于多本體的多媒體注解可以更好地滿足不同用戶的信息需求。高質(zhì)量的本體知識是提高信息檢索和管理質(zhì)量的關(guān)鍵因素。多數(shù)研究都是選擇現(xiàn)成的領(lǐng) 域本體作為其本體知識庫。本體在信息檢索中的應(yīng)用主要在以下兩個(gè)環(huán)節(jié)：一是根據(jù)木體對被檢索的信息資源進(jìn)行文檔預(yù)處理，包扌舌語義標(biāo)注與建立基于概念的文檔索引；二是系統(tǒng) 借助本體知識庫分析用戶查詢中所包含的術(shù)語含義，準(zhǔn)確理解用戶的查詢，從而提高信息檢索系統(tǒng)的查全率和查準(zhǔn)率。在用戶檢索過程屮，系統(tǒng)可為用戶提供語義提示，如進(jìn)行關(guān)鍵詞擴(kuò)展、去除冗余關(guān)鍵詞，并反

10、饋給用戶由其選擇，使用戶更精準(zhǔn)地描述自身的信息需求，與用戶建立良好的互動(dòng)關(guān)系。2. 2本體在信息抽取領(lǐng)域的應(yīng)用研究基于本體的信息抽取技術(shù)是一種把本體和信息處理技術(shù)結(jié)合起來實(shí)現(xiàn)信息抽取的技術(shù), 它是現(xiàn)在信息抽取研允的一個(gè)熱點(diǎn)，己經(jīng)有了很多研允。傳統(tǒng)的信息抽取雖然能抽取出實(shí)體, 但是缺乏領(lǐng)域知識來識別抽取實(shí)體之間的關(guān)系。因此，在信息抽取任務(wù)中引入相應(yīng)的領(lǐng)域知識一一領(lǐng)域本體來指導(dǎo)抽取過程，將能有效地提高信息抽取的性能。近兩年在自由文本信息抽取研究中，主要的研究方法可分為以下兩種：知識工程方法和機(jī)器學(xué)習(xí)方法。知識工程方法是指由專家對本體進(jìn)行分析、調(diào)整而人工制定規(guī)則、模板。美國德雷塞爾大學(xué)zho

11、u xiaohua等研究者開發(fā)了一個(gè)名為medic （醫(yī)學(xué)信息抽取的系統(tǒng)，h 的是從大規(guī)模自由文本臨床記錄中抽取和挖掘出大量患乳腺疾病的病人信息。信息抽取工作共分3步：（1 ）采用基于本體的方法進(jìn)行醫(yī)學(xué)術(shù)語抽取，使用言語模式生成候選術(shù)語，并確認(rèn)是否在本體庫中存在,為了彌補(bǔ)本體庫的不完整性，人工補(bǔ)充其他語義相似的術(shù)語;（2 ）最主要的環(huán)節(jié)，進(jìn)行關(guān)系抽取，人工建立抽取規(guī)則，利用連接語法解析器對句子進(jìn)行解析, 解析結(jié)果以圖表形式顯示，有著較高精確率；（3 ）文本分類，采用基于自然語言處理的特征抽取技術(shù)與id3決策樹（id3決策樹算法是數(shù)據(jù)挖掘屮常用的一科方法）相結(jié)合的方法。雖然該研究在試驗(yàn)

12、中取得較高的準(zhǔn)確率和召回率，但它的實(shí)驗(yàn)樣本規(guī)模較小，只有125條臨床記錄。當(dāng)系統(tǒng)面臨處理大規(guī)模且又多樣化書寫模式的臨床病例記錄時(shí)，它的信息抽取性能很可能降低。chyan等開發(fā)了 itsies系統(tǒng)（信息技術(shù)產(chǎn)品規(guī)格抽取系統(tǒng)），融合了自然語言處理技術(shù)和本體概念。研允者首先隨機(jī)選取有關(guān)ibm和hp數(shù)個(gè)it產(chǎn)品的34個(gè)網(wǎng)頁作為文檔庫；使用annie （基于規(guī)則方法的英文信息抽取系統(tǒng)）對網(wǎng)頁文檔進(jìn)行分詞，此外，annie的默認(rèn)功能可以識別出有關(guān)如地址、日期等的信息；在j ape （標(biāo)注模式引擎）屮人工建立語法規(guī)則，對信息實(shí)體進(jìn)行標(biāo)注；基于it產(chǎn)品特征對概念及其關(guān)系進(jìn)行描述，最終構(gòu)建成it產(chǎn)

13、品規(guī)格本體。itsies系統(tǒng)在對其它品牌的it產(chǎn)品。知識工程方法主要依靠人工編制規(guī)則來建立領(lǐng)域本體知識庫，需要學(xué)科領(lǐng)域?qū)＜业膮?與，開發(fā)過程較慢，其優(yōu)點(diǎn)是不需要對本體知識庫進(jìn)行經(jīng)常性更改，抽取效率較高，但由于其對該領(lǐng)域以后出現(xiàn)新的概念或關(guān)系無法及時(shí)發(fā)現(xiàn)，一旦發(fā)生這種悄況，信息抽取的召回率會(huì)降低。在國外，近兒年機(jī)器學(xué)習(xí)方法在信息抽取領(lǐng)域的應(yīng)用研究受到廣泛的關(guān)注，它主要通過學(xué)習(xí)己經(jīng)標(biāo)記好的語料庫獲取規(guī)則，無需投入大量人力。這種方法比知識工程方法快, 但需要足夠數(shù)量的訓(xùn)練文檔，才能保證其信息抽取的效率。2. 3本體在異構(gòu)信息系統(tǒng)互操作和集成領(lǐng)域的應(yīng)用研究分布式網(wǎng)絡(luò)環(huán)境下，無論是數(shù)字圖書館等學(xué)術(shù)

14、應(yīng)用系統(tǒng)，還是企業(yè)的商用信息系統(tǒng)，一定程度上都面臨著系統(tǒng)異構(gòu)、語法異構(gòu)、模式異構(gòu)和語義異構(gòu)4個(gè)層面的異構(gòu)問題。本體作為概念模型的明確的規(guī)范說明，正在成為解決異構(gòu)系統(tǒng)互操作和集成問題的基礎(chǔ)解決方案。近兩年，國外學(xué)者關(guān)于應(yīng)用本體解決信息系統(tǒng)異構(gòu)問題的研究主要圍繞方法層面：探尋基于本體的有效方法，解決特定領(lǐng)域的異構(gòu)問題。所采用的方法主要為本體與代理結(jié)合的方法、本體間映射方法。對基于本體的領(lǐng)域知識和本地信息資源之間的互操作和集成問題，研究者主要通過本體間的映射方法來分析解決。park分析提岀了電子商務(wù)環(huán)境下，異構(gòu)的產(chǎn)品分類目錄間的本體映射方法。由于嚴(yán)格的映射策略可能會(huì)導(dǎo)致客戶的查詢失敗，

15、文章提供了一個(gè)映射算法, 確保在合理的損失精度下，增加查詢結(jié)果中的產(chǎn)品組合。通過與本體映射算法prompt的比較實(shí)驗(yàn)，此算法的平均查詢結(jié)果數(shù)高于prompt的46.5%,平均精度比prompt差 13.6%,成功地實(shí)現(xiàn)了查詢結(jié)果的顯著提高與精確度的合理降低。基于本體的異構(gòu)信息查詢屮，分解和重構(gòu)一個(gè)木體概念實(shí)例的通用查詢，以形成多個(gè)基于本地信息源的子查詢，是一項(xiàng)基礎(chǔ)性挑戰(zhàn)。lijian開發(fā)了一套基于本體的異構(gòu)信息集成的查詢分工和重構(gòu)方案，主要采用基于映射的查詢分解和集成。其屮，通用本體被用來描述用戶感興趣的領(lǐng)域知識，用戶通過查詢通用本體獲得本體概念的實(shí)例。該方法分為3步：（1）提供一種

16、統(tǒng)一的概念實(shí)例來表述查詢。假設(shè)查詢結(jié)果是一個(gè)元組集合，定義了一系列基于元組的操作，因此查詢可以表述為對于元組集合的各種操作。（2 ）將通用查詢分解為多個(gè)本地查詢的方法，分解基于映射。此方法基于兩個(gè)假設(shè)：首先，通用映射由兩個(gè)本地映射組成，以集成兩個(gè)本地信息資源; 其次，市多個(gè)本地映射組成的通用映射的查詢分解，可以通過前面假設(shè)的二元結(jié)構(gòu)的多次過程迭代實(shí)現(xiàn)?；诖?，查詢將通過對應(yīng)的映射實(shí)現(xiàn)，研究人員提供了一種將通用映射下的通用查詢分解為本地映射下的多個(gè)子查詢的算法。子查詢對應(yīng)于元組集合的各種操作，其操作結(jié)果的集合為對應(yīng)的通用查詢結(jié)果。（3 ）本地的查詢結(jié)果被集成為通用查詢的結(jié)果。集成的

17、主要工作是組合分解了的元組的各種操作結(jié)果。2. 4本體在語義網(wǎng)中的應(yīng)用研究語義網(wǎng)的提出源于如何為網(wǎng)上的資源提供計(jì)算機(jī)可以理解的內(nèi)容。本體作為共同標(biāo)準(zhǔn)的概念體系，支持簡單推理，促進(jìn)計(jì)算機(jī)相互理解和互操作，本體的應(yīng)用可有效促進(jìn)語義網(wǎng)的性能。近兩年，研究者在語義網(wǎng)中的本體開發(fā)研究集中于引入多種方法，提高對不確定和非精確信息的表示能力，促進(jìn)半自動(dòng)化、自動(dòng)化本體生成和本體演化，以提供智能化的語義網(wǎng)服務(wù)?，F(xiàn)有的少量本體不足以滿足海量信息和語義網(wǎng)成長的需要，口組織特征映射方法, 從自動(dòng)抓取的網(wǎng)頁文檔中做出知識地圖；在知識地圖中，識別出本體的組成部分，將其組織成實(shí)體、關(guān)系和功能3部分，服務(wù)于語義網(wǎng)軟

18、件代理的動(dòng)態(tài)智能操作。關(guān)于木體演化和木體再造可動(dòng)態(tài)改進(jìn)本體，研究者在其可行性和一致性方面給予了關(guān)注.在語義網(wǎng)中，應(yīng)用基于推理的網(wǎng)絡(luò)本體后，在查全率和正確率上髙于基于注解的本體應(yīng)用；將信念修止理論整合進(jìn) 入本體再造方法，可確保本體修正的一致性。本體在海量復(fù)雜信息資源組織表示上的便利性和可靠性，首先基于高效的本體登記。 wang pchong分析提出了本體登記的互操作元模型框架方案，提供了一個(gè)基于信息系統(tǒng)和本體之間的語義層互操作的共同框架，以登記本體及其演化信息。本體清洗可在知識庫中發(fā)現(xiàn) 并修正本體和數(shù)據(jù)源屮的異常。從清洗代理設(shè)計(jì)的角度出發(fā)，指出在面臨知識庫完整性、連續(xù)性和正確性的不確定情

19、況下，只有基于可鑒定的推理過程才能獲得邏輯可信的清洗。有效的本體映射可以更好地理解用戶需求。不同于以往的擴(kuò)展用戶查詢詞的問答系統(tǒng)，該木體的處理過程為：用戶輸入口然語言查詢詞，采用關(guān)系相似性服務(wù)組件將自然語言查詢詞轉(zhuǎn)換成本體作為系統(tǒng)輸入，返回的答案來自一個(gè)或多個(gè)知識庫，實(shí)現(xiàn)不同的答案策略的組合?；?本體的代理人社區(qū)的做法，通過動(dòng)態(tài)生成通用本體，為信息集成系統(tǒng)演示了一種靈活和動(dòng)態(tài) 的方法來融合異構(gòu)數(shù)據(jù)源，以最大限度地進(jìn)行信息共亨。匹配語義網(wǎng)絡(luò)服務(wù)請求與語義網(wǎng)絡(luò) 服務(wù)廣告的算法，其屮，匹配算法基于以本體概念形式組織的輸入輸出的相似度，拓展了木體應(yīng)用的商業(yè)價(jià)值。服務(wù)的質(zhì)量評價(jià)過程為：首先，第

20、三方組織以本體值的方式分發(fā)分值表; 其次，通過服務(wù)的被檢索情況評分，主要通過檢索匹配算法算出基于消費(fèi)者喜好的服務(wù)質(zhì)量的排名信息。通過這種服務(wù)質(zhì)量評價(jià)，消費(fèi)者可以精確定位出需求服務(wù)：即大多數(shù)消費(fèi)者喜好的服務(wù)。語義網(wǎng)可以實(shí)現(xiàn)特定領(lǐng)域信息的有序組織、存儲(chǔ)和檢索，而本體通過對共同認(rèn)可的概念、概念與概念之間關(guān)系的精確定義，支持語義層次上信息共亭和交換，改進(jìn)了特定領(lǐng)域的網(wǎng) 服務(wù)。移動(dòng)通信服務(wù)屮基于本體的語義網(wǎng)服務(wù)架構(gòu)，以提供創(chuàng)新型移動(dòng)服務(wù)。該木體使用0 wl進(jìn)行咅樂信息的情境描述，定義分類體系和分類規(guī)則，在咅樂資源和相應(yīng)的咅樂類型之間捕捉音樂流派、界定多成員z間的關(guān)系，從而支持基于情境和基于近鄰的

21、音樂資源搜索。借用企業(yè)治理架構(gòu)中的領(lǐng)域本體，分析公共行政服務(wù)領(lǐng)域的概念映射情況。frederico探討了從地緣現(xiàn)實(shí)到推導(dǎo)性本體下的地理空間語義網(wǎng)絡(luò)的發(fā)展方向。醫(yī)學(xué)領(lǐng)域?qū)颊卟v、同一病種的不同療法等資料的共亨要求高，對于標(biāo)準(zhǔn)化、智能化的語義網(wǎng)絡(luò)需求強(qiáng)烈。通過對醫(yī) 務(wù)志愿者的調(diào)查采訪，驗(yàn)證語義網(wǎng)本體下的電子健康記錄作為脊骨治療方法具有高可行性, 創(chuàng)建了名為chiro的本體系統(tǒng),供使用脊椎指壓治療法和脊椎對抗療法的醫(yī)生共亨患者信息。語義網(wǎng)絡(luò)框架下的本體驅(qū)動(dòng)型臨床實(shí)踐指南的創(chuàng)建和執(zhí)行，通過引入一個(gè)領(lǐng)域本體、一個(gè)病人本體、一個(gè)決策規(guī)則和一個(gè)規(guī)則執(zhí)行引擎，采用本體驅(qū)動(dòng)的語義網(wǎng)方式構(gòu)建電子化的c

22、pg 和臨床決策支持系統(tǒng)，它系統(tǒng)構(gòu)建分為4步：（1 ）定義臨床實(shí)踐指南的本體，以本體化顯示指引元素模型編碼的臨床實(shí)踐指南.本體定義基于指引元素模型中的文檔類型定義；（2 ）開發(fā)cpg決策邏輯定義工具，定義cpg的語法規(guī)則。（3 ）開發(fā)cpg執(zhí)行引擎，通過jena 推理系統(tǒng)執(zhí)行cpg的邏輯規(guī)則。(4 )實(shí)施自動(dòng)化決策樹生成模型，提供解決方案的推理過程跟蹤，以協(xié)助醫(yī)生理解所提出的建議。實(shí)際應(yīng)用屮，給定一個(gè)病人實(shí)例，cdss系統(tǒng)即可給出相關(guān)臨床建議?？傮w來說，本體在語義網(wǎng)中的應(yīng)用研究已具有一定的廣度和深度，從自動(dòng)化、智能化木體構(gòu)建，拓展到本體功能系統(tǒng)的完善，開發(fā)思想也開始強(qiáng)調(diào)用戶的個(gè)性化需

23、求，語義網(wǎng)本體的應(yīng)用領(lǐng)域研究進(jìn)一步拓展。研究方法上，算法開發(fā)、模型構(gòu)建占主流，少數(shù)研究采用了用戶訪談法，定量化分析方法應(yīng)用不多，說明本體在語義網(wǎng)屮的應(yīng)用研究尚未達(dá)到成熟階段，在研允方法和研允內(nèi)容上均有較大提升空間。3、本體發(fā)展趨勢隨著語義網(wǎng)(seman(icweb)的不斷發(fā)展，及其本體(ontology)技術(shù)的不斷完善，語義網(wǎng)本體在知識管理、搜索異構(gòu)系統(tǒng)集成、自然語言理解、知識工程、信息抽取與檢索等方面有廣泛的應(yīng)用。特別在知識管理方面，w3c制定的資源描述框架(rdf)和web本體語言(owl)等語義網(wǎng)本體描述語言標(biāo)準(zhǔn)，特別適合解決生命科學(xué)、醫(yī)療衛(wèi)生、地理信息系統(tǒng)、電子政務(wù)、電子

24、商務(wù)等各個(gè)領(lǐng)域等知識組織、知識檢索、知識推理等問題。目前，本體在發(fā)展方向上主要有兩個(gè)發(fā)展趨勢：輕量級(light-weight)知識管理，和重量級(heavy-weight)知識管理。3. 1輕量級(light-weight)知識管理輕暈級知識管理流派以w3c聯(lián)盟的語義網(wǎng)部署工作組(semantic web deployment working group)為首，提出語義網(wǎng)的實(shí)現(xiàn)需要建立在海量知識庫以及輕量級本體基礎(chǔ)之上。所謂輕量級本體指的主要是指基于rdf等簡單知識描述框架的知識庫。此流派認(rèn)為目前制約語義網(wǎng)實(shí)現(xiàn)的主要問題在于如何在現(xiàn)有internet上整合海量語義本體知識，使得inte

25、rnet 上所有網(wǎng)站及其網(wǎng)頁以語義標(biāo)注等方式提供機(jī)器可理解的機(jī)制。這種海量語義本體知識庫需要海量的普通用戶(如網(wǎng)站設(shè)計(jì)者，網(wǎng)頁瀏覽者)參與建立，或者從遺留數(shù)據(jù)(legacy database)庫中提煉抽取。但是如果知識描述框架過于復(fù)雜，或者建立知識的用戶接口過于復(fù)雜，普通用戶就很難快速便捷建立知識，也很難建立知識自動(dòng)提取的機(jī)制。目前internet 上的rdf/owl本體數(shù)據(jù)有30億海量三元組(triples),但是97%以上是輕量級rdf,復(fù)朵的owl本體庫只占很少一部分。輕量級知識管理流派研究的重點(diǎn)，一方面是提岀輕量級知識描述框架，例如：語義網(wǎng)部署工作組于2008年提出的rdfa就

26、是典型的簡單知識描述框架，它是rdf針對xhtml應(yīng)用的簡化。另方面是借鑒web2.0研究成果，探討便捷的知識管理用戶接口，例如：語義網(wǎng)教育和科研興趣組(semantic web education and outreach interest group)語義維基(semantic wiki),聯(lián)合開放數(shù)據(jù)集(linking open data),以及語義社會(huì)網(wǎng)絡(luò)(semantic social network)等相關(guān)研究?？倆,此流派側(cè)重語義網(wǎng)的網(wǎng)(web) 的部分，旨在以用戶為核心的輕量級本體推動(dòng)語義網(wǎng)應(yīng)用。3.2輕量級(light-weight)知識管理重量級知識管理流派以w3c聯(lián)

27、盟的owl工作組(owl working group)和規(guī)則互操作格式工作組(rules interchange format working gro叩)為首，另外w3c聯(lián)盟的語義網(wǎng)興趣工作組(semantic web interest group)也有相關(guān)研究。此流派認(rèn)為由于語義網(wǎng)是跨各個(gè)領(lǐng) 域的應(yīng)用集成，所以必須提供較高級和復(fù)雜的語義知識描述框架，用以滿足各個(gè)領(lǐng)域知識的知識描述、知識組織和知識推理等需求。例如，owl工作組的前身，web本體工作組(web ontology working gro叩)致力丁基丁描述邏輯(description logics)的 owl1.0 本體描述

28、語言的制定。在2004年owl1.0標(biāo)準(zhǔn)制定完成z后3年，owl工作組于2007年成立，根據(jù) 這幾年領(lǐng)域知識描述及其應(yīng)用的需求變化，繼續(xù)修訂和擴(kuò)展owl本體描述語言，冃前正在起草owl2.0版本?；ゲ僮鞲袷焦ぷ鹘M的部分參與者于2004年提交了語義網(wǎng)規(guī)則語言(swrl)標(biāo)準(zhǔn)，將owl與規(guī)則標(biāo)記語言(ruleml)進(jìn)行整合，進(jìn)一步增強(qiáng)owl的語義推理能力。此外，語義網(wǎng)興趣工作組于2004年提出的具名圖(named graphs)技術(shù)方案，也是對rdf三元組在知識粒度管理方面的擴(kuò)展?？倆,此流派側(cè)重語義網(wǎng)的語義(semantic) 部分，旨在提供更為強(qiáng)大的語義知識描述框架為各個(gè)領(lǐng)域的各種復(fù)雜

29、知識提供管理服務(wù)。4結(jié)束語隨著w3c聯(lián)盟在語義網(wǎng)平臺(tái)標(biāo)準(zhǔn)化方面研究的不斷深入，語義網(wǎng)技術(shù)平臺(tái)日趨成熟和完善。不論是輕暈級還是重量級的語義網(wǎng)技術(shù)發(fā)展趨勢，本體在其屮都起著至關(guān)重要的作用。雖然本體技術(shù)的成熟還需要一定時(shí)間，但是基于本體的語義網(wǎng)技術(shù)平臺(tái)有著廣闊的發(fā)展前景。本體應(yīng)用涉及及的領(lǐng)域本體，包括化學(xué)領(lǐng)域、生物領(lǐng)域、地理學(xué)領(lǐng)域和其他領(lǐng)域，本文對其中有代表性的領(lǐng)域本體并對其應(yīng)用及進(jìn)展進(jìn)行分析研允，總結(jié)出領(lǐng)域本體應(yīng)用進(jìn)展的特點(diǎn):涉及學(xué)科領(lǐng)域廣；更加專業(yè)化、針對性更強(qiáng)；涉及多個(gè)學(xué)科的領(lǐng)域本體增多。本體的建設(shè)發(fā)展將有力推動(dòng)數(shù)字圖書館的進(jìn)步?！緟⒖嘉墨I(xiàn)】 max volkel , markus

30、 krotzsch , denny vrandecic , heiko haller , rudi studer. semantic wikipedia c. proceedings of the 15th international conference on world wide web, edinburgh, scotland, may 23-26, 2006. new york: acm, 2006: 585-594.2 p. mika. ontologies are us: a unified model of social networks and semantics cj. is

31、wcr05: proc, of the 4th int. semantic web conference. berlin: springer springer lncs, 3729, 2005. owl working group ql. 2009-02-10. /2007/owl/wiki/ owl_working_group.4 rule interchange format (rif) working group ol.2009-02-10./2005/rules/wiki/rif_working_group. semant

32、ic web interest group olj. 2009-02-10. /2001/sw/interest/. web-ontology (webont) working group ol.2009-02-10./2001 /sw/webont/.7 franz baader , diego calvanese , deborah l. mcguinness , daniele nardi , peter f. patel-schneider. the description logic handbook: theory,

33、implementation, and applications m. new york: cambridge university press, 2003.8 owl 2 web ontology language:profiles fol. 2009-02-10./tr/2008/wd-owl2-profiles-20081202/. swrl: a semantic web rule language combining owl and ruleml ol. 2009-02-10. /submission/swrla10 the rule markup initiative ol. 2009-02-10. /.11 j. carroll, c. bizer, p. hayes, p. stickler. named graphs, provenance and trust r. palo alto: hp labs, 2004.!2cycorp, inc ol. 2009-02-10. 13 jiang ying, dong hui. towards ontology-based chinese e-government dig

人人文庫> 全部分類> 生活休閑 > 科普知識

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

試論本體的應(yīng)用及其發(fā)展

文檔簡介

溫馨提示

最新文檔

評論

試論本體的應(yīng)用及其發(fā)展

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔