




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、試論本體應(yīng)用及其發(fā)展【摘要】本文首先介紹了本體的概念,然后對本體的應(yīng)用情況做了分析:本體應(yīng)用研究主要集屮 于本體在信息檢索、信息抽取、異構(gòu)信息系統(tǒng)的互操作和集成、語義web四個(gè)領(lǐng)域的應(yīng)用, 并表現(xiàn)出以下特點(diǎn):本體在信息檢索、信息抽取、異構(gòu)信息系統(tǒng)的互操作和集成3個(gè)領(lǐng)域的 應(yīng)用研究以方法論探索為中心,研究方法以算法、建模和系統(tǒng)架構(gòu)為主。最后,本文對本體 的發(fā)展趨勢進(jìn)行了總結(jié)?!娟P(guān)鍵字】本體;語義網(wǎng);本體應(yīng)用;本體發(fā)展趨勢1本體的概念古希臘百科全書式的思想家亞里士多德(前384前322年)首先把哲學(xué)規(guī)定為關(guān)于“本 體”之學(xué),西方哲學(xué)中近代德國哲學(xué)家沃爾夫(christian wolff, 1679
2、-1754)第一次提 出“本體”(ontology),黑格爾(17701831)曾轉(zhuǎn)述過它的定義:“本體,論述各種有關(guān) '存在'的、抽象的、完全普遍的哲學(xué)范疇,認(rèn)為存在是唯一的、完善的;其中出現(xiàn)了唯一 者、偶性、實(shí)體、因果諸范疇;這是抽象的形而上學(xué)。根據(jù)韋氏詞典的解釋,本體是形而上 學(xué)的一個(gè)分支,研究關(guān)于自然和存在的關(guān)系。它試圖冋答“什么是存在”,“存在的性質(zhì)是什 么”等等。在哲學(xué)界,本體作為表述哲學(xué)理論的術(shù)語,是指形成現(xiàn)象的根本實(shí)體。20世紀(jì)末,隨著計(jì)算機(jī)技術(shù)的發(fā)展,本體被引入到信息學(xué)和人工智能領(lǐng)域。信息學(xué)和 人工智能中所指的本體,從概念上劃分,可以有兩種理解:本體和狹義本體
3、。本體的定義,它在計(jì)算機(jī)學(xué)界的定義和內(nèi)涵經(jīng)歷了一系列的發(fā)展過程: 1991年,neches指出:“一個(gè)本體定義了組成主題領(lǐng)域的詞匯的基本術(shù)語和關(guān)系, 以及用于組合術(shù)語和關(guān)系以定義詞匯的外延的規(guī)則。” 該定義只是給出了建立一個(gè)本體的 基本要素,即:要建立一個(gè)本體,首先要識別所處理領(lǐng)域的基本術(shù)語和這些術(shù)語之間的關(guān)系, 而后識別組合這些術(shù)語和關(guān)系的規(guī)則,并提供這些術(shù)語和關(guān)系的定義。 1993年,gruber指出:"本體是概念化(conceptualization)的一個(gè)顯式的規(guī)格 說明?!?;1997年,borst對該定義進(jìn)行了修改,提出:“本體是被共享的概念化的一個(gè)顯 式的規(guī)格說明。”。
4、概念化(conceptualization)指某一概念系統(tǒng)所蘊(yùn)涵的語義結(jié)構(gòu),它 是對某一事實(shí)結(jié)構(gòu)的一組非正式的約束規(guī)則。它可以理解或表達(dá)為一組概念(如實(shí)體、屬性、 過程)及其定義和相互關(guān)系。概念化的清楚的詳細(xì)說明是指:一個(gè)本體是対概念和關(guān)系的描 述(就像程序的詳細(xì)說明書),而這些概念和關(guān)系可能是針對一個(gè)代理或代理群體而存在的。 這兩個(gè)定義后來成為人們經(jīng)常引用的定義,它們都特別強(qiáng)調(diào)了給出顯式解釋的可能性。 1999年,w訂liam和austin指出:"本體是用于描述或表達(dá)某一領(lǐng)域知識的一組 概念或術(shù)語,可用于組織知識庫較髙層次的知識抽象,也可用來描述特定領(lǐng)域的知識”。 這種術(shù)語詞匯表可
5、以應(yīng)用于特定領(lǐng)域或者主題。本體不僅僅是詞匯表,而是整個(gè)上層知識庫(包插用于描述這個(gè)知識庫的詞匯)。它把本體看作知識的內(nèi)主體,而不是描述知識的途徑。 1999年,chandrasekaran等人認(rèn)為:“本體是屬于人工智能領(lǐng)域中的內(nèi)容理論, 它研究特定領(lǐng)域知識的對象分類、對象屬性和對象間的關(guān)系,為領(lǐng)域知識的描述提供術(shù) 語?!?o在以上不同研究者的定義中,gruber的觀點(diǎn)是學(xué)術(shù)界普遍認(rèn)可、引用度最高的一種定 義。其實(shí)從以上不同研究者的定義,也可以總結(jié)本體涉及到的概念為:術(shù)語(詞匯)、術(shù)語 關(guān)系、規(guī)則、概念化、形式化的規(guī)格說明、領(lǐng)域知識、表達(dá)和共亨。其實(shí),本體就是指通過 對于概念、術(shù)語及其相互關(guān)系的
6、規(guī)范化描述,勾畫出某一領(lǐng)域的基本知識體系和描述語言。 一個(gè)概念化對象就是對世界的一些抽象且簡明化的觀點(diǎn)。概念化對象可由部分表示領(lǐng)域,該 領(lǐng)域屮相關(guān)事物狀態(tài)的集合和領(lǐng)域空間上的概念關(guān)系。也就是說,本體是對客觀世界全部或 某一部分的概念化和結(jié)構(gòu)化的明確表示和描述。2木體的應(yīng)用隨著互聯(lián)網(wǎng)應(yīng)用逐漸向智能化和口動(dòng)化方向發(fā)展,本體作為概念模型和概念間關(guān)系的規(guī) 范描述,被廣泛應(yīng)用于信息系統(tǒng)和下一代互聯(lián)網(wǎng)語義網(wǎng)領(lǐng)域。本體在信息系統(tǒng)領(lǐng)域的應(yīng)用, 主要集中在信息檢索、信息抽取、異構(gòu)信息、系統(tǒng)的互操作和集成,為其提供語義層的操作 支持;木體作為一種能在知識層提供知識共享、重用的工具,在語義網(wǎng)屮的應(yīng)用研究也較為 普遍
7、。2. 1本體在信息檢索中的應(yīng)用目前,國外對本體在信息檢索領(lǐng)域的應(yīng)用的研究較多,不少研究利用單個(gè)領(lǐng)域本體來 改善特定學(xué)科領(lǐng)域的信息檢索效果。休斯頓大學(xué)提出一種基于用戶詢問的文本摘要技術(shù)來改 善醫(yī)學(xué)信息檢索效果。他們選擇美國國家醫(yī)學(xué)圖書館開發(fā)的umls (一體化醫(yī)學(xué)語言系統(tǒng)) 作為其主要的醫(yī)學(xué)本體知識庫,umls能幫助醫(yī)學(xué)信息系統(tǒng)理解生物醫(yī)學(xué)和健康領(lǐng)域的概念 和術(shù)語的內(nèi)涵以及相互z間的關(guān)系。首先,研究人員選取數(shù)個(gè)在線醫(yī)學(xué)數(shù)據(jù)庫作為醫(yī)學(xué)資源 信息來源,并通過網(wǎng)絡(luò)爬蟲從所選取的數(shù)據(jù)庫中抽取文檔并保存在本地文檔庫中,利用umls 對本地文檔進(jìn)行數(shù)據(jù)清洗,生成新的文檔摘要,建立基于概念的文檔索引;其次,
8、利用umls 對用戶輸入的關(guān)鍵詞進(jìn)行關(guān)鍵詞擴(kuò)展,增加縮寫關(guān)鍵詞、語義相近或相關(guān)的醫(yī)學(xué)術(shù)語等,刪 除冗余關(guān)鍵詞,并反饋給用戶,由用戶最后決定;最后,根據(jù)用戶最終確定的擴(kuò)展關(guān)鍵詞對 本地文檔庫的文檔摘要進(jìn)行語義匹配度運(yùn)算,檢索結(jié)果按相關(guān)度高低排列返回給用戶。此外,也有研究采用多本體整合的方式提高信息檢索性能。aijun dong提出一個(gè)基于 多本體的多媒體注解模型,通過對領(lǐng)域無關(guān)的多媒體本體與領(lǐng)域本體進(jìn)行整合,實(shí)現(xiàn)從多個(gè) 特定領(lǐng)域角度對多媒體內(nèi)容進(jìn)行描述,從而使得用戶能更好地表達(dá)其對不同多媒體信息的需 求。研究者基于多媒體內(nèi)容描述工具mpeg-7 (活動(dòng)圖象專家組)開發(fā)一個(gè)多媒體本體,提 出一個(gè)整
9、合多領(lǐng)域本體的策略,設(shè)計(jì)一個(gè)術(shù)語抽取程序來自動(dòng)從多媒體數(shù)據(jù)的文木資源屮抽 取特定領(lǐng)域的本體術(shù)語。初步實(shí)驗(yàn)表明,基于多本體的多媒體注解可以更好地滿足不同用戶 的信息需求。高質(zhì)量的本體知識是提高信息檢索和管理質(zhì)量的關(guān)鍵因素。多數(shù)研究都是選擇現(xiàn)成的領(lǐng) 域本體作為其本體知識庫。本體在信息檢索中的應(yīng)用主要在以下兩個(gè)環(huán)節(jié):一是根據(jù)木體對 被檢索的信息資源進(jìn)行文檔預(yù)處理,包扌舌語義標(biāo)注與建立基于概念的文檔索引;二是系統(tǒng) 借助本體知識庫分析用戶查詢中所包含的術(shù)語含義,準(zhǔn)確理解用戶的查詢,從而提高信息檢 索系統(tǒng)的查全率和查準(zhǔn)率。在用戶檢索過程屮,系統(tǒng)可為用戶提供語義提示,如進(jìn)行關(guān)鍵詞 擴(kuò)展、去除冗余關(guān)鍵詞,并反
10、饋給用戶由其選擇,使用戶更精準(zhǔn)地描述自身的信息需求,與 用戶建立良好的互動(dòng)關(guān)系。2. 2本體在信息抽取領(lǐng)域的應(yīng)用研究基于本體的信息抽取技術(shù)是一種把本體和信息處理技術(shù)結(jié)合起來實(shí)現(xiàn)信息抽取的技術(shù), 它是現(xiàn)在信息抽取研允的一個(gè)熱點(diǎn),己經(jīng)有了很多研允。傳統(tǒng)的信息抽取雖然能抽取出實(shí)體, 但是缺乏領(lǐng)域知識來識別抽取實(shí)體之間的關(guān)系。因此,在信息抽取任務(wù)中引入相應(yīng)的領(lǐng)域 知識一一領(lǐng)域本體來指導(dǎo)抽取過程,將能有效地提高信息抽取的性能。近兩年在自由文本信息抽取研究中,主要的研究方法可分為以下兩種:知識工程方法和 機(jī)器學(xué)習(xí)方法。知識工程方法是指由專家對本體進(jìn)行分析、調(diào)整而人工制定規(guī)則、模板。美 國德雷塞爾大學(xué)zho
11、u xiaohua等研究者開發(fā)了一個(gè)名為medic (醫(yī)學(xué)信息抽取的系統(tǒng),h 的是從大規(guī)模自由文本臨床記錄中抽取和挖掘出大量患乳腺疾病的病人信息。信息抽取工作 共分3步:(1 )采用基于本體的方法進(jìn)行醫(yī)學(xué)術(shù)語抽取,使用言語模式生成候選術(shù)語,并 確認(rèn)是否在本體庫中存在,為了彌補(bǔ)本體庫的不完整性,人工補(bǔ)充其他語義相似的術(shù)語;(2 ) 最主要的環(huán)節(jié),進(jìn)行關(guān)系抽取,人工建立抽取規(guī)則,利用連接語法解析器對句子進(jìn)行解析, 解析結(jié)果以圖表形式顯示,有著較高精確率;(3 )文本分類,采用基于自然語言處理的特 征抽取技術(shù)與id3決策樹(id3決策樹算法是數(shù)據(jù)挖掘屮常用的一科方法)相結(jié)合的方法。 雖然該研究在試驗(yàn)
12、中取得較高的準(zhǔn)確率和召回率,但它的實(shí)驗(yàn)樣本規(guī)模較小,只有125條 臨床記錄。當(dāng)系統(tǒng)面臨處理大規(guī)模且又多樣化書寫模式的臨床病例記錄時(shí),它的信息抽取性 能很可能降低。chyan等開發(fā)了 itsies系統(tǒng)(信息技術(shù)產(chǎn)品規(guī)格抽取系統(tǒng)),融合了自然 語言處理技術(shù)和本體概念。研允者首先隨機(jī)選取有關(guān)ibm和hp數(shù)個(gè)it產(chǎn)品的34個(gè)網(wǎng)頁 作為文檔庫;使用annie (基于規(guī)則方法的英文信息抽取系統(tǒng))對網(wǎng)頁文檔進(jìn)行分詞,此 外,annie的默認(rèn)功能可以識別出有關(guān)如地址、日期等的信息;在j ape (標(biāo)注模式引擎) 屮人工建立語法規(guī)則,對信息實(shí)體進(jìn)行標(biāo)注;基于it產(chǎn)品特征對概念及其關(guān)系進(jìn)行描述, 最終構(gòu)建成it產(chǎn)
13、品規(guī)格本體。itsies系統(tǒng)在對其它品牌的it產(chǎn)品。知識工程方法主要依靠人工編制規(guī)則來建立領(lǐng)域本體知識庫,需要學(xué)科領(lǐng)域?qū)<业膮?與,開發(fā)過程較慢,其優(yōu)點(diǎn)是不需要對本體知識庫進(jìn)行經(jīng)常性更改,抽取效率較高,但由于 其對該領(lǐng)域以后出現(xiàn)新的概念或關(guān)系無法及時(shí)發(fā)現(xiàn),一旦發(fā)生這種悄況,信息抽取的召回率 會(huì)降低。在國外,近兒年機(jī)器學(xué)習(xí)方法在信息抽取領(lǐng)域的應(yīng)用研究受到廣泛的關(guān)注,它主要 通過學(xué)習(xí)己經(jīng)標(biāo)記好的語料庫獲取規(guī)則,無需投入大量人力。這種方法比知識工程方法快, 但需要足夠數(shù)量的訓(xùn)練文檔,才能保證其信息抽取的效率。2. 3本體在異構(gòu)信息系統(tǒng)互操作和集成領(lǐng)域的應(yīng)用研究分布式網(wǎng)絡(luò)環(huán)境下,無論是數(shù)字圖書館等學(xué)術(shù)
14、應(yīng)用系統(tǒng),還是企業(yè)的商用信息系統(tǒng),一 定程度上都面臨著系統(tǒng)異構(gòu)、語法異構(gòu)、模式異構(gòu)和語義異構(gòu)4個(gè)層面的異構(gòu)問題。本體作 為概念模型的明確的規(guī)范說明,正在成為解決異構(gòu)系統(tǒng)互操作和集成問題的基礎(chǔ)解決方案。 近兩年,國外學(xué)者關(guān)于應(yīng)用本體解決信息系統(tǒng)異構(gòu)問題的研究主要圍繞方法層面:探尋基于 本體的有效方法,解決特定領(lǐng)域的異構(gòu)問題。所采用的方法主要為本體與代理結(jié)合的方法、 本體間映射方法。對基于本體的領(lǐng)域知識和本地信息資源之間的互操作和集成問題,研究者主要通過本體 間的映射方法來分析解決。park分析提岀了電子商務(wù)環(huán)境下,異構(gòu)的產(chǎn)品分類目錄間的本 體映射方法。由于嚴(yán)格的映射策略可能會(huì)導(dǎo)致客戶的查詢失敗,
15、文章提供了一個(gè)映射算法, 確保在合理的損失精度下,增加查詢結(jié)果中的產(chǎn)品組合。通過與本體映射算法prompt的 比較實(shí)驗(yàn),此算法的平均查詢結(jié)果數(shù)高于prompt的46.5%,平均精度比prompt差 13.6%,成功地實(shí)現(xiàn)了查詢結(jié)果的顯著提高與精確度的合理降低。基于本體的異構(gòu)信息查詢 屮,分解和重構(gòu)一個(gè)木體概念實(shí)例的通用查詢,以形成多個(gè)基于本地信息源的子查詢,是一 項(xiàng)基礎(chǔ)性挑戰(zhàn)。lijian開發(fā)了一套基于本體的異構(gòu)信息集成的查詢分工和重構(gòu)方案,主要采 用基于映射的查詢分解和集成。其屮,通用本體被用來描述用戶感興趣的領(lǐng)域知識,用戶通 過查詢通用本體獲得本體概念的實(shí)例。該方法分為3步:(1)提供一種
16、統(tǒng)一的概念實(shí)例來 表述查詢。假設(shè)查詢結(jié)果是一個(gè)元組集合,定義了一系列基于元組的操作,因此查詢可以表 述為對于元組集合的各種操作。(2 )將通用查詢分解為多個(gè)本地查詢的方法,分解基于映 射。此方法基于兩個(gè)假設(shè):首先,通用映射由兩個(gè)本地映射組成,以集成兩個(gè)本地信息資源; 其次,市多個(gè)本地映射組成的通用映射的查詢分解,可以通過前面假設(shè)的二元結(jié)構(gòu)的多次過 程迭代實(shí)現(xiàn)?;诖?,查詢將通過對應(yīng)的映射實(shí)現(xiàn),研究人員提供了一種將通用映射下的通 用查詢分解為本地映射下的多個(gè)子查詢的算法。子查詢對應(yīng)于元組集合的各種操作,其操作 結(jié)果的集合為對應(yīng)的通用查詢結(jié)果。(3 )本地的查詢結(jié)果被集成為通用查詢的結(jié)果。集成 的
17、主要工作是組合分解了的元組的各種操作結(jié)果。2. 4本體在語義網(wǎng)中的應(yīng)用研究語義網(wǎng)的提出源于如何為網(wǎng)上的資源提供計(jì)算機(jī)可以理解的內(nèi)容。本體作為共同標(biāo)準(zhǔn)的 概念體系,支持簡單推理,促進(jìn)計(jì)算機(jī)相互理解和互操作,本體的應(yīng)用可有效促進(jìn)語義網(wǎng)的 性能。近兩年,研究者在語義網(wǎng)中的本體開發(fā)研究集中于引入多種方法,提高對不確定和 非精確信息的表示能力,促進(jìn)半自動(dòng)化、自動(dòng)化本體生成和本體演化,以提供智能化的語義 網(wǎng)服務(wù)?,F(xiàn)有的少量本體不足以滿足海量信息和語義網(wǎng)成長的需要,口組織特征映射方法, 從自動(dòng)抓取的網(wǎng)頁文檔中做出知識地圖;在知識地圖中,識別出本體的組成部分,將其組織 成實(shí)體、關(guān)系和功能3部分,服務(wù)于語義網(wǎng)軟
18、件代理的動(dòng)態(tài)智能操作。關(guān)于木體演化和木體 再造可動(dòng)態(tài)改進(jìn)本體,研究者在其可行性和一致性方面給予了關(guān)注.在語義網(wǎng)中,應(yīng)用基于 推理的網(wǎng)絡(luò)本體后,在查全率和正確率上髙于基于注解的本體應(yīng)用;將信念修止理論整合進(jìn) 入本體再造方法,可確保本體修正的一致性。本體在海量復(fù)雜信息資源組織表示上的便利性和可靠性,首先基于高效的本體登記。 wang pchong分析提出了本體登記的互操作元模型框架方案,提供了一個(gè)基于信息系統(tǒng)和本 體之間的語義層互操作的共同框架,以登記本體及其演化信息。本體清洗可在知識庫中發(fā)現(xiàn) 并修正本體和數(shù)據(jù)源屮的異常。從清洗代理設(shè)計(jì)的角度出發(fā),指出在面臨知識庫完整性、連 續(xù)性和正確性的不確定情
19、況下,只有基于可鑒定的推理過程才能獲得邏輯可信的清洗。有效 的本體映射可以更好地理解用戶需求。不同于以往的擴(kuò)展用戶查詢詞的問答系統(tǒng),該木體的 處理過程為:用戶輸入口然語言查詢詞,采用關(guān)系相似性服務(wù)組件將自然語言查詢詞轉(zhuǎn)換成 本體作為系統(tǒng)輸入,返回的答案來自一個(gè)或多個(gè)知識庫,實(shí)現(xiàn)不同的答案策略的組合?;?本體的代理人社區(qū)的做法,通過動(dòng)態(tài)生成通用本體,為信息集成系統(tǒng)演示了一種靈活和動(dòng)態(tài) 的方法來融合異構(gòu)數(shù)據(jù)源,以最大限度地進(jìn)行信息共亨。匹配語義網(wǎng)絡(luò)服務(wù)請求與語義網(wǎng)絡(luò) 服務(wù)廣告的算法,其屮,匹配算法基于以本體概念形式組織的輸入輸出的相似度,拓展了木 體應(yīng)用的商業(yè)價(jià)值。服務(wù)的質(zhì)量評價(jià)過程為:首先,第
20、三方組織以本體值的方式分發(fā)分值表; 其次,通過服務(wù)的被檢索情況評分,主要通過檢索匹配算法算出基于消費(fèi)者喜好的服務(wù)質(zhì)量 的排名信息。通過這種服務(wù)質(zhì)量評價(jià),消費(fèi)者可以精確定位出需求服務(wù):即大多數(shù)消費(fèi)者喜 好的服務(wù)。語義網(wǎng)可以實(shí)現(xiàn)特定領(lǐng)域信息的有序組織、存儲(chǔ)和檢索,而本體通過對共同認(rèn)可的概念、 概念與概念之間關(guān)系的精確定義,支持語義層次上信息共亭和交換,改進(jìn)了特定領(lǐng)域的網(wǎng) 服務(wù)。移動(dòng)通信服務(wù)屮基于本體的語義網(wǎng)服務(wù)架構(gòu),以提供創(chuàng)新型移動(dòng)服務(wù)。該木體使用0 wl進(jìn)行咅樂信息的情境描述,定義分類體系和分類規(guī)則,在咅樂資源和相應(yīng)的咅樂類型之 間捕捉音樂流派、界定多成員z間的關(guān)系,從而支持基于情境和基于近鄰的
21、音樂資源搜索。 借用企業(yè)治理架構(gòu)中的領(lǐng)域本體,分析公共行政服務(wù)領(lǐng)域的概念映射情況。frederico探討 了從地緣現(xiàn)實(shí)到推導(dǎo)性本體下的地理空間語義網(wǎng)絡(luò)的發(fā)展方向。醫(yī)學(xué)領(lǐng)域?qū)颊卟v、同一 病種的不同療法等資料的共亨要求高,對于標(biāo)準(zhǔn)化、智能化的語義網(wǎng)絡(luò)需求強(qiáng)烈。通過對醫(yī) 務(wù)志愿者的調(diào)查采訪,驗(yàn)證語義網(wǎng)本體下的電子健康記錄作為脊骨治療方法具有高可行性, 創(chuàng)建了名為chiro的本體系統(tǒng),供使用脊椎指壓治療法和脊椎對抗療法的醫(yī)生共亨患者信息。 語義網(wǎng)絡(luò)框架下的本體驅(qū)動(dòng)型臨床實(shí)踐指南的創(chuàng)建和執(zhí)行,通過引入一個(gè)領(lǐng)域本體、一個(gè)病 人本體、一個(gè)決策規(guī)則和一個(gè)規(guī)則執(zhí)行引擎,采用本體驅(qū)動(dòng)的語義網(wǎng)方式構(gòu)建電子化的c
22、pg 和臨床決策支持系統(tǒng),它系統(tǒng)構(gòu)建分為4步:(1 )定義臨床實(shí)踐指南的本體,以本體化顯 示指引元素模型編碼的臨床實(shí)踐指南.本體定義基于指引元素模型中的文檔類型定義;(2 ) 開發(fā)cpg決策邏輯定義工具,定義cpg的語法規(guī)則。(3 )開發(fā)cpg執(zhí)行引擎,通過jena 推理系統(tǒng)執(zhí)行cpg的邏輯規(guī)則。(4 )實(shí)施自動(dòng)化決策樹生成模型,提供解決方案的推理過 程跟蹤,以協(xié)助醫(yī)生理解所提出的建議。實(shí)際應(yīng)用屮,給定一個(gè)病人實(shí)例,cdss系統(tǒng)即可 給出相關(guān)臨床建議??傮w來說,本體在語義網(wǎng)中的應(yīng)用研究已具有一定的廣度和深度,從自 動(dòng)化、智能化木體構(gòu)建,拓展到本體功能系統(tǒng)的完善,開發(fā)思想也開始強(qiáng)調(diào)用戶的個(gè)性化需
23、 求,語義網(wǎng)本體的應(yīng)用領(lǐng)域研究進(jìn)一步拓展。研究方法上,算法開發(fā)、模型構(gòu)建占主流,少 數(shù)研究采用了用戶訪談法,定量化分析方法應(yīng)用不多,說明本體在語義網(wǎng)屮的應(yīng)用研究尚未 達(dá)到成熟階段,在研允方法和研允內(nèi)容上均有較大提升空間。3、本體發(fā)展趨勢隨著語義網(wǎng)(seman(icweb)的不斷發(fā)展,及其本體(ontology)技術(shù)的不斷完善,語 義網(wǎng)本體在知識管理、搜索異構(gòu)系統(tǒng)集成、自然語言理解、知識工程、信息抽取與檢索等方 面有廣泛的應(yīng)用。特別在知識管理方面,w3c制定的資源描述框架(rdf)和web本體語 言(owl)等語義網(wǎng)本體描述語言標(biāo)準(zhǔn),特別適合解決生命科學(xué)、醫(yī)療衛(wèi)生、地理信息系 統(tǒng)、電子政務(wù)、電子
24、商務(wù)等各個(gè)領(lǐng)域等知識組織、知識檢索、知識推理等問題。目前,本體在發(fā)展方向上主要有兩個(gè)發(fā)展趨勢:輕量級(light-weight)知識管理,和 重量級(heavy-weight)知識管理。3. 1輕量級(light-weight)知識管理輕暈級知識管理流派以w3c聯(lián)盟的語義網(wǎng)部署工作組(semantic web deployment working group)為首,提出語義網(wǎng)的實(shí)現(xiàn)需要建立在海量知識庫以及輕量級本體基礎(chǔ)之上。 所謂輕量級本體指的主要是指基于rdf等簡單知識描述框架的知識庫。此流派認(rèn)為目前制 約語義網(wǎng)實(shí)現(xiàn)的主要問題在于如何在現(xiàn)有internet上整合海量語義本體知識,使得inte
25、rnet 上所有網(wǎng)站及其網(wǎng)頁以語義標(biāo)注等方式提供機(jī)器可理解的機(jī)制。這種海量語義本體知識庫需 要海量的普通用戶(如網(wǎng)站設(shè)計(jì)者,網(wǎng)頁瀏覽者)參與建立,或者從遺留數(shù)據(jù)(legacy database)庫中提煉抽取。但是如果知識描述框架過于復(fù)雜,或者建立知識的用戶接口過于 復(fù)雜,普通用戶就很難快速便捷建立知識,也很難建立知識自動(dòng)提取的機(jī)制。目前internet 上的rdf/owl本體數(shù)據(jù)有30億海量三元組(triples),但是97%以上是輕量級rdf,復(fù)朵 的owl本體庫只占很少一部分。輕量級知識管理流派研究的重點(diǎn),一方面是提岀輕量級知 識描述框架,例如:語義網(wǎng)部署工作組于2008年提出的rdfa就
26、是典型的簡單知識描述框 架,它是rdf針對xhtml應(yīng)用的簡化。另方面是借鑒web2.0研究成果,探討便捷的知 識管理用戶接口,例如:語義網(wǎng)教育和科研興趣組(semantic web education and outreach interest group)語義維基(semantic wiki),聯(lián)合開放數(shù)據(jù)集(linking open data),以及語 義社會(huì)網(wǎng)絡(luò)(semantic social network)等相關(guān)研究??倆,此流派側(cè)重語義網(wǎng)的網(wǎng)(web) 的部分,旨在以用戶為核心的輕量級本體推動(dòng)語義網(wǎng)應(yīng)用。3.2輕量級(light-weight)知識管理重量級知識管理流派以w3c聯(lián)
27、盟的owl工作組(owl working group)和規(guī)則互操 作格式工作組(rules interchange format working gro叩)為首,另外w3c聯(lián)盟的語義網(wǎng)興 趣工作組(semantic web interest group)也有相關(guān)研究。此流派認(rèn)為由于語義網(wǎng)是跨各個(gè)領(lǐng) 域的應(yīng)用集成,所以必須提供較高級和復(fù)雜的語義知識描述框架,用以滿足各個(gè)領(lǐng)域知識的 知識描述、知識組織和知識推理等需求。例如,owl工作組的前身,web本體工作組(web ontology working gro叩)致力 丁基丁描述邏輯(description logics)的 owl1.0 本體描述
28、語 言的制定。在2004年owl1.0標(biāo)準(zhǔn)制定完成z后3年,owl工作組于2007年成立,根據(jù) 這幾年領(lǐng)域知識描述及其應(yīng)用的需求變化,繼續(xù)修訂和擴(kuò)展owl本體描述語言,冃前正在 起草owl2.0版本?;ゲ僮鞲袷焦ぷ鹘M的部分參與者于2004年提交了語義網(wǎng)規(guī)則語言(swrl)標(biāo)準(zhǔn),將owl與規(guī)則標(biāo)記語言(ruleml)進(jìn)行整合,進(jìn)一步增強(qiáng)owl的語義 推理能力。此外,語義網(wǎng)興趣工作組于2004年提出的具名圖(named graphs)技術(shù)方案, 也是對rdf三元組在知識粒度管理方面的擴(kuò)展??倆,此流派側(cè)重語義網(wǎng)的語義(semantic) 部分,旨在提供更為強(qiáng)大的語義知識描述框架為各個(gè)領(lǐng)域的各種復(fù)雜
29、知識提供管理服務(wù)。4結(jié)束語隨著w3c聯(lián)盟在語義網(wǎng)平臺(tái)標(biāo)準(zhǔn)化方面研究的不斷深入,語義網(wǎng)技術(shù)平臺(tái)日趨成熟和 完善。不論是輕暈級還是重量級的語義網(wǎng)技術(shù)發(fā)展趨勢,本體在其屮都起著至關(guān)重要的作用。 雖然本體技術(shù)的成熟還需要一定時(shí)間,但是基于本體的語義網(wǎng)技術(shù)平臺(tái)有著廣闊的發(fā)展前 景。本體應(yīng)用涉及及的領(lǐng)域本體,包括化學(xué)領(lǐng)域、生物領(lǐng)域、地理學(xué)領(lǐng)域和其他領(lǐng)域,本文 對其中有代表性的領(lǐng)域本體并對其應(yīng)用及進(jìn)展進(jìn)行分析研允,總結(jié)出領(lǐng)域本體應(yīng)用進(jìn)展的特 點(diǎn):涉及學(xué)科領(lǐng)域廣;更加專業(yè)化、針對性更強(qiáng);涉及多個(gè)學(xué)科的領(lǐng)域本體增多。本體的建 設(shè)發(fā)展將有力推動(dòng)數(shù)字圖書館的進(jìn)步?!緟⒖嘉墨I(xiàn)】 max volkel , markus
30、 krotzsch , denny vrandecic , heiko haller , rudi studer. semantic wikipedia c. proceedings of the 15th international conference on world wide web, edinburgh, scotland, may 23-26, 2006. new york: acm, 2006: 585-594.2 p. mika. ontologies are us: a unified model of social networks and semantics cj. is
31、wcr05: proc, of the 4th int. semantic web conference. berlin: springer springer lncs, 3729, 2005. owl working group ql. 2009-02-10. /2007/owl/wiki/ owl_working_group.4 rule interchange format (rif) working group ol.2009-02-10./2005/rules/wiki/rif_working_group. semant
32、ic web interest group olj. 2009-02-10. /2001/sw/interest/. web-ontology (webont) working group ol.2009-02-10./2001 /sw/webont/.7 franz baader , diego calvanese , deborah l. mcguinness , daniele nardi , peter f. patel-schneider. the description logic handbook: theory,
33、implementation, and applications m. new york: cambridge university press, 2003.8 owl 2 web ontology language:profiles fol. 2009-02-10./tr/2008/wd-owl2-profiles-20081202/. swrl: a semantic web rule language combining owl and ruleml ol. 2009-02-10. /submission/swrla10 the rule markup initiative ol. 2009-02-10. /.11 j. carroll, c. bizer, p. hayes, p. stickler. named graphs, provenance and trust r. palo alto: hp labs, 2004.!2cycorp, inc ol. 2009-02-10. 13 jiang ying, dong hui. towards ontology-based chinese e-government dig
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 系統(tǒng)電規(guī)劃方案(3篇)
- 兒童游樂設(shè)備管理制度
- 農(nóng)戶小額貸款管理制度
- 崗前檢查項(xiàng)目管理制度
- 醫(yī)院科室申報(bào)管理制度
- 養(yǎng)生療養(yǎng)基地管理制度
- DB62T 4390-2021 西瓜品種 金瑞5號
- 教室公寓改造方案(3篇)
- 火災(zāi)應(yīng)急預(yù)案演練方案桌面推演(3篇)
- 水災(zāi)監(jiān)測方案模板(3篇)
- 詳盡的施工方案
- DB3305T 323-2024政府儲(chǔ)備糧綠色倉儲(chǔ)技術(shù)規(guī)范
- 二級保密資格認(rèn)定辦法培訓(xùn)
- 門禁系統(tǒng)施工技術(shù)方案
- 小數(shù)計(jì)算六年級練習(xí)題
- 中國公民健康素養(yǎng)66條知識答題(試題及答案)
- 廣東省佛山市南海區(qū)桂城街道2023-2024學(xué)年四年級下學(xué)期期末英語試卷
- 高危妊娠及五色管理課件
- 2024項(xiàng)目投資協(xié)議書
- 保潔隊(duì)伍人員穩(wěn)定性措施
- 自動(dòng)控制原理 第3版 課件全套 陶洪峰 第1-8章 概論、控制系統(tǒng)數(shù)學(xué)模型-線性離散系統(tǒng)分析
評論
0/150
提交評論