




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐
導(dǎo)讀:知識圖譜相關(guān)技術(shù)在開發(fā)和應(yīng)用過程中,通
常需要跟行業(yè)或者業(yè)務(wù)領(lǐng)域進(jìn)行高度融合。但是在行業(yè)
知識圖譜構(gòu)建過程中,無法把傳統(tǒng)行業(yè)和IT部門或知
識圖譜團隊進(jìn)行簡單對接,導(dǎo)致數(shù)據(jù)標(biāo)注及知識的消化
理解比較困難,難以形成如圖像識別一樣的知識高能力
應(yīng)用。行業(yè)知識圖譜的構(gòu)建往往需要行業(yè)和技術(shù)人員雙
方彼此的溝通對接,中國電力科學(xué)研究院有限公司人工
智能應(yīng)用研究所就充當(dāng)了一個行業(yè)和技術(shù)的對接橋梁
角色,嘗試構(gòu)建了一套電力領(lǐng)域知識圖譜。
01
人工智能應(yīng)用所簡介
人工智能應(yīng)用研究所(人工智能所)成立于2018
年,是國家電網(wǎng)有限公司唯一人工智能應(yīng)用技術(shù)的重要
研究和支撐機構(gòu),聚焦電力領(lǐng)域智能感知、大數(shù)據(jù)、智
能平臺、智能認(rèn)知和智能應(yīng)用五大研究方向,全面支撐
電力人工智能應(yīng)用類技術(shù)的科研攻關(guān)和推廣應(yīng)用。下設(shè)
智能感知研究室、大數(shù)據(jù)應(yīng)用研究室、平臺技術(shù)研究室、
智能認(rèn)知研究室、智能技術(shù)應(yīng)用研究室5個專業(yè)研究室,
以及綜合管理辦公室1個管理部門。人工智能所擁有員
工近70人,平均年齡32.7歲,碩士及以上學(xué)歷占比
100%.博士占比34%。本人是來自于智能認(rèn)知室的技術(shù)
負(fù)責(zé)人,智能認(rèn)知研究室主要做的是圖像識別、知識圖
譜、圖計算技術(shù),包括設(shè)備的故障診斷等方面的研究。
此外,我們所還承擔(dān)了中國電機工程學(xué)會人工智能專委
會、中電聯(lián)人工智能標(biāo)準(zhǔn)化技術(shù)委員會、IEEEPES人工
智能分委會、中國人工智能學(xué)會智慧能源專委會,以及
中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AHA)掛靠工作。建立了
各類電力人工智能科研平臺,借此打造了一個比較好的
電力人工智能的學(xué)術(shù)平臺和科研平臺,為電力人工智能
學(xué)術(shù)生態(tài)奠定了基礎(chǔ)。
02
電力知識工程的背景、內(nèi)核及發(fā)展歷程
電力系統(tǒng)作為一種資產(chǎn)龐雜、知識密集的電能生
產(chǎn)與消費系統(tǒng),支撐著多種能源的轉(zhuǎn)換、互聯(lián)、傳輸、
交互,涉及發(fā)、輸、變、配、用等多個領(lǐng)域的系統(tǒng)性
知識。我們做過很多知識工程,但以前的知識工程都
集中通過專家經(jīng)驗去構(gòu)建一些專家系統(tǒng),以實現(xiàn)規(guī)則
化或者邏輯化的表征。
近年來,隨著我國能源互聯(lián)網(wǎng)企業(yè)建設(shè)進(jìn)程的逐
步推進(jìn),電力領(lǐng)域知識體系愈發(fā)呈現(xiàn)出開放式、扁平
化、邊界模糊的發(fā)展趨勢,進(jìn)一步加劇了電力系統(tǒng)智
能認(rèn)知的復(fù)雜性。亟待引入知識圖譜這一新興工程技
術(shù),以結(jié)構(gòu)化方式刻畫電力系統(tǒng)中的概念、實體、事
件及其間的關(guān)系,推動電力人工智能有序發(fā)展。
領(lǐng)域知識圖譜作為一個復(fù)雜的因果網(wǎng)絡(luò),其中設(shè)
備、人員、單位、事件、動作都是普遍關(guān)聯(lián)的。這導(dǎo)
致在知識圖譜中沿著任意一個實體開展語義推理分析
均容易超出預(yù)想的知識邊界。之前有些電力專家提出
過電網(wǎng)天然一張圖的思想。從人的角度來講,人最大
的網(wǎng)絡(luò)是社交網(wǎng)絡(luò)。從實物的角度講,電網(wǎng)包括涉及
到的電力設(shè)備、場站、線路設(shè)備的部位部件等,其實
也是一個真實存在的龐大天然物聯(lián)網(wǎng),因此成為了特
別適合用圖結(jié)構(gòu)去表征的試驗場地。行業(yè)專家與學(xué)者
普遍認(rèn)為:知識圖譜在集中應(yīng)用簡單的場景更加易于
成功,而智能客服、智能推薦等領(lǐng)域的應(yīng)用成功實例
也在一定程度上歸功于其知識體系相對封閉。
因而,領(lǐng)域知識圖譜在電力系統(tǒng)中成功應(yīng)用的一
大先決條件是電力領(lǐng)域知識的需求細(xì)化、閉合,即能
找到一個有限的知識子集支撐電力領(lǐng)域的特定應(yīng)用需
求。也就是說,我們能在電力領(lǐng)域需求的知識里面找
到一個閉包子集,去特定化相關(guān)需求,才能把知識圖
譜及相關(guān)應(yīng)用做好。
在過去的三十余年間,電力公司圍繞著調(diào)度、運
檢、營銷、基建和物資等各業(yè)務(wù)部門所提報的業(yè)務(wù)需
求,進(jìn)行了知識工程的開發(fā),旨在實現(xiàn)由數(shù)據(jù)到知識、
由感知到認(rèn)知的提升。然而,傳統(tǒng)信息化工程產(chǎn)物仍
處于對電力數(shù)據(jù)和知識簡單應(yīng)用,缺乏對知識體系的
全面把握,缺乏對電力業(yè)務(wù)認(rèn)知推理,其粗獷式建設(shè)
模式不再完全適應(yīng)我國電力公司的發(fā)展需求。另一方
面對內(nèi)知識得不到貫通應(yīng)用,對外難以形成輔業(yè)公司
與外部行業(yè)主動支撐,使我國電力公司面臨著互聯(lián)網(wǎng)
轉(zhuǎn)型的困難。
為了輔助我國電力公司打破知識孤島,實現(xiàn)業(yè)務(wù)
協(xié)同和數(shù)據(jù)貫通。支撐電網(wǎng)與新興業(yè)務(wù)發(fā)展,專家學(xué)
者近年來在電力調(diào)度、電力運檢、電力營銷等諸多領(lǐng)
域提出了基于領(lǐng)域知識圖譜這一新興認(rèn)知方法的技術(shù)
路線和應(yīng)用案例。
在電力調(diào)度方面,專家學(xué)者的主流工作仍集中于
對自動語音識別(AutomaticSpeechRecognition,
ASR)、自然語言處理(NaturalLanguageProcessing,
NLP)和DKG技術(shù)的組合應(yīng)用。
例如,閃鑫等人提出基于人工智能的調(diào)度控制系
統(tǒng)框架,并對基于知識圖譜智能輔助決策與語音助手
開展研究;周帆等人多源電力調(diào)度模型知識構(gòu)建調(diào)度
領(lǐng)域知識圖譜,進(jìn)而實現(xiàn)圖譜內(nèi)本體相關(guān)問題的自然
語言理解與查詢語句拼接;劉廣一等人利用圖數(shù)據(jù)庫
對配電網(wǎng)拓?fù)溥M(jìn)行存儲,提出“電網(wǎng)一張圖”運營指
揮系統(tǒng)的平臺結(jié)構(gòu);喬驥等人基于DKG技術(shù)實現(xiàn)了故
障信息解析判別、智能輔助決策以及多維度人機交互,
驗證了數(shù)據(jù)與知識雙驅(qū)動的電網(wǎng)拓?fù)鋽?shù)據(jù)分析研究在
業(yè)務(wù)中落地應(yīng)用的可行性;高澤璞等人整合多個低壓
配電網(wǎng)信息系統(tǒng)中的數(shù)據(jù),挖掘各數(shù)據(jù)之間關(guān)系并構(gòu)
建出低壓配電網(wǎng)拓?fù)浣Y(jié)構(gòu),實現(xiàn)了對低壓配電網(wǎng)信息
系統(tǒng)中的戶變關(guān)系的辨識。
在電力運檢方面,由于近三總內(nèi)我們在電力系統(tǒng)
里面做了很多圖像識別、目標(biāo)檢測等智能巡檢的一些
研究工作,受電力巡檢影像基礎(chǔ)研究的影響,設(shè)備的
運維檢修板塊也是近年來比較新興的板塊。電力巡檢
影像分析等人工智能應(yīng)用的興起,為DKG的研究應(yīng)用
打下了良好基礎(chǔ)。專家學(xué)者以電力設(shè)備為核心,領(lǐng)域
知識圖譜相關(guān)的研究工作在細(xì)分業(yè)務(wù)點上相對深入。
例如,張敏杰等人基于語義網(wǎng)、知識圖譜及自然
語言處理等技術(shù),提出基于的框架以支撐變壓器智能
管理;趙振兵等人利用螺栓螺母之間的關(guān)聯(lián)組成栓母
對,采深度學(xué)習(xí)與先驗知識結(jié)合的方法建立知識圖譜,
以指導(dǎo)對栓母的缺陷分;劉梓權(quán)等人利用設(shè)備缺陷記
錄語料構(gòu)建電力知識圖譜,提出利用圖搜索進(jìn)行電力
設(shè)備缺陷檢索的方法;Tang等人提出面對多源異類電
力設(shè)備數(shù)據(jù)的設(shè)備缺陷知識圖譜構(gòu)建方法,改進(jìn)圖搜
索以展示檢索結(jié)果的期望信息;楊強等人則采用領(lǐng)域
知識圖譜整合展示電力設(shè)備全壽命周期數(shù)據(jù),揭示實
體與業(yè)務(wù)對象之間的關(guān)系;湯亞宸等人利用領(lǐng)域知識
圖譜進(jìn)行規(guī)則推理,實現(xiàn)涉及設(shè)備、廠家、站/線、公
司、質(zhì)量、事件的高效分析查詢。此外,趙振兵等人
提出建立具有一定普適性且專業(yè)較強的知識圖譜,通
過DKG實現(xiàn)跨媒體數(shù)據(jù)在知識層有機互補的創(chuàng)新提議,
提升輸電線路關(guān)鍵部件視覺檢測的能力。
在電力營銷方面,專家學(xué)者的研究工作暫時與其
他行業(yè)客服的主流技術(shù)路線基本一致,基于ASR、NLP
與DKG的技術(shù)組合實現(xiàn)電力客服業(yè)務(wù)中智能檢索、智
能問答、主動外呼能力的整體提升。
例如,饒竹一等人提出了基于知識圖譜的電力客
服知識庫構(gòu)建、檢索方法,設(shè)計形成智能客服系統(tǒng)技
術(shù)方案;Cheng等人結(jié)合電力客服的業(yè)務(wù)需求,提出
了集成客戶本體、數(shù)據(jù)本體以及推理引擎的三級電力
客服知識圖譜架構(gòu);梁林森等人則針對地方特色開展
了智能95598支撐技術(shù)研究;像天津、湖南等地,打
95598直接就接入智能語音機器人。南網(wǎng)現(xiàn)在也在探
索情感識別,用于判定在語音機器人進(jìn)行智能問答的
過程中,是否會對人的情感造成一些投訴的風(fēng)險。譚
剛等人針對基KG問答系統(tǒng)中存在的中文問題表達(dá)模
糊等問題,提出融合領(lǐng)域特征知識圖譜的電網(wǎng)客服問
答系統(tǒng),實現(xiàn)了以較低的響應(yīng)延遲提供高準(zhǔn)確率的回
答。然而,就總體而言,電力營銷領(lǐng)域中的DKG應(yīng)用
數(shù)據(jù)來源相對封閉,未能凸顯互聯(lián)網(wǎng)化運營理念;認(rèn)
知推理能力有待進(jìn)一步增強,亟待引入情感分析、多
輪對話等技術(shù)并使之固化形成業(yè)務(wù)能力。
03
電力領(lǐng)域知識表示與圖譜構(gòu)建L電力領(lǐng)域知識
表示知識圖譜技術(shù)作為一個工具落到某一個行業(yè)領(lǐng)域,
與普通的知識圖譜構(gòu)建或者是開放域的、開源的、廣域
的知識圖譜構(gòu)建到底存在什么樣的區(qū)別呢?由于電力
領(lǐng)域知識來源廣泛,有來自傳統(tǒng)的電力知識工程系統(tǒng)、
專家經(jīng)驗知識庫等的結(jié)構(gòu)化數(shù)據(jù),還有電力標(biāo)準(zhǔn)、制度、
法律、法規(guī)以及專家、技術(shù)人員的經(jīng)驗等半/非結(jié)構(gòu)化
數(shù)據(jù),可按照復(fù)用程度的差異劃分為通用知識和專用知
識兩大部分。
其中,例如部分電力設(shè)備的名稱、電壓等級、容量
以及單位組織架構(gòu)等信息在客服、調(diào)度、運檢、安質(zhì)等
多個業(yè)務(wù)領(lǐng)域均有需求,我們稱之為電力領(lǐng)域通用知識;
而客服領(lǐng)域中的用戶名稱、電費、電價等信息相對專用,
在調(diào)度、運檢、安質(zhì)等政務(wù)領(lǐng)域涉及概率很小,甚至完
全不會出現(xiàn),我們將之認(rèn)定為電力領(lǐng)域?qū)S弥R。值得
一提的是,電力領(lǐng)域通用知識與專用知識之間的界限往
往是模糊的,實際操作時需要根據(jù)實際業(yè)務(wù)進(jìn)行統(tǒng)計分
析以判定通用、專用知識之間的邊界。因此在概念層和
實例層之間我們還劃分了一個業(yè)務(wù)層,主要是電力行業(yè)
的一些動作知識。以檢修為例,電力設(shè)備部位部件的缺
陷信息勢必會涉及到檢修的操作,我們會把標(biāo)準(zhǔn)里面提
到的規(guī)則或規(guī)范性約束條件在業(yè)務(wù)層進(jìn)行存儲以開展
維修。接下來談一下數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)結(jié)構(gòu)本身其實包含
邏輯、組織結(jié)構(gòu)、操作、和約束。電力板塊跟傳統(tǒng)由結(jié)
構(gòu)數(shù)據(jù)的體量、特征沒有典型差異。唯有一點是電力板
塊去做知識圖構(gòu)建過程時,很多去西是物聯(lián)網(wǎng)的架閡,
網(wǎng)絡(luò)拓?fù)浜椭R圖譜的拓?fù)涫悄軌蛑睾系摹k娏υO(shè)備的
部位、部件相關(guān)的信息,天然就構(gòu)成了一個拓?fù)鋱D,完
全可以把這個拓?fù)溆成涞街R圖譜板塊,這是電力領(lǐng)域
應(yīng)用知識圖譜的一個最大優(yōu)勢。2.本體構(gòu)建領(lǐng)域知識
圖譜的本體構(gòu)建方法主要包括由知識驅(qū)動的自頂向下
(Top-down)式、由數(shù)據(jù)驅(qū)動的自底向上(Bottom-up)
式以及兩者的組合方式。其中,自頂向下式是指通過業(yè)
務(wù)專家人工編制或利用已有的結(jié)構(gòu)化知識庫獲取電力
領(lǐng)域知識本體的結(jié)構(gòu)信息,進(jìn)而將知識本體加入到知識
庫;自底向上式則是指從開放非結(jié)構(gòu)化數(shù)據(jù)中提取實體、
概念、關(guān)系、屬性、屬性值等信息,選取置信度高的對
象作為候選,分析歸納成底層結(jié)構(gòu)信息,逐層向上最終
形成知識本體并加入到知識庫。電力領(lǐng)域數(shù)據(jù)來源廣泛,
傳統(tǒng)電力知識工程系統(tǒng)、專家經(jīng)驗知識庫等結(jié)構(gòu)化數(shù)據(jù),
可直接用來指導(dǎo)知識圖譜本體自頂向下的構(gòu)建。同時,
電力領(lǐng)域?qū)嶋H業(yè)務(wù)中所產(chǎn)生的各類數(shù)據(jù)以及專家、技術(shù)
人員的主觀經(jīng)驗等半/非結(jié)構(gòu)化的數(shù)據(jù)也蘊含了豐富的
電力領(lǐng)域行業(yè)知識,為確保知識圖譜本體的完備性,利
用信息提取技術(shù)對此類數(shù)據(jù)中的電力知識加以識別,并
對識別的結(jié)果進(jìn)行歸納抽象,最終將抽象出的概念映射
或補充到電力領(lǐng)域知識圖譜本體中,從而實現(xiàn)本體自底
向上的構(gòu)建。自頂向下、自底向上結(jié)合的本體構(gòu)建方式,
既能夠傳承固化電力領(lǐng)域現(xiàn)有數(shù)據(jù)庫中的相關(guān)經(jīng)驗知
識,乂能實現(xiàn)對新知識的發(fā)現(xiàn),故在實際構(gòu)建電力領(lǐng)域
知識圖譜本體時,通常采取兩種方式相結(jié)合的方法。目
前國網(wǎng)公司、南網(wǎng)公司和大唐等能源企業(yè),用top-down
這種形式居多,即在業(yè)務(wù)專家進(jìn)行指導(dǎo)下直接去構(gòu)建相
關(guān)的知識圖譜本體框架。主要是因為這樣的構(gòu)建方法有
兩方面的優(yōu)勢,第一方面優(yōu)勢是多年的運營過程,能源
企業(yè)都做了一些信息化系統(tǒng),這些信息化系統(tǒng)的背后有
數(shù)據(jù)結(jié)構(gòu)表單,表單本來就已經(jīng)形成了電力領(lǐng)域知識圖
譜,可以參考數(shù)據(jù)結(jié)構(gòu)的架構(gòu);此外就是在圖譜本體構(gòu)
建過程中,像電力的營銷領(lǐng)域、調(diào)度領(lǐng)域、運檢領(lǐng)域,
有一些營銷客服話術(shù),運檢調(diào)度的一些應(yīng)急響應(yīng)預(yù)案,
自然就是事件和動作相關(guān)聯(lián)的,出現(xiàn)什么事件怎么樣去
做或出現(xiàn)什么樣的trigger怎樣去做響應(yīng)等,這些都是
構(gòu)建電力領(lǐng)域事件圖譜非常好的素材。
04
電力領(lǐng)域知識圖譜的應(yīng)用實踐L領(lǐng)域知識圖譜
應(yīng)用架構(gòu)在電力領(lǐng)域知識圖譜構(gòu)建中,我們發(fā)現(xiàn)知識圖
譜作為一種語義網(wǎng)絡(luò),在電力大數(shù)據(jù)的賦能下誠然已經(jīng)
能夠解決許多實際問題;但單純依靠知識圖譜技術(shù)并不
能完全響應(yīng)我國能源互聯(lián)網(wǎng)的數(shù)據(jù)特征與發(fā)展趨勢,難
以表達(dá)電力系統(tǒng)中涉及到的豐富語義,因而充分利用現(xiàn)
有知識工程資源,并不能將其視為一劑包治百病的“萬
能藥”。而應(yīng)將知識圖譜作為實現(xiàn)低成本、快速響應(yīng)的
部署和轉(zhuǎn)換,為電網(wǎng)公司帶來收益的最大化。一方面,
在調(diào)度、運檢、安質(zhì)等業(yè)務(wù)領(lǐng)域中存在著豐富的if-then
規(guī)則信息,不易利用領(lǐng)域知識圖譜表達(dá)。特別是對于
ifAandBthenC等并發(fā)事件規(guī)則,其條件部分的子
表達(dá)式之間的關(guān)系可以出現(xiàn)部分極為復(fù)雜的情況,利用
領(lǐng)域知識圖譜難以表達(dá)。同時,電力行業(yè)公司中存在大
量的if-then規(guī)則信息乃至其他知識表示規(guī)則下的信
息已經(jīng)在過往的信息化工程建設(shè)中被維護在了專家知
識系統(tǒng)中,亦或已經(jīng)突破了知識圖譜技術(shù)的原有范圍。
知識圖譜傳統(tǒng)的研究往往是去做最優(yōu)路徑搜索研究,去
發(fā)現(xiàn)最優(yōu)通路,但是很難找到兩個起點緊接到最終一個
終點這樣的路徑。這種需求以前的研究里面很少涉及。
解決方案有兩種,第一種的是改變這個知識圖譜的
schema,讓兩個起點一個終點的這種情況變成從一個起
點出發(fā),必須過某種屬性的一個節(jié)點,最終到達(dá)終點,
這樣就把剛才說這個ifaandbthenc變成了ifaand
bareconfirmedthenc這種方式。第二種方案是,
不去做最優(yōu)路徑搜索,而是做圖結(jié)構(gòu)分析,或者圖分類
任務(wù)。若能利用領(lǐng)域知識圖譜輔助與引導(dǎo)對專家知識系
統(tǒng)中知識元進(jìn)行合理“利舊”,對新生知識元進(jìn)行基于
Seq2Seq等數(shù)據(jù)驅(qū)動算法模型的“求新”,將有助于人
們短、平、快的解決更多的實際同題。另一方面,能源
互聯(lián)網(wǎng)的數(shù)據(jù)特征及其互聯(lián)網(wǎng)化的發(fā)展趨勢,注定其中
的數(shù)據(jù)、知識將逐步區(qū)別于傳統(tǒng)電網(wǎng)數(shù)據(jù),呈現(xiàn)出顯著
的動態(tài)、隱形、主觀等特性。知識圖譜技術(shù)側(cè)重于表達(dá)
實體、概念之間的語義關(guān)聯(lián),而上述語義關(guān)聯(lián)大多是靜
態(tài)的、顯性的、客觀的、明確的,而實際應(yīng)用中對過程
性、決策性知識是有著大量需求的,這些知識大部分是
動態(tài)的、隱形的、帶有一定主觀性的,如規(guī)劃設(shè)計、發(fā)
展決策、運檢決策、調(diào)度決策等。雖然一線的工作人員
與專家能夠憑借自己工作所得或口耳相傳的經(jīng)驗完成
本職工作,但單就其中部分業(yè)務(wù)的內(nèi)在規(guī)則而言仍是模
糊的。部分電力行業(yè)公司曾提出以標(biāo)準(zhǔn)化或激勵制度的
方式促進(jìn)企業(yè)內(nèi)的知識表達(dá)與沉淀,但收效甚微。其關(guān)
鍵問題在于一線員工、工程師、研究員等領(lǐng)域?qū)<乙搽y
以清晰的對相關(guān)知識進(jìn)行表達(dá)。傳統(tǒng)知識工程通過專業(yè)
的知識工程師協(xié)助領(lǐng)域?qū)<疫M(jìn)行知識獲取,但總體上的
代價太大,過程太重,不易成功,有賴于數(shù)據(jù)驅(qū)動的知
識挖掘技術(shù)的引入與應(yīng)用。因此,我們提出了基于NoDKG
思想的電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)。通過結(jié)合使用圖數(shù)
據(jù)庫與關(guān)系型數(shù)據(jù)庫,合理劃分結(jié)構(gòu)化、半結(jié)構(gòu)化、非
結(jié)構(gòu)化數(shù)據(jù)的存儲與調(diào)用方式,解釋了框架如何應(yīng)對動
態(tài)、隱形、主觀性的知識,提供了一種領(lǐng)域知識圖譜與
現(xiàn)有專家數(shù)據(jù)庫有機融合的途徑。
基于NoDKG的電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)覆蓋數(shù)
據(jù)獲取、圖譜構(gòu)建、知識計算以及圖譜應(yīng)用等四個層
級。
第一層是數(shù)據(jù)獲取,屬于框架的底層。獲取對象
包括結(jié)構(gòu)化數(shù)據(jù)信息、半結(jié)構(gòu)化的和非結(jié)構(gòu)化數(shù)據(jù)信
息。此外還有電網(wǎng)公司企業(yè)之外引入的數(shù)據(jù)。比如進(jìn)
行電力巡檢過程中,關(guān)注電網(wǎng)公司內(nèi)部的標(biāo)準(zhǔn)制度之
外,還要去關(guān)注國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、IEEE或者ITU
等國際標(biāo)準(zhǔn)。這些就屬于是外部信息,再比如進(jìn)行設(shè)
備的采購、運維、檢修的過程中,對設(shè)備廠商的需求,
可能會對天眼查、企查查等企業(yè)之間的關(guān)朕、穿透關(guān)
系、股權(quán)分析有數(shù)據(jù)需求??傮w來講,數(shù)據(jù)獲取層一
般都是以excel、csv或者json、xml等文件進(jìn)行導(dǎo)入、
讀取和存儲,然后把它解析成概念、實體、關(guān)系,還
有屬性、事件等相關(guān)的知識源。
第二層是圖譜構(gòu)建層,作為電力領(lǐng)域知識圖譜應(yīng)
用架構(gòu)的核心層承載自然語言處理、知識抽取、知識
融合以及知識加工能力。同時,規(guī)范要求采用圖數(shù)據(jù)
庫存儲實體(屬性值)、概念、關(guān)系(屬性)、事件并實
現(xiàn)多對多關(guān)系管理,通常涉及Neo4j等面向?qū)傩詧D的
存儲系統(tǒng)或gStore等面向RDF圖的存儲系統(tǒng)兩大類別;
采用關(guān)系型數(shù)據(jù)庫管理文件、視頻、圖像、音頻等多
媒體數(shù)據(jù)以及一對多關(guān)系,并通過“id_name”連接彼
此。其中,可考慮將關(guān)系型數(shù)據(jù)庫的“id”、“name”
等變量信息作為屬性值存儲在圖數(shù)據(jù)庫內(nèi)的領(lǐng)域知識
圖譜中,用以實現(xiàn)對高效檢索、認(rèn)知推理的能力支撐。
第三層是知識計算層,負(fù)責(zé)集成表示學(xué)習(xí)、關(guān)系
推理、屬性推理、事件推理、路仔計算、比較排序等
通用算法模型,為圖譜應(yīng)用層提供算法支撐。
第四層圖譜應(yīng)用層,負(fù)責(zé)提供智能搜索、智能問
答、智能推理、智能決策、知識處理及第三方應(yīng)用,
作為電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)所產(chǎn)出的最終功能模
塊與實際應(yīng)用場景進(jìn)行對接。
2.領(lǐng)域知識圖譜應(yīng)用實踐-電力調(diào)度故障處理
在電網(wǎng)調(diào)度業(yè)務(wù)中,采用調(diào)度故障處置管理規(guī)定、
故障處置預(yù)案、調(diào)度規(guī)程及異常監(jiān)控手冊等文本數(shù)據(jù)
以及從D5000系統(tǒng)導(dǎo)出的結(jié)構(gòu)化數(shù)據(jù),根據(jù)一線調(diào)度
人員的業(yè)務(wù)經(jīng)驗與業(yè)務(wù)規(guī)則,自上而下的搭建基礎(chǔ)本
體架構(gòu),然后利用概念抽取工具及關(guān)系抽取模型進(jìn)行
自動化識別,識別結(jié)果經(jīng)業(yè)務(wù)專家抽象校驗后形成自
下而上的類別體系,與基礎(chǔ)本體架構(gòu)融合,構(gòu)建最終
的電力調(diào)度知識本體架構(gòu)。基于本體架構(gòu),利用
Bi-LSTM-CRF模型實現(xiàn)調(diào)度故障實體識別及屬性抽取,
根據(jù)電網(wǎng)故障數(shù)據(jù)特征,利用Bi-LSTM+Attention模
型進(jìn)行關(guān)系抽取及分類,經(jīng)實體鏈接與知識補全后,
實現(xiàn)電力調(diào)度領(lǐng)域知識圖譜構(gòu)建。
一般我們會畫如下的一個架構(gòu)示意圖。首先包括
了調(diào)度相關(guān)的文本數(shù)據(jù),如調(diào)度、調(diào)規(guī)、應(yīng)急預(yù)案、
調(diào)度細(xì)則、調(diào)度報告。此外,也會去存電網(wǎng)故障數(shù)據(jù)、
調(diào)度系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),進(jìn)行結(jié)構(gòu)化和半結(jié)構(gòu)化的文
本解析,解析之后共同形成調(diào)度領(lǐng)域的知識圖譜。非
結(jié)構(gòu)化數(shù)據(jù)的我們會采取mysql或者sql存儲,進(jìn)行
圖結(jié)構(gòu)數(shù)據(jù)和關(guān)系性數(shù)據(jù)庫的聯(lián)調(diào),聯(lián)調(diào)之后共同作
用于相關(guān)的故障處置判斷,包括電網(wǎng)的異常情況、故
障類別的分類,還有設(shè)備故障的溯源,故障原因的分
析。最后進(jìn)行故障處置,包括信息的匯總、負(fù)荷的轉(zhuǎn)
移、事故的拉路,試送的恢復(fù)等,最終把這些功能模
塊進(jìn)行前端人機功能展示,形成業(yè)務(wù)能力。
3?領(lǐng)域知識圖譜應(yīng)用實踐-電力運檢工單處理在電
力運檢業(yè)務(wù)中,使用輸電架空線路工程臺賬、工單、工
作票、修試記錄等業(yè)務(wù)數(shù)據(jù)以及檢修相關(guān)標(biāo)準(zhǔn)文檔,根
據(jù)一線檢修人員的業(yè)務(wù)經(jīng)驗與標(biāo)準(zhǔn)文檔中所述業(yè)務(wù)規(guī)
則,人工構(gòu)建了覆蓋設(shè)備、部件、部位、缺陷、故障、
描述、原因、解決方案、場/站/線、單位、人員、持票
種類等信息在內(nèi)的輸電架空線路工程運檢知識基礎(chǔ)本
體架構(gòu),然后利用自動化抽取工具進(jìn)行知識提取,運檢
業(yè)務(wù)專家對提取結(jié)果進(jìn)行審核抽象后,自底向上形成一
套知識體系,該體系與基礎(chǔ)本體架構(gòu)融合形成輸電架空
線路工春運檢知識本體架構(gòu)?;谶\檢知識本體架溝,
采用Bi-LSTM-CRF.Bi-GRU-CRF等算法,由業(yè)務(wù)數(shù)捱與
標(biāo)準(zhǔn)文檔中實現(xiàn)自底而上式的圖譜構(gòu)建。
工單是指巡視人員去現(xiàn)場看了哪些設(shè)備,存在哪些
故障,會把故障信息記錄下來形成一個工單。工單會交
給后面的檢修人員去進(jìn)行相關(guān)的設(shè)備檢修維護。檢修人
員拿到工單之后會開出工作票,工作票記錄比如哪個設(shè)
備壞了,應(yīng)該如何去修。工作票派發(fā)給一線工作人員到
場站線進(jìn)行維修操作。修完后會形成一個檢修測試記錄。
這三個表單之間是順承的關(guān)系,工單和工作票往往是一
對一或一對多的關(guān)系,而工作票和修試記錄往往是一對
一的關(guān)系。如果整個修試記錄完成了工單所有內(nèi)容,那
么在檢修業(yè)務(wù)上就進(jìn)行了一個閉環(huán)。人工去構(gòu)建運檢領(lǐng)
域的知識圖譜過程中,會涉及到設(shè)備部位、部件缺陷、
故障以及相關(guān)描述、原因、解決方案、場站線信息,單
位人員持票等相關(guān)信息,然后自上而下形成一個知識體
系,相當(dāng)于去做了一個top-down的schema構(gòu)建,之后
相關(guān)的數(shù)據(jù)就可以去用實體、關(guān)系分類模型去把它通過
數(shù)據(jù)訓(xùn)練模型,直接生成圖譜了。工作票的生產(chǎn)過程中
也可以去做一些病因的分析,包括故障的溯源、智能處
置和標(biāo)準(zhǔn)的推薦。例如制造設(shè)備出現(xiàn)了一個故障信息之
后,就能知道去哪個標(biāo)準(zhǔn)里面查,標(biāo)準(zhǔn)應(yīng)該是采用哪一
條,以及設(shè)備故障的可能原因等等。工作票生成之后進(jìn)
行一個修試記錄比對。我們團隊采用ASR去做語音數(shù)據(jù)
的轉(zhuǎn)寫,相當(dāng)于是現(xiàn)場的人員通過語音錄入的形式,把
自己完成這個工作的信息進(jìn)行記錄,屬于管理上留痕的
操作。此后轉(zhuǎn)出來文本再去進(jìn)行語義比對,看他有沒有
對這個工作票工單的信息進(jìn)行響應(yīng),進(jìn)而形成人際交互
的響應(yīng)。4.領(lǐng)域知識圖譜應(yīng)用實踐-電力客服智能問答
在電力客服業(yè)務(wù)中,利用95598客服知識庫標(biāo)準(zhǔn)問、坐
席客服記錄、對話語音等業(yè)務(wù)數(shù)捱,根據(jù)一線客服人員
的業(yè)務(wù)經(jīng)驗及客服話術(shù)流程所述業(yè)務(wù)規(guī)則,結(jié)合自動化
知識抽取工具與業(yè)務(wù)專家相結(jié)合的方式自底向上構(gòu)建
的電力客服知識體系,構(gòu)建形成電力客服知識本體架構(gòu)。
進(jìn)而,利用基于置信度傳播的概念抽取模型以及
Bi-LSTM-CRF模型實現(xiàn)客服領(lǐng)域?qū)嶓w識別;利用基于概
率因子圖模型的實體多關(guān)系聯(lián)合挖掘模型抽取關(guān)系,并
采用實體-主題模型和主動學(xué)習(xí)的層次學(xué)習(xí)算法實現(xiàn)關(guān)
系的分類,經(jīng)知識融合和知識校驗后,實現(xiàn)電力客服知
識圖譜構(gòu)建。
05
電力領(lǐng)域知識圖譜的未來挑戰(zhàn)
1.應(yīng)用方向
首先從業(yè)務(wù)需求方向來講,為全面推進(jìn)傳統(tǒng)電力行
業(yè)的互聯(lián)網(wǎng)化進(jìn)程,電網(wǎng)公司勢必會在未來幾年內(nèi)跟服
務(wù)業(yè)公司加強聯(lián)系,同時與房地產(chǎn)、電商、家電、保險
等行業(yè)開展跨行業(yè)合作,電力領(lǐng)域知識應(yīng)用會更加開放。
相應(yīng)的,技術(shù)需求會有以下四大類:
智能搜索
知識圖譜是語義搜索的大腦,智能語義搜索借助知
識圖譜的幫助,對用戶查詢關(guān)鍵字進(jìn)行解析和推理,將
其映射到知識圖譜中的一個或一組節(jié)點上,并根據(jù)知識
圖譜中層次結(jié)構(gòu),返回相關(guān)知識。智能語義搜索由谷歌
提出后,在行業(yè)內(nèi)得到廣泛應(yīng)用。百度的“知心”、搜
狗的“知立方”,利用知識圖譜技術(shù)提升用戶開放域知
識搜索體驗,而國網(wǎng)英大推出的中國電力百科網(wǎng)、中國
電科院在研的智能標(biāo)準(zhǔn)制度檢索系統(tǒng),則用以支持電力
領(lǐng)域百科、標(biāo)準(zhǔn)知識的快速獲取。隨著電力企業(yè)內(nèi)外業(yè)
務(wù)部的服務(wù)渠道越來越多,智能搜索也將擁有更廣闊的
應(yīng)用前景,比如支撐電力用戶進(jìn)行電費電價政策檢索、
調(diào)度領(lǐng)域員工進(jìn)行故障知識的查詢等。
智能推薦
推薦系統(tǒng)是人與信息的連接器,用已有的連接去預(yù)
測未來用戶和物品之間會出現(xiàn)的連接。推薦系統(tǒng)本質(zhì)上
處理的是信息,它的主要作用是在信息生產(chǎn)方和信息消
費方之間搭建志橋梁,從而獲取人的注意力“推薦系統(tǒng)
作為互聯(lián)網(wǎng)和電子商務(wù)發(fā)展的新興產(chǎn)物,在電力行業(yè)公
司中大多應(yīng)用于客服、電商以及傳媒業(yè)務(wù)。此外,中國
電科院還采用領(lǐng)域知識圖譜開展了專家遴選技術(shù)的相
關(guān)研究,以支持國家電網(wǎng)有限公司的科技項目評審業(yè)務(wù)。
基于領(lǐng)域知識圖譜的智能推薦在電力系統(tǒng)的應(yīng)用市場
極為廣闊,從總體上劃分為基于個體評價的智能推薦與
基于群體規(guī)律的智能推薦兩個類別。
智能問答
智能問答可以看做是一種信息檢索的高級模式,系
統(tǒng)將知識圖譜看做成一個完備的知識庫,首先對自然語
言表示的句子進(jìn)行分析,將問題轉(zhuǎn)化成對知識圖譜的查
詢,然后在知識圖譜中查詢答案并返回?;谥R圖譜
的智能問答應(yīng)用廣泛,如亞馬遜的自然語言助手Evi、
蘋果智能語音助手Siri和出門問問手機應(yīng)用等,覆蓋
了出行、電商、手機等多個行業(yè)。此外,國網(wǎng)客服中心
在研的基于知識圖譜的客服智能問答系統(tǒng),有效地提升
了工作效率,降低人工參與成本。
智能問答不僅在公司內(nèi)部業(yè)務(wù)場景應(yīng)用廣泛,其在
輔業(yè)公司業(yè)務(wù)中也具有多樣化的潛在應(yīng)用。比如在電力
保險行業(yè)、金融行業(yè)進(jìn)行復(fù)雜業(yè)務(wù)知識解答,在電動汽
車行業(yè)進(jìn)行交通信息查詢。
智能決策
智能決策是指結(jié)合人工智能和知識工程,更充分地
應(yīng)用描述性知識、過程性知識、推理性知識,進(jìn)而通過
邏輯推理來幫助解決復(fù)雜決策問題的輔助決策。目前,
在電力行業(yè)運檢、調(diào)度以及科技等多個業(yè)務(wù)領(lǐng)域均已開
展了針對基于領(lǐng)域知識圖譜的智能決策的理論探索與
技術(shù)研究工作。中國電科院基于上述理論構(gòu)建了輸變電
運檢領(lǐng)域知識管理與認(rèn)知推埋平臺與科技項目輔助決
策系統(tǒng),實現(xiàn)工作票智能生成、修試記錄智能比對、科
技項目查重。
隨著諸多專家學(xué)者對電力跨媒體數(shù)據(jù)研究的不斷
深入,基于領(lǐng)域知識圖譜的智能決策未來有望進(jìn)一步在
電力行業(yè)調(diào)度、配網(wǎng)運檢、綜合能源管控以及需求側(cè)響
應(yīng)等方面嶄露鋒芒。
2.未來挑戰(zhàn)
挑戰(zhàn)一:混雜數(shù)據(jù)下的知識提取與圖譜構(gòu)建
從電力系統(tǒng)中獲取的知識通常具有信息廣泛性、多
源異構(gòu)特性,且有時伴有歧義、噪聲與冗余。對于知識
圖譜而言,歧義表現(xiàn)為實體、概念的屬性描述缺乏精確
性、一致性或?qū)嶓w間關(guān)系錯置、扭曲,使得圖譜結(jié)構(gòu)混
亂及語義描述相互沖突,可能導(dǎo)致推理機制紊亂、推理
結(jié)果失真;噪聲作為互聯(lián)網(wǎng)化數(shù)據(jù)的顯著特征,一定程
度上稀釋了數(shù)據(jù)信息內(nèi)容和價值密度;而冗余則表現(xiàn)為
在圖譜中產(chǎn)生大量孤立、無用的實體和屬性關(guān)系,占據(jù)
大量的存儲空間和關(guān)系路徑,使圖譜實體層變得冗余、
繁雜,導(dǎo)致存儲資源的浪費和圖譜推理應(yīng)用的低效。如
何將電力領(lǐng)域知識元與互聯(lián)網(wǎng)大數(shù)據(jù)有機融合起來,構(gòu)
建、更新大規(guī)模、結(jié)構(gòu)清晰、可解釋的電力領(lǐng)域知識圖
譜,并賦能使之在混雜數(shù)據(jù)下自主進(jìn)化,是實現(xiàn)電力系
統(tǒng)智能化發(fā)展的必由之路。
挑戰(zhàn)二:電網(wǎng)拓?fù)湎碌恼J(rèn)知推理與輔助決策
目前,領(lǐng)域知識圖譜技術(shù)已經(jīng)在運檢、調(diào)度、客服
等業(yè)務(wù)中實現(xiàn)初步應(yīng)用?,F(xiàn)有的知識推理模型往往需要
大量高質(zhì)量的樣本進(jìn)行訓(xùn)練,獲取樣本成本較大。而專
家以及一線工作人員則可以依據(jù)先驗知識與小樣本數(shù)
據(jù)對于電力拓?fù)湟约斑\行數(shù)據(jù)進(jìn)行分析判斷。另一方面,
現(xiàn)有的知識推理實現(xiàn)方式,可解決大部分領(lǐng)域和業(yè)務(wù)場
景的復(fù)雜計算需求,但對于計算資源和存儲資源的占用
較大,且現(xiàn)有算法效率存在瓶頸,應(yīng)用到電網(wǎng)系統(tǒng)大規(guī)
模數(shù)據(jù)時往往無法滿足實時、準(zhǔn)實時或及時的計算決策
要求。如何在領(lǐng)域知識圖譜框架下實現(xiàn)對電網(wǎng)拓?fù)鋽?shù)據(jù)
等原生數(shù)據(jù)的高效利用,仍是為了推動數(shù)據(jù)-知識雙驅(qū)
動的電力智能信息處理系統(tǒng)發(fā)展的必要研究。
挑戰(zhàn)三:領(lǐng)域知識圖譜的質(zhì)量評價體系
對領(lǐng)域知識圖譜的質(zhì)量評價,大多針對實體、關(guān)系、
屬性三類數(shù)據(jù),通過構(gòu)建標(biāo)準(zhǔn)測試集或人工抽樣的方式
實現(xiàn)。中國電子技
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 晉中師范高等??茖W(xué)?!稒C械基礎(chǔ)與液壓傳動》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海中僑職業(yè)技術(shù)大學(xué)《中醫(yī)診斷學(xué)實驗》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南司法警官職業(yè)學(xué)院《機器視覺系統(tǒng)設(shè)計與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024年醫(yī)學(xué)研究與試驗發(fā)展服務(wù)項目資金申請報告代可行性研究報告
- 連續(xù)剛構(gòu)橋畢業(yè)設(shè)計答辯
- 2024年酒店、廚房設(shè)備用品投資申請報告代可行性研究報告
- 國防教育體系化建設(shè)路徑
- 主題班會安全法治教育
- 2025年浙江省余姚市姚東自來水有限公司招聘筆試參考題庫附帶答案詳解
- 2025年上海松江區(qū)云城融資租賃有限公司招聘筆試參考題庫附帶答案詳解
- 輔助生殖技術(shù)健康教育
- 網(wǎng)吧店長工作流程
- 2025年北京保安證考試試題及答案
- 2024年第二次廣東省普通高中化學(xué)學(xué)業(yè)水平合格性考試真題卷含答案
- 2025年醫(yī)保知識考試題庫:醫(yī)?;鸨O(jiān)管案例及答案解析試卷
- 2024年湖南省普通高中學(xué)業(yè)水平合格性考試歷史試題(原卷版+解析版)
- 新版人教版七年級下冊地理課件 第九章 東半球其他的地區(qū)和國家 第四節(jié) 澳大利亞
- 《信息技術(shù)》課件-模塊二 信息檢索技術(shù)
- 《康復(fù)評定技術(shù)》課件-第五章 運動控制
- 《水門事件簡介》課件
- 第十章《浮力》達(dá)標(biāo)測試卷(含答案)2024-2025學(xué)年度人教版物理八年級下冊
評論
0/150
提交評論