電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐_第1頁
電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐_第2頁
電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐_第3頁
電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐_第4頁
電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

電力領(lǐng)域知識圖譜技術(shù)進(jìn)展與應(yīng)用實踐

導(dǎo)讀:知識圖譜相關(guān)技術(shù)在開發(fā)和應(yīng)用過程中,通

常需要跟行業(yè)或者業(yè)務(wù)領(lǐng)域進(jìn)行高度融合。但是在行業(yè)

知識圖譜構(gòu)建過程中,無法把傳統(tǒng)行業(yè)和IT部門或知

識圖譜團隊進(jìn)行簡單對接,導(dǎo)致數(shù)據(jù)標(biāo)注及知識的消化

理解比較困難,難以形成如圖像識別一樣的知識高能力

應(yīng)用。行業(yè)知識圖譜的構(gòu)建往往需要行業(yè)和技術(shù)人員雙

方彼此的溝通對接,中國電力科學(xué)研究院有限公司人工

智能應(yīng)用研究所就充當(dāng)了一個行業(yè)和技術(shù)的對接橋梁

角色,嘗試構(gòu)建了一套電力領(lǐng)域知識圖譜。

01

人工智能應(yīng)用所簡介

人工智能應(yīng)用研究所(人工智能所)成立于2018

年,是國家電網(wǎng)有限公司唯一人工智能應(yīng)用技術(shù)的重要

研究和支撐機構(gòu),聚焦電力領(lǐng)域智能感知、大數(shù)據(jù)、智

能平臺、智能認(rèn)知和智能應(yīng)用五大研究方向,全面支撐

電力人工智能應(yīng)用類技術(shù)的科研攻關(guān)和推廣應(yīng)用。下設(shè)

智能感知研究室、大數(shù)據(jù)應(yīng)用研究室、平臺技術(shù)研究室、

智能認(rèn)知研究室、智能技術(shù)應(yīng)用研究室5個專業(yè)研究室,

以及綜合管理辦公室1個管理部門。人工智能所擁有員

工近70人,平均年齡32.7歲,碩士及以上學(xué)歷占比

100%.博士占比34%。本人是來自于智能認(rèn)知室的技術(shù)

負(fù)責(zé)人,智能認(rèn)知研究室主要做的是圖像識別、知識圖

譜、圖計算技術(shù),包括設(shè)備的故障診斷等方面的研究。

此外,我們所還承擔(dān)了中國電機工程學(xué)會人工智能專委

會、中電聯(lián)人工智能標(biāo)準(zhǔn)化技術(shù)委員會、IEEEPES人工

智能分委會、中國人工智能學(xué)會智慧能源專委會,以及

中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AHA)掛靠工作。建立了

各類電力人工智能科研平臺,借此打造了一個比較好的

電力人工智能的學(xué)術(shù)平臺和科研平臺,為電力人工智能

學(xué)術(shù)生態(tài)奠定了基礎(chǔ)。

02

電力知識工程的背景、內(nèi)核及發(fā)展歷程

電力系統(tǒng)作為一種資產(chǎn)龐雜、知識密集的電能生

產(chǎn)與消費系統(tǒng),支撐著多種能源的轉(zhuǎn)換、互聯(lián)、傳輸、

交互,涉及發(fā)、輸、變、配、用等多個領(lǐng)域的系統(tǒng)性

知識。我們做過很多知識工程,但以前的知識工程都

集中通過專家經(jīng)驗去構(gòu)建一些專家系統(tǒng),以實現(xiàn)規(guī)則

化或者邏輯化的表征。

近年來,隨著我國能源互聯(lián)網(wǎng)企業(yè)建設(shè)進(jìn)程的逐

步推進(jìn),電力領(lǐng)域知識體系愈發(fā)呈現(xiàn)出開放式、扁平

化、邊界模糊的發(fā)展趨勢,進(jìn)一步加劇了電力系統(tǒng)智

能認(rèn)知的復(fù)雜性。亟待引入知識圖譜這一新興工程技

術(shù),以結(jié)構(gòu)化方式刻畫電力系統(tǒng)中的概念、實體、事

件及其間的關(guān)系,推動電力人工智能有序發(fā)展。

領(lǐng)域知識圖譜作為一個復(fù)雜的因果網(wǎng)絡(luò),其中設(shè)

備、人員、單位、事件、動作都是普遍關(guān)聯(lián)的。這導(dǎo)

致在知識圖譜中沿著任意一個實體開展語義推理分析

均容易超出預(yù)想的知識邊界。之前有些電力專家提出

過電網(wǎng)天然一張圖的思想。從人的角度來講,人最大

的網(wǎng)絡(luò)是社交網(wǎng)絡(luò)。從實物的角度講,電網(wǎng)包括涉及

到的電力設(shè)備、場站、線路設(shè)備的部位部件等,其實

也是一個真實存在的龐大天然物聯(lián)網(wǎng),因此成為了特

別適合用圖結(jié)構(gòu)去表征的試驗場地。行業(yè)專家與學(xué)者

普遍認(rèn)為:知識圖譜在集中應(yīng)用簡單的場景更加易于

成功,而智能客服、智能推薦等領(lǐng)域的應(yīng)用成功實例

也在一定程度上歸功于其知識體系相對封閉。

因而,領(lǐng)域知識圖譜在電力系統(tǒng)中成功應(yīng)用的一

大先決條件是電力領(lǐng)域知識的需求細(xì)化、閉合,即能

找到一個有限的知識子集支撐電力領(lǐng)域的特定應(yīng)用需

求。也就是說,我們能在電力領(lǐng)域需求的知識里面找

到一個閉包子集,去特定化相關(guān)需求,才能把知識圖

譜及相關(guān)應(yīng)用做好。

在過去的三十余年間,電力公司圍繞著調(diào)度、運

檢、營銷、基建和物資等各業(yè)務(wù)部門所提報的業(yè)務(wù)需

求,進(jìn)行了知識工程的開發(fā),旨在實現(xiàn)由數(shù)據(jù)到知識、

由感知到認(rèn)知的提升。然而,傳統(tǒng)信息化工程產(chǎn)物仍

處于對電力數(shù)據(jù)和知識簡單應(yīng)用,缺乏對知識體系的

全面把握,缺乏對電力業(yè)務(wù)認(rèn)知推理,其粗獷式建設(shè)

模式不再完全適應(yīng)我國電力公司的發(fā)展需求。另一方

面對內(nèi)知識得不到貫通應(yīng)用,對外難以形成輔業(yè)公司

與外部行業(yè)主動支撐,使我國電力公司面臨著互聯(lián)網(wǎng)

轉(zhuǎn)型的困難。

為了輔助我國電力公司打破知識孤島,實現(xiàn)業(yè)務(wù)

協(xié)同和數(shù)據(jù)貫通。支撐電網(wǎng)與新興業(yè)務(wù)發(fā)展,專家學(xué)

者近年來在電力調(diào)度、電力運檢、電力營銷等諸多領(lǐng)

域提出了基于領(lǐng)域知識圖譜這一新興認(rèn)知方法的技術(shù)

路線和應(yīng)用案例。

在電力調(diào)度方面,專家學(xué)者的主流工作仍集中于

對自動語音識別(AutomaticSpeechRecognition,

ASR)、自然語言處理(NaturalLanguageProcessing,

NLP)和DKG技術(shù)的組合應(yīng)用。

例如,閃鑫等人提出基于人工智能的調(diào)度控制系

統(tǒng)框架,并對基于知識圖譜智能輔助決策與語音助手

開展研究;周帆等人多源電力調(diào)度模型知識構(gòu)建調(diào)度

領(lǐng)域知識圖譜,進(jìn)而實現(xiàn)圖譜內(nèi)本體相關(guān)問題的自然

語言理解與查詢語句拼接;劉廣一等人利用圖數(shù)據(jù)庫

對配電網(wǎng)拓?fù)溥M(jìn)行存儲,提出“電網(wǎng)一張圖”運營指

揮系統(tǒng)的平臺結(jié)構(gòu);喬驥等人基于DKG技術(shù)實現(xiàn)了故

障信息解析判別、智能輔助決策以及多維度人機交互,

驗證了數(shù)據(jù)與知識雙驅(qū)動的電網(wǎng)拓?fù)鋽?shù)據(jù)分析研究在

業(yè)務(wù)中落地應(yīng)用的可行性;高澤璞等人整合多個低壓

配電網(wǎng)信息系統(tǒng)中的數(shù)據(jù),挖掘各數(shù)據(jù)之間關(guān)系并構(gòu)

建出低壓配電網(wǎng)拓?fù)浣Y(jié)構(gòu),實現(xiàn)了對低壓配電網(wǎng)信息

系統(tǒng)中的戶變關(guān)系的辨識。

在電力運檢方面,由于近三總內(nèi)我們在電力系統(tǒng)

里面做了很多圖像識別、目標(biāo)檢測等智能巡檢的一些

研究工作,受電力巡檢影像基礎(chǔ)研究的影響,設(shè)備的

運維檢修板塊也是近年來比較新興的板塊。電力巡檢

影像分析等人工智能應(yīng)用的興起,為DKG的研究應(yīng)用

打下了良好基礎(chǔ)。專家學(xué)者以電力設(shè)備為核心,領(lǐng)域

知識圖譜相關(guān)的研究工作在細(xì)分業(yè)務(wù)點上相對深入。

例如,張敏杰等人基于語義網(wǎng)、知識圖譜及自然

語言處理等技術(shù),提出基于的框架以支撐變壓器智能

管理;趙振兵等人利用螺栓螺母之間的關(guān)聯(lián)組成栓母

對,采深度學(xué)習(xí)與先驗知識結(jié)合的方法建立知識圖譜,

以指導(dǎo)對栓母的缺陷分;劉梓權(quán)等人利用設(shè)備缺陷記

錄語料構(gòu)建電力知識圖譜,提出利用圖搜索進(jìn)行電力

設(shè)備缺陷檢索的方法;Tang等人提出面對多源異類電

力設(shè)備數(shù)據(jù)的設(shè)備缺陷知識圖譜構(gòu)建方法,改進(jìn)圖搜

索以展示檢索結(jié)果的期望信息;楊強等人則采用領(lǐng)域

知識圖譜整合展示電力設(shè)備全壽命周期數(shù)據(jù),揭示實

體與業(yè)務(wù)對象之間的關(guān)系;湯亞宸等人利用領(lǐng)域知識

圖譜進(jìn)行規(guī)則推理,實現(xiàn)涉及設(shè)備、廠家、站/線、公

司、質(zhì)量、事件的高效分析查詢。此外,趙振兵等人

提出建立具有一定普適性且專業(yè)較強的知識圖譜,通

過DKG實現(xiàn)跨媒體數(shù)據(jù)在知識層有機互補的創(chuàng)新提議,

提升輸電線路關(guān)鍵部件視覺檢測的能力。

在電力營銷方面,專家學(xué)者的研究工作暫時與其

他行業(yè)客服的主流技術(shù)路線基本一致,基于ASR、NLP

與DKG的技術(shù)組合實現(xiàn)電力客服業(yè)務(wù)中智能檢索、智

能問答、主動外呼能力的整體提升。

例如,饒竹一等人提出了基于知識圖譜的電力客

服知識庫構(gòu)建、檢索方法,設(shè)計形成智能客服系統(tǒng)技

術(shù)方案;Cheng等人結(jié)合電力客服的業(yè)務(wù)需求,提出

了集成客戶本體、數(shù)據(jù)本體以及推理引擎的三級電力

客服知識圖譜架構(gòu);梁林森等人則針對地方特色開展

了智能95598支撐技術(shù)研究;像天津、湖南等地,打

95598直接就接入智能語音機器人。南網(wǎng)現(xiàn)在也在探

索情感識別,用于判定在語音機器人進(jìn)行智能問答的

過程中,是否會對人的情感造成一些投訴的風(fēng)險。譚

剛等人針對基KG問答系統(tǒng)中存在的中文問題表達(dá)模

糊等問題,提出融合領(lǐng)域特征知識圖譜的電網(wǎng)客服問

答系統(tǒng),實現(xiàn)了以較低的響應(yīng)延遲提供高準(zhǔn)確率的回

答。然而,就總體而言,電力營銷領(lǐng)域中的DKG應(yīng)用

數(shù)據(jù)來源相對封閉,未能凸顯互聯(lián)網(wǎng)化運營理念;認(rèn)

知推理能力有待進(jìn)一步增強,亟待引入情感分析、多

輪對話等技術(shù)并使之固化形成業(yè)務(wù)能力。

03

電力領(lǐng)域知識表示與圖譜構(gòu)建L電力領(lǐng)域知識

表示知識圖譜技術(shù)作為一個工具落到某一個行業(yè)領(lǐng)域,

與普通的知識圖譜構(gòu)建或者是開放域的、開源的、廣域

的知識圖譜構(gòu)建到底存在什么樣的區(qū)別呢?由于電力

領(lǐng)域知識來源廣泛,有來自傳統(tǒng)的電力知識工程系統(tǒng)、

專家經(jīng)驗知識庫等的結(jié)構(gòu)化數(shù)據(jù),還有電力標(biāo)準(zhǔn)、制度、

法律、法規(guī)以及專家、技術(shù)人員的經(jīng)驗等半/非結(jié)構(gòu)化

數(shù)據(jù),可按照復(fù)用程度的差異劃分為通用知識和專用知

識兩大部分。

其中,例如部分電力設(shè)備的名稱、電壓等級、容量

以及單位組織架構(gòu)等信息在客服、調(diào)度、運檢、安質(zhì)等

多個業(yè)務(wù)領(lǐng)域均有需求,我們稱之為電力領(lǐng)域通用知識;

而客服領(lǐng)域中的用戶名稱、電費、電價等信息相對專用,

在調(diào)度、運檢、安質(zhì)等政務(wù)領(lǐng)域涉及概率很小,甚至完

全不會出現(xiàn),我們將之認(rèn)定為電力領(lǐng)域?qū)S弥R。值得

一提的是,電力領(lǐng)域通用知識與專用知識之間的界限往

往是模糊的,實際操作時需要根據(jù)實際業(yè)務(wù)進(jìn)行統(tǒng)計分

析以判定通用、專用知識之間的邊界。因此在概念層和

實例層之間我們還劃分了一個業(yè)務(wù)層,主要是電力行業(yè)

的一些動作知識。以檢修為例,電力設(shè)備部位部件的缺

陷信息勢必會涉及到檢修的操作,我們會把標(biāo)準(zhǔn)里面提

到的規(guī)則或規(guī)范性約束條件在業(yè)務(wù)層進(jìn)行存儲以開展

維修。接下來談一下數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)結(jié)構(gòu)本身其實包含

邏輯、組織結(jié)構(gòu)、操作、和約束。電力板塊跟傳統(tǒng)由結(jié)

構(gòu)數(shù)據(jù)的體量、特征沒有典型差異。唯有一點是電力板

塊去做知識圖構(gòu)建過程時,很多去西是物聯(lián)網(wǎng)的架閡,

網(wǎng)絡(luò)拓?fù)浜椭R圖譜的拓?fù)涫悄軌蛑睾系摹k娏υO(shè)備的

部位、部件相關(guān)的信息,天然就構(gòu)成了一個拓?fù)鋱D,完

全可以把這個拓?fù)溆成涞街R圖譜板塊,這是電力領(lǐng)域

應(yīng)用知識圖譜的一個最大優(yōu)勢。2.本體構(gòu)建領(lǐng)域知識

圖譜的本體構(gòu)建方法主要包括由知識驅(qū)動的自頂向下

(Top-down)式、由數(shù)據(jù)驅(qū)動的自底向上(Bottom-up)

式以及兩者的組合方式。其中,自頂向下式是指通過業(yè)

務(wù)專家人工編制或利用已有的結(jié)構(gòu)化知識庫獲取電力

領(lǐng)域知識本體的結(jié)構(gòu)信息,進(jìn)而將知識本體加入到知識

庫;自底向上式則是指從開放非結(jié)構(gòu)化數(shù)據(jù)中提取實體、

概念、關(guān)系、屬性、屬性值等信息,選取置信度高的對

象作為候選,分析歸納成底層結(jié)構(gòu)信息,逐層向上最終

形成知識本體并加入到知識庫。電力領(lǐng)域數(shù)據(jù)來源廣泛,

傳統(tǒng)電力知識工程系統(tǒng)、專家經(jīng)驗知識庫等結(jié)構(gòu)化數(shù)據(jù),

可直接用來指導(dǎo)知識圖譜本體自頂向下的構(gòu)建。同時,

電力領(lǐng)域?qū)嶋H業(yè)務(wù)中所產(chǎn)生的各類數(shù)據(jù)以及專家、技術(shù)

人員的主觀經(jīng)驗等半/非結(jié)構(gòu)化的數(shù)據(jù)也蘊含了豐富的

電力領(lǐng)域行業(yè)知識,為確保知識圖譜本體的完備性,利

用信息提取技術(shù)對此類數(shù)據(jù)中的電力知識加以識別,并

對識別的結(jié)果進(jìn)行歸納抽象,最終將抽象出的概念映射

或補充到電力領(lǐng)域知識圖譜本體中,從而實現(xiàn)本體自底

向上的構(gòu)建。自頂向下、自底向上結(jié)合的本體構(gòu)建方式,

既能夠傳承固化電力領(lǐng)域現(xiàn)有數(shù)據(jù)庫中的相關(guān)經(jīng)驗知

識,乂能實現(xiàn)對新知識的發(fā)現(xiàn),故在實際構(gòu)建電力領(lǐng)域

知識圖譜本體時,通常采取兩種方式相結(jié)合的方法。目

前國網(wǎng)公司、南網(wǎng)公司和大唐等能源企業(yè),用top-down

這種形式居多,即在業(yè)務(wù)專家進(jìn)行指導(dǎo)下直接去構(gòu)建相

關(guān)的知識圖譜本體框架。主要是因為這樣的構(gòu)建方法有

兩方面的優(yōu)勢,第一方面優(yōu)勢是多年的運營過程,能源

企業(yè)都做了一些信息化系統(tǒng),這些信息化系統(tǒng)的背后有

數(shù)據(jù)結(jié)構(gòu)表單,表單本來就已經(jīng)形成了電力領(lǐng)域知識圖

譜,可以參考數(shù)據(jù)結(jié)構(gòu)的架構(gòu);此外就是在圖譜本體構(gòu)

建過程中,像電力的營銷領(lǐng)域、調(diào)度領(lǐng)域、運檢領(lǐng)域,

有一些營銷客服話術(shù),運檢調(diào)度的一些應(yīng)急響應(yīng)預(yù)案,

自然就是事件和動作相關(guān)聯(lián)的,出現(xiàn)什么事件怎么樣去

做或出現(xiàn)什么樣的trigger怎樣去做響應(yīng)等,這些都是

構(gòu)建電力領(lǐng)域事件圖譜非常好的素材。

04

電力領(lǐng)域知識圖譜的應(yīng)用實踐L領(lǐng)域知識圖譜

應(yīng)用架構(gòu)在電力領(lǐng)域知識圖譜構(gòu)建中,我們發(fā)現(xiàn)知識圖

譜作為一種語義網(wǎng)絡(luò),在電力大數(shù)據(jù)的賦能下誠然已經(jīng)

能夠解決許多實際問題;但單純依靠知識圖譜技術(shù)并不

能完全響應(yīng)我國能源互聯(lián)網(wǎng)的數(shù)據(jù)特征與發(fā)展趨勢,難

以表達(dá)電力系統(tǒng)中涉及到的豐富語義,因而充分利用現(xiàn)

有知識工程資源,并不能將其視為一劑包治百病的“萬

能藥”。而應(yīng)將知識圖譜作為實現(xiàn)低成本、快速響應(yīng)的

部署和轉(zhuǎn)換,為電網(wǎng)公司帶來收益的最大化。一方面,

在調(diào)度、運檢、安質(zhì)等業(yè)務(wù)領(lǐng)域中存在著豐富的if-then

規(guī)則信息,不易利用領(lǐng)域知識圖譜表達(dá)。特別是對于

ifAandBthenC等并發(fā)事件規(guī)則,其條件部分的子

表達(dá)式之間的關(guān)系可以出現(xiàn)部分極為復(fù)雜的情況,利用

領(lǐng)域知識圖譜難以表達(dá)。同時,電力行業(yè)公司中存在大

量的if-then規(guī)則信息乃至其他知識表示規(guī)則下的信

息已經(jīng)在過往的信息化工程建設(shè)中被維護在了專家知

識系統(tǒng)中,亦或已經(jīng)突破了知識圖譜技術(shù)的原有范圍。

知識圖譜傳統(tǒng)的研究往往是去做最優(yōu)路徑搜索研究,去

發(fā)現(xiàn)最優(yōu)通路,但是很難找到兩個起點緊接到最終一個

終點這樣的路徑。這種需求以前的研究里面很少涉及。

解決方案有兩種,第一種的是改變這個知識圖譜的

schema,讓兩個起點一個終點的這種情況變成從一個起

點出發(fā),必須過某種屬性的一個節(jié)點,最終到達(dá)終點,

這樣就把剛才說這個ifaandbthenc變成了ifaand

bareconfirmedthenc這種方式。第二種方案是,

不去做最優(yōu)路徑搜索,而是做圖結(jié)構(gòu)分析,或者圖分類

任務(wù)。若能利用領(lǐng)域知識圖譜輔助與引導(dǎo)對專家知識系

統(tǒng)中知識元進(jìn)行合理“利舊”,對新生知識元進(jìn)行基于

Seq2Seq等數(shù)據(jù)驅(qū)動算法模型的“求新”,將有助于人

們短、平、快的解決更多的實際同題。另一方面,能源

互聯(lián)網(wǎng)的數(shù)據(jù)特征及其互聯(lián)網(wǎng)化的發(fā)展趨勢,注定其中

的數(shù)據(jù)、知識將逐步區(qū)別于傳統(tǒng)電網(wǎng)數(shù)據(jù),呈現(xiàn)出顯著

的動態(tài)、隱形、主觀等特性。知識圖譜技術(shù)側(cè)重于表達(dá)

實體、概念之間的語義關(guān)聯(lián),而上述語義關(guān)聯(lián)大多是靜

態(tài)的、顯性的、客觀的、明確的,而實際應(yīng)用中對過程

性、決策性知識是有著大量需求的,這些知識大部分是

動態(tài)的、隱形的、帶有一定主觀性的,如規(guī)劃設(shè)計、發(fā)

展決策、運檢決策、調(diào)度決策等。雖然一線的工作人員

與專家能夠憑借自己工作所得或口耳相傳的經(jīng)驗完成

本職工作,但單就其中部分業(yè)務(wù)的內(nèi)在規(guī)則而言仍是模

糊的。部分電力行業(yè)公司曾提出以標(biāo)準(zhǔn)化或激勵制度的

方式促進(jìn)企業(yè)內(nèi)的知識表達(dá)與沉淀,但收效甚微。其關(guān)

鍵問題在于一線員工、工程師、研究員等領(lǐng)域?qū)<乙搽y

以清晰的對相關(guān)知識進(jìn)行表達(dá)。傳統(tǒng)知識工程通過專業(yè)

的知識工程師協(xié)助領(lǐng)域?qū)<疫M(jìn)行知識獲取,但總體上的

代價太大,過程太重,不易成功,有賴于數(shù)據(jù)驅(qū)動的知

識挖掘技術(shù)的引入與應(yīng)用。因此,我們提出了基于NoDKG

思想的電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)。通過結(jié)合使用圖數(shù)

據(jù)庫與關(guān)系型數(shù)據(jù)庫,合理劃分結(jié)構(gòu)化、半結(jié)構(gòu)化、非

結(jié)構(gòu)化數(shù)據(jù)的存儲與調(diào)用方式,解釋了框架如何應(yīng)對動

態(tài)、隱形、主觀性的知識,提供了一種領(lǐng)域知識圖譜與

現(xiàn)有專家數(shù)據(jù)庫有機融合的途徑。

基于NoDKG的電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)覆蓋數(shù)

據(jù)獲取、圖譜構(gòu)建、知識計算以及圖譜應(yīng)用等四個層

級。

第一層是數(shù)據(jù)獲取,屬于框架的底層。獲取對象

包括結(jié)構(gòu)化數(shù)據(jù)信息、半結(jié)構(gòu)化的和非結(jié)構(gòu)化數(shù)據(jù)信

息。此外還有電網(wǎng)公司企業(yè)之外引入的數(shù)據(jù)。比如進(jìn)

行電力巡檢過程中,關(guān)注電網(wǎng)公司內(nèi)部的標(biāo)準(zhǔn)制度之

外,還要去關(guān)注國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、IEEE或者ITU

等國際標(biāo)準(zhǔn)。這些就屬于是外部信息,再比如進(jìn)行設(shè)

備的采購、運維、檢修的過程中,對設(shè)備廠商的需求,

可能會對天眼查、企查查等企業(yè)之間的關(guān)朕、穿透關(guān)

系、股權(quán)分析有數(shù)據(jù)需求??傮w來講,數(shù)據(jù)獲取層一

般都是以excel、csv或者json、xml等文件進(jìn)行導(dǎo)入、

讀取和存儲,然后把它解析成概念、實體、關(guān)系,還

有屬性、事件等相關(guān)的知識源。

第二層是圖譜構(gòu)建層,作為電力領(lǐng)域知識圖譜應(yīng)

用架構(gòu)的核心層承載自然語言處理、知識抽取、知識

融合以及知識加工能力。同時,規(guī)范要求采用圖數(shù)據(jù)

庫存儲實體(屬性值)、概念、關(guān)系(屬性)、事件并實

現(xiàn)多對多關(guān)系管理,通常涉及Neo4j等面向?qū)傩詧D的

存儲系統(tǒng)或gStore等面向RDF圖的存儲系統(tǒng)兩大類別;

采用關(guān)系型數(shù)據(jù)庫管理文件、視頻、圖像、音頻等多

媒體數(shù)據(jù)以及一對多關(guān)系,并通過“id_name”連接彼

此。其中,可考慮將關(guān)系型數(shù)據(jù)庫的“id”、“name”

等變量信息作為屬性值存儲在圖數(shù)據(jù)庫內(nèi)的領(lǐng)域知識

圖譜中,用以實現(xiàn)對高效檢索、認(rèn)知推理的能力支撐。

第三層是知識計算層,負(fù)責(zé)集成表示學(xué)習(xí)、關(guān)系

推理、屬性推理、事件推理、路仔計算、比較排序等

通用算法模型,為圖譜應(yīng)用層提供算法支撐。

第四層圖譜應(yīng)用層,負(fù)責(zé)提供智能搜索、智能問

答、智能推理、智能決策、知識處理及第三方應(yīng)用,

作為電力領(lǐng)域知識圖譜應(yīng)用架構(gòu)所產(chǎn)出的最終功能模

塊與實際應(yīng)用場景進(jìn)行對接。

2.領(lǐng)域知識圖譜應(yīng)用實踐-電力調(diào)度故障處理

在電網(wǎng)調(diào)度業(yè)務(wù)中,采用調(diào)度故障處置管理規(guī)定、

故障處置預(yù)案、調(diào)度規(guī)程及異常監(jiān)控手冊等文本數(shù)據(jù)

以及從D5000系統(tǒng)導(dǎo)出的結(jié)構(gòu)化數(shù)據(jù),根據(jù)一線調(diào)度

人員的業(yè)務(wù)經(jīng)驗與業(yè)務(wù)規(guī)則,自上而下的搭建基礎(chǔ)本

體架構(gòu),然后利用概念抽取工具及關(guān)系抽取模型進(jìn)行

自動化識別,識別結(jié)果經(jīng)業(yè)務(wù)專家抽象校驗后形成自

下而上的類別體系,與基礎(chǔ)本體架構(gòu)融合,構(gòu)建最終

的電力調(diào)度知識本體架構(gòu)。基于本體架構(gòu),利用

Bi-LSTM-CRF模型實現(xiàn)調(diào)度故障實體識別及屬性抽取,

根據(jù)電網(wǎng)故障數(shù)據(jù)特征,利用Bi-LSTM+Attention模

型進(jìn)行關(guān)系抽取及分類,經(jīng)實體鏈接與知識補全后,

實現(xiàn)電力調(diào)度領(lǐng)域知識圖譜構(gòu)建。

一般我們會畫如下的一個架構(gòu)示意圖。首先包括

了調(diào)度相關(guān)的文本數(shù)據(jù),如調(diào)度、調(diào)規(guī)、應(yīng)急預(yù)案、

調(diào)度細(xì)則、調(diào)度報告。此外,也會去存電網(wǎng)故障數(shù)據(jù)、

調(diào)度系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),進(jìn)行結(jié)構(gòu)化和半結(jié)構(gòu)化的文

本解析,解析之后共同形成調(diào)度領(lǐng)域的知識圖譜。非

結(jié)構(gòu)化數(shù)據(jù)的我們會采取mysql或者sql存儲,進(jìn)行

圖結(jié)構(gòu)數(shù)據(jù)和關(guān)系性數(shù)據(jù)庫的聯(lián)調(diào),聯(lián)調(diào)之后共同作

用于相關(guān)的故障處置判斷,包括電網(wǎng)的異常情況、故

障類別的分類,還有設(shè)備故障的溯源,故障原因的分

析。最后進(jìn)行故障處置,包括信息的匯總、負(fù)荷的轉(zhuǎn)

移、事故的拉路,試送的恢復(fù)等,最終把這些功能模

塊進(jìn)行前端人機功能展示,形成業(yè)務(wù)能力。

3?領(lǐng)域知識圖譜應(yīng)用實踐-電力運檢工單處理在電

力運檢業(yè)務(wù)中,使用輸電架空線路工程臺賬、工單、工

作票、修試記錄等業(yè)務(wù)數(shù)據(jù)以及檢修相關(guān)標(biāo)準(zhǔn)文檔,根

據(jù)一線檢修人員的業(yè)務(wù)經(jīng)驗與標(biāo)準(zhǔn)文檔中所述業(yè)務(wù)規(guī)

則,人工構(gòu)建了覆蓋設(shè)備、部件、部位、缺陷、故障、

描述、原因、解決方案、場/站/線、單位、人員、持票

種類等信息在內(nèi)的輸電架空線路工程運檢知識基礎(chǔ)本

體架構(gòu),然后利用自動化抽取工具進(jìn)行知識提取,運檢

業(yè)務(wù)專家對提取結(jié)果進(jìn)行審核抽象后,自底向上形成一

套知識體系,該體系與基礎(chǔ)本體架構(gòu)融合形成輸電架空

線路工春運檢知識本體架構(gòu)?;谶\檢知識本體架溝,

采用Bi-LSTM-CRF.Bi-GRU-CRF等算法,由業(yè)務(wù)數(shù)捱與

標(biāo)準(zhǔn)文檔中實現(xiàn)自底而上式的圖譜構(gòu)建。

工單是指巡視人員去現(xiàn)場看了哪些設(shè)備,存在哪些

故障,會把故障信息記錄下來形成一個工單。工單會交

給后面的檢修人員去進(jìn)行相關(guān)的設(shè)備檢修維護。檢修人

員拿到工單之后會開出工作票,工作票記錄比如哪個設(shè)

備壞了,應(yīng)該如何去修。工作票派發(fā)給一線工作人員到

場站線進(jìn)行維修操作。修完后會形成一個檢修測試記錄。

這三個表單之間是順承的關(guān)系,工單和工作票往往是一

對一或一對多的關(guān)系,而工作票和修試記錄往往是一對

一的關(guān)系。如果整個修試記錄完成了工單所有內(nèi)容,那

么在檢修業(yè)務(wù)上就進(jìn)行了一個閉環(huán)。人工去構(gòu)建運檢領(lǐng)

域的知識圖譜過程中,會涉及到設(shè)備部位、部件缺陷、

故障以及相關(guān)描述、原因、解決方案、場站線信息,單

位人員持票等相關(guān)信息,然后自上而下形成一個知識體

系,相當(dāng)于去做了一個top-down的schema構(gòu)建,之后

相關(guān)的數(shù)據(jù)就可以去用實體、關(guān)系分類模型去把它通過

數(shù)據(jù)訓(xùn)練模型,直接生成圖譜了。工作票的生產(chǎn)過程中

也可以去做一些病因的分析,包括故障的溯源、智能處

置和標(biāo)準(zhǔn)的推薦。例如制造設(shè)備出現(xiàn)了一個故障信息之

后,就能知道去哪個標(biāo)準(zhǔn)里面查,標(biāo)準(zhǔn)應(yīng)該是采用哪一

條,以及設(shè)備故障的可能原因等等。工作票生成之后進(jìn)

行一個修試記錄比對。我們團隊采用ASR去做語音數(shù)據(jù)

的轉(zhuǎn)寫,相當(dāng)于是現(xiàn)場的人員通過語音錄入的形式,把

自己完成這個工作的信息進(jìn)行記錄,屬于管理上留痕的

操作。此后轉(zhuǎn)出來文本再去進(jìn)行語義比對,看他有沒有

對這個工作票工單的信息進(jìn)行響應(yīng),進(jìn)而形成人際交互

的響應(yīng)。4.領(lǐng)域知識圖譜應(yīng)用實踐-電力客服智能問答

在電力客服業(yè)務(wù)中,利用95598客服知識庫標(biāo)準(zhǔn)問、坐

席客服記錄、對話語音等業(yè)務(wù)數(shù)捱,根據(jù)一線客服人員

的業(yè)務(wù)經(jīng)驗及客服話術(shù)流程所述業(yè)務(wù)規(guī)則,結(jié)合自動化

知識抽取工具與業(yè)務(wù)專家相結(jié)合的方式自底向上構(gòu)建

的電力客服知識體系,構(gòu)建形成電力客服知識本體架構(gòu)。

進(jìn)而,利用基于置信度傳播的概念抽取模型以及

Bi-LSTM-CRF模型實現(xiàn)客服領(lǐng)域?qū)嶓w識別;利用基于概

率因子圖模型的實體多關(guān)系聯(lián)合挖掘模型抽取關(guān)系,并

采用實體-主題模型和主動學(xué)習(xí)的層次學(xué)習(xí)算法實現(xiàn)關(guān)

系的分類,經(jīng)知識融合和知識校驗后,實現(xiàn)電力客服知

識圖譜構(gòu)建。

05

電力領(lǐng)域知識圖譜的未來挑戰(zhàn)

1.應(yīng)用方向

首先從業(yè)務(wù)需求方向來講,為全面推進(jìn)傳統(tǒng)電力行

業(yè)的互聯(lián)網(wǎng)化進(jìn)程,電網(wǎng)公司勢必會在未來幾年內(nèi)跟服

務(wù)業(yè)公司加強聯(lián)系,同時與房地產(chǎn)、電商、家電、保險

等行業(yè)開展跨行業(yè)合作,電力領(lǐng)域知識應(yīng)用會更加開放。

相應(yīng)的,技術(shù)需求會有以下四大類:

智能搜索

知識圖譜是語義搜索的大腦,智能語義搜索借助知

識圖譜的幫助,對用戶查詢關(guān)鍵字進(jìn)行解析和推理,將

其映射到知識圖譜中的一個或一組節(jié)點上,并根據(jù)知識

圖譜中層次結(jié)構(gòu),返回相關(guān)知識。智能語義搜索由谷歌

提出后,在行業(yè)內(nèi)得到廣泛應(yīng)用。百度的“知心”、搜

狗的“知立方”,利用知識圖譜技術(shù)提升用戶開放域知

識搜索體驗,而國網(wǎng)英大推出的中國電力百科網(wǎng)、中國

電科院在研的智能標(biāo)準(zhǔn)制度檢索系統(tǒng),則用以支持電力

領(lǐng)域百科、標(biāo)準(zhǔn)知識的快速獲取。隨著電力企業(yè)內(nèi)外業(yè)

務(wù)部的服務(wù)渠道越來越多,智能搜索也將擁有更廣闊的

應(yīng)用前景,比如支撐電力用戶進(jìn)行電費電價政策檢索、

調(diào)度領(lǐng)域員工進(jìn)行故障知識的查詢等。

智能推薦

推薦系統(tǒng)是人與信息的連接器,用已有的連接去預(yù)

測未來用戶和物品之間會出現(xiàn)的連接。推薦系統(tǒng)本質(zhì)上

處理的是信息,它的主要作用是在信息生產(chǎn)方和信息消

費方之間搭建志橋梁,從而獲取人的注意力“推薦系統(tǒng)

作為互聯(lián)網(wǎng)和電子商務(wù)發(fā)展的新興產(chǎn)物,在電力行業(yè)公

司中大多應(yīng)用于客服、電商以及傳媒業(yè)務(wù)。此外,中國

電科院還采用領(lǐng)域知識圖譜開展了專家遴選技術(shù)的相

關(guān)研究,以支持國家電網(wǎng)有限公司的科技項目評審業(yè)務(wù)。

基于領(lǐng)域知識圖譜的智能推薦在電力系統(tǒng)的應(yīng)用市場

極為廣闊,從總體上劃分為基于個體評價的智能推薦與

基于群體規(guī)律的智能推薦兩個類別。

智能問答

智能問答可以看做是一種信息檢索的高級模式,系

統(tǒng)將知識圖譜看做成一個完備的知識庫,首先對自然語

言表示的句子進(jìn)行分析,將問題轉(zhuǎn)化成對知識圖譜的查

詢,然后在知識圖譜中查詢答案并返回?;谥R圖譜

的智能問答應(yīng)用廣泛,如亞馬遜的自然語言助手Evi、

蘋果智能語音助手Siri和出門問問手機應(yīng)用等,覆蓋

了出行、電商、手機等多個行業(yè)。此外,國網(wǎng)客服中心

在研的基于知識圖譜的客服智能問答系統(tǒng),有效地提升

了工作效率,降低人工參與成本。

智能問答不僅在公司內(nèi)部業(yè)務(wù)場景應(yīng)用廣泛,其在

輔業(yè)公司業(yè)務(wù)中也具有多樣化的潛在應(yīng)用。比如在電力

保險行業(yè)、金融行業(yè)進(jìn)行復(fù)雜業(yè)務(wù)知識解答,在電動汽

車行業(yè)進(jìn)行交通信息查詢。

智能決策

智能決策是指結(jié)合人工智能和知識工程,更充分地

應(yīng)用描述性知識、過程性知識、推理性知識,進(jìn)而通過

邏輯推理來幫助解決復(fù)雜決策問題的輔助決策。目前,

在電力行業(yè)運檢、調(diào)度以及科技等多個業(yè)務(wù)領(lǐng)域均已開

展了針對基于領(lǐng)域知識圖譜的智能決策的理論探索與

技術(shù)研究工作。中國電科院基于上述理論構(gòu)建了輸變電

運檢領(lǐng)域知識管理與認(rèn)知推埋平臺與科技項目輔助決

策系統(tǒng),實現(xiàn)工作票智能生成、修試記錄智能比對、科

技項目查重。

隨著諸多專家學(xué)者對電力跨媒體數(shù)據(jù)研究的不斷

深入,基于領(lǐng)域知識圖譜的智能決策未來有望進(jìn)一步在

電力行業(yè)調(diào)度、配網(wǎng)運檢、綜合能源管控以及需求側(cè)響

應(yīng)等方面嶄露鋒芒。

2.未來挑戰(zhàn)

挑戰(zhàn)一:混雜數(shù)據(jù)下的知識提取與圖譜構(gòu)建

從電力系統(tǒng)中獲取的知識通常具有信息廣泛性、多

源異構(gòu)特性,且有時伴有歧義、噪聲與冗余。對于知識

圖譜而言,歧義表現(xiàn)為實體、概念的屬性描述缺乏精確

性、一致性或?qū)嶓w間關(guān)系錯置、扭曲,使得圖譜結(jié)構(gòu)混

亂及語義描述相互沖突,可能導(dǎo)致推理機制紊亂、推理

結(jié)果失真;噪聲作為互聯(lián)網(wǎng)化數(shù)據(jù)的顯著特征,一定程

度上稀釋了數(shù)據(jù)信息內(nèi)容和價值密度;而冗余則表現(xiàn)為

在圖譜中產(chǎn)生大量孤立、無用的實體和屬性關(guān)系,占據(jù)

大量的存儲空間和關(guān)系路徑,使圖譜實體層變得冗余、

繁雜,導(dǎo)致存儲資源的浪費和圖譜推理應(yīng)用的低效。如

何將電力領(lǐng)域知識元與互聯(lián)網(wǎng)大數(shù)據(jù)有機融合起來,構(gòu)

建、更新大規(guī)模、結(jié)構(gòu)清晰、可解釋的電力領(lǐng)域知識圖

譜,并賦能使之在混雜數(shù)據(jù)下自主進(jìn)化,是實現(xiàn)電力系

統(tǒng)智能化發(fā)展的必由之路。

挑戰(zhàn)二:電網(wǎng)拓?fù)湎碌恼J(rèn)知推理與輔助決策

目前,領(lǐng)域知識圖譜技術(shù)已經(jīng)在運檢、調(diào)度、客服

等業(yè)務(wù)中實現(xiàn)初步應(yīng)用?,F(xiàn)有的知識推理模型往往需要

大量高質(zhì)量的樣本進(jìn)行訓(xùn)練,獲取樣本成本較大。而專

家以及一線工作人員則可以依據(jù)先驗知識與小樣本數(shù)

據(jù)對于電力拓?fù)湟约斑\行數(shù)據(jù)進(jìn)行分析判斷。另一方面,

現(xiàn)有的知識推理實現(xiàn)方式,可解決大部分領(lǐng)域和業(yè)務(wù)場

景的復(fù)雜計算需求,但對于計算資源和存儲資源的占用

較大,且現(xiàn)有算法效率存在瓶頸,應(yīng)用到電網(wǎng)系統(tǒng)大規(guī)

模數(shù)據(jù)時往往無法滿足實時、準(zhǔn)實時或及時的計算決策

要求。如何在領(lǐng)域知識圖譜框架下實現(xiàn)對電網(wǎng)拓?fù)鋽?shù)據(jù)

等原生數(shù)據(jù)的高效利用,仍是為了推動數(shù)據(jù)-知識雙驅(qū)

動的電力智能信息處理系統(tǒng)發(fā)展的必要研究。

挑戰(zhàn)三:領(lǐng)域知識圖譜的質(zhì)量評價體系

對領(lǐng)域知識圖譜的質(zhì)量評價,大多針對實體、關(guān)系、

屬性三類數(shù)據(jù),通過構(gòu)建標(biāo)準(zhǔn)測試集或人工抽樣的方式

實現(xiàn)。中國電子技

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論