日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺

睿治作為國內功能最全的數(shù)據(jù)治理產品之一,入選IDC企業(yè)數(shù)據(jù)治理實施部署指南。同時,在IDC發(fā)布的《中國數(shù)據(jù)治理市場份額》報告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場份額第一。

談元鵬:電力領域知識圖譜技術進展與應用實踐

時間:2022-05-12來源:顧我心安。瀏覽數(shù):646

電力系統(tǒng)作為一種資產龐雜、知識密集的電能生產與消費系統(tǒng),支撐著多種能源的轉換、互聯(lián)、傳輸、交互,涉及發(fā)、輸、變、配、用等多個領域的系統(tǒng)性知識。

分享嘉賓:談元鵬?中國電力科學研究院編輯整理:monk 國家管網出品平臺:DataFunTalk導讀:知識圖譜相關技術在開發(fā)和應用過程中,通常需要跟行業(yè)或者業(yè)務領域進行高度融合。但是在行業(yè)知識圖譜構建過程中,無法把傳統(tǒng)行業(yè)和IT部門或知識圖譜團隊進行簡單對接,導致數(shù)據(jù)標注及知識的消化理解比較困難,難以形成如圖像識別一樣的知識高能力應用。行業(yè)知識圖譜的構建往往需要行業(yè)和技術人員雙方彼此的溝通對接,中國電力科學研究院有限公司人工智能應用研究所就充當了一個行業(yè)和技術的對接橋梁角色,嘗試構建了一套電力領域知識圖譜。下面將從5個方面介紹電力知識圖譜的構建:

人工智能應用所簡介

電力知識工程的背景、內核及發(fā)展歷程

電力領域知識表示與圖譜構建

電力領域知識圖譜的應用實踐

電力領域知識圖譜的未來挑戰(zhàn)

01

人工智能應用所簡介

人工智能應用研究所(人工智能所)成立于2018年,是國家電網有限公司唯一人工智能應用技術的重要研究和支撐機構,聚焦電力領域智能感知、大數(shù)據(jù)、智能平臺、智能認知和智能應用五大研究方向,全面支撐電力人工智能應用類技術的科研攻關和推廣應用。下設智能感知研究室、大數(shù)據(jù)應用研究室、平臺技術研究室、智能認知研究室、智能技術應用研究室5個專業(yè)研究室,以及綜合管理辦公室1個管理部門。人工智能所擁有員工近70人,平均年齡32.7歲,碩士及以上學歷占比100%、博士占比34%。本人是來自于智能認知室的技術負責人,智能認知研究室主要做的是圖像識別、知識圖譜、圖計算技術,包括設備的故障診斷等方面的研究。此外,我們所還承擔了中國電機工程學會人工智能專委會、中電聯(lián)人工智能標準化技術委員會、IEEEPES人工智能分委會、中國人工智能學會智慧能源專委會,以及中國人工智能產業(yè)發(fā)展聯(lián)盟(AIIA)掛靠工作。建立了各類電力人工智能科研平臺,借此打造了一個比較好的電力人工智能的學術平臺和科研平臺,為電力人工智能學術生態(tài)奠定了基礎。

02

電力知識工程的背景、內核及發(fā)展歷程

電力系統(tǒng)作為一種資產龐雜、知識密集的電能生產與消費系統(tǒng),支撐著多種能源的轉換、互聯(lián)、傳輸、交互,涉及發(fā)、輸、變、配、用等多個領域的系統(tǒng)性知識。我們做過很多知識工程,但以前的知識工程都集中通過專家經驗去構建一些專家系統(tǒng),以實現(xiàn)規(guī)則化或者邏輯化的表征。

近年來,隨著我國能源互聯(lián)網企業(yè)建設進程的逐步推進,電力領域知識體系愈發(fā)呈現(xiàn)出開放式、扁平化、邊界模糊的發(fā)展趨勢,進一步加劇了電力系統(tǒng)智能認知的復雜性。亟待引入知識圖譜這一新興工程技術,以結構化方式刻畫電力系統(tǒng)中的概念、實體、事件及其間的關系,推動電力人工智能有序發(fā)展。

領域知識圖譜作為一個復雜的因果網絡,其中設備、人員、單位、事件、動作都是普遍關聯(lián)的。這導致在知識圖譜中沿著任意一個實體開展語義推理分析均容易超出預想的知識邊界。之前有些電力專家提出過電網天然一張圖的思想。從人的角度來講,人最大的網絡是社交網絡。從實物的角度講,電網包括涉及到的電力設備、場站、線路設備的部位部件等,其實也是一個真實存在的龐大天然物聯(lián)網,因此成為了特別適合用圖結構去表征的試驗場地。行業(yè)專家與學者普遍認為:知識圖譜在集中應用簡單的場景更加易于成功,而智能客服、智能推薦等領域的應用成功實例也在一定程度上歸功于其知識體系相對封閉。

因而,領域知識圖譜在電力系統(tǒng)中成功應用的一大先決條件是電力領域知識的需求細化、閉合,即能找到一個有限的知識子集支撐電力領域的特定應用需求。也就是說,我們能在電力領域需求的知識里面找到一個閉包子集,去特定化相關需求,才能把知識圖譜及相關應用做好。

在過去的三十余年間,電力公司圍繞著調度、運檢、營銷、基建和物資等各業(yè)務部門所提報的業(yè)務需求,進行了知識工程的開發(fā),旨在實現(xiàn)由數(shù)據(jù)到知識、由感知到認知的提升。然而,傳統(tǒng)信息化工程產物仍處于對電力數(shù)據(jù)和知識簡單應用,缺乏對知識體系的全面把握,缺乏對電力業(yè)務認知推理,其粗獷式建設模式不再完全適應我國電力公司的發(fā)展需求。另一方面對內知識得不到貫通應用,對外難以形成輔業(yè)公司與外部行業(yè)主動支撐,使我國電力公司面臨著互聯(lián)網轉型的困難

為了輔助我國電力公司打破知識孤島,實現(xiàn)業(yè)務協(xié)同和數(shù)據(jù)貫通。支撐電網與新興業(yè)務發(fā)展,專家學者近年來在電力調度電力運檢電力營銷等諸多領域提出了基于領域知識圖譜這一新興認知方法的技術路線和應用案例。

在電力調度方面,專家學者的主流工作仍集中于對自動語音識別(Automatic Speech Recognition, ASR)、自然語言處理(Natural Language Processing, NLP)和DKG技術的組合應用。

例如,閃鑫等人提出基于人工智能的調度控制系統(tǒng)框架,并對基于知識圖譜智能輔助決策與語音助手開展研究;周帆等人多源電力調度模型知識構建調度領域知識圖譜,進而實現(xiàn)圖譜內本體相關問題的自然語言理解與查詢語句拼接;劉廣一等人利用圖數(shù)據(jù)庫對配電網拓撲進行存儲,提出“電網一張圖”運營指揮系統(tǒng)的平臺結構;喬驥等人基于DKG技術實現(xiàn)了故障信息解析判別、智能輔助決策以及多維度人機交互,驗證了數(shù)據(jù)與知識雙驅動的電網拓撲數(shù)據(jù)分析研究在業(yè)務中落地應用的可行性;高澤璞等人整合多個低壓配電網信息系統(tǒng)中的數(shù)據(jù),挖掘各數(shù)據(jù)之間關系并構建出低壓配電網拓撲結構,實現(xiàn)了對低壓配電網信息系統(tǒng)中的戶變關系的辨識。

在電力運檢方面,由于近三年內我們在電力系統(tǒng)里面做了很多圖像識別、目標檢測等智能巡檢的一些研究工作,受電力巡檢影像基礎研究的影響,設備的運維檢修板塊也是近年來比較新興的板塊。電力巡檢影像分析等人工智能應用的興起,為DKG的研究應用打下了良好基礎。專家學者以電力設備為核心,領域知識圖譜相關的研究工作在細分業(yè)務點上相對深入。

例如,張敏杰等人基于語義網、知識圖譜及自然語言處理等技術,提出基于的框架以支撐變壓器智能管理;趙振兵等人利用螺栓螺母之間的關聯(lián)組成栓母對,采深度學習與先驗知識結合的方法建立知識圖譜,以指導對栓母的缺陷分;劉梓權等人利用設備缺陷記錄語料構建電力知識圖譜,提出利用圖搜索進行電力設備缺陷檢索的方法;Tang等人提出面對多源異類電力設備數(shù)據(jù)的設備缺陷知識圖譜構建方法,改進圖搜索以展示檢索結果的期望信息;楊強等人則采用領域知識圖譜整合展示電力設備全壽命周期數(shù)據(jù),揭示實體與業(yè)務對象之間的關系;湯亞宸等人利用領域知識圖譜進行規(guī)則推理,實現(xiàn)涉及設備、廠家、站/線、公司、質量、事件的高效分析查詢。此外,趙振兵等人提出建立具有一定普適性且專業(yè)較強的知識圖譜,通過DKG實現(xiàn)跨媒體數(shù)據(jù)在知識層有機互補的創(chuàng)新提議,提升輸電線路關鍵部件視覺檢測的能力。

在電力營銷方面,專家學者的研究工作暫時與其他行業(yè)客服的主流技術路線基本一致,基于ASR、NLP與DKG的技術組合實現(xiàn)電力客服業(yè)務中智能檢索、智能問答、主動外呼能力的整體提升。

例如,饒竹一等人提出了基于知識圖譜的電力客服知識庫構建、檢索方法,設計形成智能客服系統(tǒng)技術方案;Cheng等人結合電力客服的業(yè)務需求,提出了集成客戶本體、數(shù)據(jù)本體以及推理引擎的三級電力客服知識圖譜架構;梁林森等人則針對地方特色開展了智能95598支撐技術研究;像天津、湖南等地,打95598直接就接入智能語音機器人。南網現(xiàn)在也在探索情感識別,用于判定在語音機器人進行智能問答的過程中,是否會對人的情感造成一些投訴的風險。譚剛等人針對基KG問答系統(tǒng)中存在的中文問題表達模糊等問題,提出融合領域特征知識圖譜的電網客服問答系統(tǒng),實現(xiàn)了以較低的響應延遲提供高準確率的回答。然而,就總體而言,電力營銷領域中的DKG應用數(shù)據(jù)來源相對封閉,未能凸顯互聯(lián)網化運營理念;認知推理能力有待進一步增強,亟待引入情感分析、多輪對話等技術并使之固化形成業(yè)務能力。

03

電力領域知識表示與圖譜構建1. 電力領域知識表示知識圖譜技術作為一個工具落到某一個行業(yè)領域,與普通的知識圖譜構建或者是開放域的、開源的、廣域的知識圖譜構建到底存在什么樣的區(qū)別呢?由于電力領域知識來源廣泛,有來自傳統(tǒng)的電力知識工程系統(tǒng)、專家經驗知識庫等的結構化數(shù)據(jù),還有電力標準、制度、法律、法規(guī)以及專家、技術人員的經驗等半/非結構化數(shù)據(jù),可按照復用程度的差異劃分為通用知識和專用知識兩大部分。

其中,例如部分電力設備的名稱、電壓等級、容量以及單位組織架構等信息在客服、調度、運檢、安質等多個業(yè)務領域均有需求,我們稱之為電力領域通用知識;而客服領域中的用戶名稱、電費、電價等信息相對專用,在調度、運檢、安質等業(yè)務領域涉及概率很小,甚至完全不會出現(xiàn),我們將之認定為電力領域專用知識。值得一提的是,電力領域通用知識與專用知識之間的界限往往是模糊的,實際操作時需要根據(jù)實際業(yè)務進行統(tǒng)計分析以判定通用、專用知識之間的邊界。因此在概念層和實例層之間我們還劃分了一個業(yè)務層,主要是電力行業(yè)的一些動作知識。以檢修為例,電力設備部位部件的缺陷信息勢必會涉及到檢修的操作,我們會把標準里面提到的規(guī)則或規(guī)范性約束條件在業(yè)務層進行存儲以開展維修。接下來談一下數(shù)據(jù)結構。數(shù)據(jù)結構本身其實包含邏輯、組織結構、操作、和約束。電力板塊跟傳統(tǒng)圖結構數(shù)據(jù)的體量、特征沒有典型差異。唯有一點是電力板塊去做知識圖構建過程時,很多東西是物聯(lián)網的架構,網絡拓撲和知識圖譜的拓撲是能夠重合的。電力設備的部位、部件相關的信息,天然就構成了一個拓撲圖,完全可以把這個拓撲映射到知識圖譜板塊,這是電力領域應用知識圖譜的一個最大優(yōu)勢。2.?本體構建領域知識圖譜的本體構建方法主要包括由知識驅動的自頂向下(Top-down)式、由數(shù)據(jù)驅動的自底向上(Bottom-up)式以及兩者的組合方式。其中,自頂向下式是指通過業(yè)務專家人工編制或利用已有的結構化知識庫獲取電力領域知識本體的結構信息,進而將知識本體加入到知識庫;自底向上式則是指從開放非結構化數(shù)據(jù)中提取實體、概念、關系、屬性、屬性值等信息,選取置信度高的對象作為候選,分析歸納成底層結構信息,逐層向上最終形成知識本體并加入到知識庫。電力領域數(shù)據(jù)來源廣泛,傳統(tǒng)電力知識工程系統(tǒng)、專家經驗知識庫等結構化數(shù)據(jù),可直接用來指導知識圖譜本體自頂向下的構建。同時,電力領域實際業(yè)務中所產生的各類數(shù)據(jù)以及專家、技術人員的主觀經驗等半/非結構化的數(shù)據(jù)也蘊含了豐富的電力領域行業(yè)知識,為確保知識圖譜本體的完備性,利用信息提取技術對此類數(shù)據(jù)中的電力知識加以識別,并對識別的結果進行歸納抽象,最終將抽象出的概念映射或補充到電力領域知識圖譜本體中,從而實現(xiàn)本體自底向上的構建。自頂向下、自底向上結合的本體構建方式,既能夠傳承固化電力領域現(xiàn)有數(shù)據(jù)庫中的相關經驗知識,又能實現(xiàn)對新知識的發(fā)現(xiàn),故在實際構建電力領域知識圖譜本體時,通常采取兩種方式相結合的方法。目前國網公司、南網公司和大唐等能源企業(yè),用top-down這種形式居多,即在業(yè)務專家進行指導下直接去構建相關的知識圖譜本體框架。主要是因為這樣的構建方法有兩方面的優(yōu)勢,第一方面優(yōu)勢是多年的運營過程,能源企業(yè)都做了一些信息化系統(tǒng),這些信息化系統(tǒng)的背后有數(shù)據(jù)結構表單,表單本來就已經形成了電力領域知識圖譜,可以參考數(shù)據(jù)結構的架構;此外就是在圖譜本體構建過程中,像電力的營銷領域、調度領域、運檢領域,有一些營銷客服話術,運檢調度的一些應急響應預案,自然就是事件和動作相關聯(lián)的,出現(xiàn)什么事件怎么樣去做或出現(xiàn)什么樣的trigger怎樣去做響應等,這些都是構建電力領域事件圖譜非常好的素材。

04

電力領域知識圖譜的應用實踐1. 領域知識圖譜應用架構在電力領域知識圖譜構建中,我們發(fā)現(xiàn)知識圖譜作為一種語義網絡,在電力大數(shù)據(jù)的賦能下誠然已經能夠解決許多實際問題;但單純依靠知識圖譜技術并不能完全響應我國能源互聯(lián)網的數(shù)據(jù)特征與發(fā)展趨勢,難以表達電力系統(tǒng)中涉及到的豐富語義,因而充分利用現(xiàn)有知識工程資源,并不能將其視為一劑包治百病的“萬能藥”。而應將知識圖譜作為實現(xiàn)低成本、快速響應的部署和轉換,為電網公司帶來收益的最大化。一方面,在調度、運檢、安質等業(yè)務領域中存在著豐富的if-then規(guī)則信息,不易利用領域知識圖譜表達。特別是對于if A and B then C等并發(fā)事件規(guī)則,其條件部分的子表達式之間的關系可以出現(xiàn)部分極為復雜的情況,利用領域知識圖譜難以表達。同時,電力行業(yè)公司中存在大量的if-then規(guī)則信息乃至其他知識表示規(guī)則下的信息已經在過往的信息化工程建設中被維護在了專家知識系統(tǒng)中,亦或已經突破了知識圖譜技術的原有范圍。知識圖譜傳統(tǒng)的研究往往是去做最優(yōu)路徑搜索研究,去發(fā)現(xiàn)最優(yōu)通路,但是很難找到兩個起點緊接到最終一個終點這樣的路徑。這種需求以前的研究里面很少涉及。解決方案有兩種,第一種的是改變這個知識圖譜的schema,讓兩個起點一個終點的這種情況變成從一個起點出發(fā),必須過某種屬性的一個節(jié)點,最終到達終點,這樣就把剛才說這個if a and b then c變成了if a and b are confirmed then c這種方式。第二種方案是,不去做最優(yōu)路徑搜索,而是做圖結構分析,或者圖分類任務。若能利用領域知識圖譜輔助與引導對專家知識系統(tǒng)中知識元進行合理“利舊”,對新生知識元進行基于Seq2Seq等數(shù)據(jù)驅動算法模型的“求新”,將有助于人們短、平、快的解決更多的實際問題。另一方面,能源互聯(lián)網的數(shù)據(jù)特征及其互聯(lián)網化的發(fā)展趨勢,注定其中的數(shù)據(jù)、知識將逐步區(qū)別于傳統(tǒng)電網數(shù)據(jù),呈現(xiàn)出顯著的動態(tài)、隱形、主觀等特性。知識圖譜技術側重于表達實體、概念之間的語義關聯(lián),而上述語義關聯(lián)大多是靜態(tài)的、顯性的、客觀的、明確的,而實際應用中對過程性、決策性知識是有著大量需求的,這些知識大部分是動態(tài)的、隱形的、帶有一定主觀性的,如規(guī)劃設計、發(fā)展決策、運檢決策、調度決策等。雖然一線的工作人員與專家能夠憑借自己工作所得或口耳相傳的經驗完成本職工作,但單就其中部分業(yè)務的內在規(guī)則而言仍是模糊的。部分電力行業(yè)公司曾提出以標準化或激勵制度的方式促進企業(yè)內的知識表達與沉淀,但收效甚微。其關鍵問題在于一線員工、工程師、研究員等領域專家也難以清晰的對相關知識進行表達。傳統(tǒng)知識工程通過專業(yè)的知識工程師協(xié)助領域專家進行知識獲取,但總體上的代價太大,過程太重,不易成功,有賴于數(shù)據(jù)驅動的知識挖掘技術的引入與應用。因此,我們提出了基于NoDKG思想的電力領域知識圖譜應用架構。通過結合使用圖數(shù)據(jù)庫與關系型數(shù)據(jù)庫,合理劃分結構化、半結構化、非結構化數(shù)據(jù)的存儲與調用方式,解釋了框架如何應對動態(tài)、隱形、主觀性的知識,提供了一種領域知識圖譜與現(xiàn)有專家數(shù)據(jù)庫有機融合的途徑。

基于NoDKG的電力領域知識圖譜應用架構覆蓋數(shù)據(jù)獲取、圖譜構建、知識計算以及圖譜應用等四個層級。

第一層是數(shù)據(jù)獲取,屬于框架的底層。獲取對象包括結構化數(shù)據(jù)信息、半結構化的和非結構化數(shù)據(jù)信息。此外還有電網公司企業(yè)之外引入的數(shù)據(jù)。比如進行電力巡檢過程中,關注電網公司內部的標準制度之外,還要去關注國家標準、行業(yè)標準、IEEE或者ITU等國際標準。這些就屬于是外部信息,再比如進行設備的采購、運維、檢修的過程中,對設備廠商的需求,可能會對天眼查、企查查等企業(yè)之間的關聯(lián)、穿透關系、股權分析有數(shù)據(jù)需求。總體來講,數(shù)據(jù)獲取層一般都是以excel、csv或者json、xml等文件進行導入、讀取和存儲,然后把它解析成概念、實體、關系,還有屬性、事件等相關的知識源。

第二層是圖譜構建層,作為電力領域知識圖譜應用架構的核心層承載自然語言處理、知識抽取、知識融合以及知識加工能力。同時,規(guī)范要求采用圖數(shù)據(jù)庫存儲實體(屬性值)、概念、關系(屬性)、事件并實現(xiàn)多對多關系管理,通常涉及Neo4j等面向屬性圖的存儲系統(tǒng)或gStore等面向RDF圖的存儲系統(tǒng)兩大類別;采用關系型數(shù)據(jù)庫管理文件、視頻、圖像、音頻等多媒體數(shù)據(jù)以及一對多關系,并通過“id_name”連接彼此。其中,可考慮將關系型數(shù)據(jù)庫的“id”、“name”等變量信息作為屬性值存儲在圖數(shù)據(jù)庫內的領域知識圖譜中,用以實現(xiàn)對高效檢索、認知推理的能力支撐。

第三層是知識計算層,負責集成表示學習、關系推理、屬性推理、事件推理、路徑計算、比較排序等通用算法模型,為圖譜應用層提供算法支撐。

第四層圖譜應用層,負責提供智能搜索、智能問答、智能推理、智能決策、知識處理及第三方應用,作為電力領域知識圖譜應用架構所產出的最終功能模塊與實際應用場景進行對接。

2.領域知識圖譜應用實踐-電力調度故障處理

在電網調度業(yè)務中,采用調度故障處置管理規(guī)定、故障處置預案、調度規(guī)程及異常監(jiān)控手冊等文本數(shù)據(jù)以及從D5000系統(tǒng)導出的結構化數(shù)據(jù),根據(jù)一線調度人員的業(yè)務經驗與業(yè)務規(guī)則,自上而下的搭建基礎本體架構,然后利用概念抽取工具及關系抽取模型進行自動化識別,識別結果經業(yè)務專家抽象校驗后形成自下而上的類別體系,與基礎本體架構融合,構建最終的電力調度知識本體架構。基于本體架構,利用Bi-LSTM-CRF模型實現(xiàn)調度故障實體識別及屬性抽取,根據(jù)電網故障數(shù)據(jù)特征,利用Bi-LSTM+Attention模型進行關系抽取及分類,經實體鏈接與知識補全后,實現(xiàn)電力調度領域知識圖譜構建。

一般我們會畫如下的一個架構示意圖。首先包括了調度相關的文本數(shù)據(jù),如調度、調規(guī)、應急預案、調度細則、調度報告。此外,也會去存電網故障數(shù)據(jù)、調度系統(tǒng)的結構化數(shù)據(jù),進行結構化和半結構化的文本解析,解析之后共同形成調度領域的知識圖譜。非結構化數(shù)據(jù)的我們會采取mysql或者sql存儲,進行圖結構數(shù)據(jù)和關系性數(shù)據(jù)庫的聯(lián)調,聯(lián)調之后共同作用于相關的故障處置判斷,包括電網的異常情況、故障類別的分類,還有設備故障的溯源,故障原因的分析。最后進行故障處置,包括信息的匯總、負荷的轉移、事故的拉路,試送的恢復等,最終把這些功能模塊進行前端人機功能展示,形成業(yè)務能力。

3.領域知識圖譜應用實踐-電力運檢工單處理在電力運檢業(yè)務中,使用輸電架空線路工程臺賬、工單、工作票、修試記錄等業(yè)務數(shù)據(jù)以及檢修相關標準文檔,根據(jù)一線檢修人員的業(yè)務經驗與標準文檔中所述業(yè)務規(guī)則,人工構建了覆蓋設備、部件、部位、缺陷、故障、描述、原因、解決方案、場/站/線、單位、人員、持票種類等信息在內的輸電架空線路工程運檢知識基礎本體架構,然后利用自動化抽取工具進行知識提取,運檢業(yè)務專家對提取結果進行審核抽象后,自底向上形成一套知識體系,該體系與基礎本體架構融合形成輸電架空線路工程運檢知識本體架構。基于運檢知識本體架構,采用Bi-LSTM-CRF、Bi-GRU-CRF等算法,由業(yè)務數(shù)據(jù)與標準文檔中實現(xiàn)自底而上式的圖譜構建。

工單是指巡視人員去現(xiàn)場看了哪些設備,存在哪些故障,會把故障信息記錄下來形成一個工單。工單會交給后面的檢修人員去進行相關的設備檢修維護。檢修人員拿到工單之后會開出工作票,工作票記錄比如哪個設備壞了,應該如何去修。工作票派發(fā)給一線工作人員到場站線進行維修操作。修完后會形成一個檢修測試記錄。這三個表單之間是順承的關系,工單和工作票往往是一對一或一對多的關系,而工作票和修試記錄往往是一對一的關系。如果整個修試記錄完成了工單所有內容,那么在檢修業(yè)務上就進行了一個閉環(huán)。人工去構建運檢領域的知識圖譜過程中,會涉及到設備部位、部件缺陷、故障以及相關描述、原因、解決方案、場站線信息,單位人員持票等相關信息,然后自上而下形成一個知識體系,相當于去做了一個top-down的schema構建,之后相關的數(shù)據(jù)就可以去用實體、關系分類模型去把它通過數(shù)據(jù)訓練模型,直接生成圖譜了。工作票的生產過程中也可以去做一些病因的分析,包括故障的溯源、智能處置和標準的推薦。例如制造設備出現(xiàn)了一個故障信息之后,就能知道去哪個標準里面查,標準應該是采用哪一條,以及設備故障的可能原因等等。工作票生成之后進行一個修試記錄比對。我們團隊采用ASR去做語音數(shù)據(jù)的轉寫,相當于是現(xiàn)場的人員通過語音錄入的形式,把自己完成這個工作的信息進行記錄,屬于管理上留痕的操作。此后轉出來文本再去進行語義比對,看他有沒有對這個工作票工單的信息進行響應,進而形成人際交互的響應。4.領域知識圖譜應用實踐-電力客服智能問答在電力客服業(yè)務中,利用95598客服知識庫標準問、坐席客服記錄、對話語音等業(yè)務數(shù)據(jù),根據(jù)一線客服人員的業(yè)務經驗及客服話術流程所述業(yè)務規(guī)則,結合自動化知識抽取工具與業(yè)務專家相結合的方式自底向上構建的電力客服知識體系,構建形成電力客服知識本體架構。進而,利用基于置信度傳播的概念抽取模型以及Bi-LSTM-CRF模型實現(xiàn)客服領域實體識別;利用基于概率因子圖模型的實體多關系聯(lián)合挖掘模型抽取關系,并采用實體-主題模型和主動學習的層次學習算法實現(xiàn)關系的分類,經知識融合和知識校驗后,實現(xiàn)電力客服知識圖譜構建。

05

電力領域知識圖譜的未來挑戰(zhàn)

1.應用方向

首先從業(yè)務需求方向來講,為全面推進傳統(tǒng)電力行業(yè)的互聯(lián)網化進程,電網公司勢必會在未來幾年內跟服務業(yè)公司加強聯(lián)系,同時與房地產、電商、家電、保險等行業(yè)開展跨行業(yè)合作,電力領域知識應用會更加開放。

相應的,技術需求會有以下四大類:

智能搜索

知識圖譜是語義搜索的大腦,智能語義搜索借助知識圖譜的幫助,對用戶查詢關鍵字進行解析和推理,將其映射到知識圖譜中的一個或一組節(jié)點上,并根據(jù)知識圖譜中層次結構,返回相關知識。智能語義搜索由谷歌提出后,在行業(yè)內得到廣泛應用。百度的“知心”、搜狗的“知立方”,利用知識圖譜技術提升用戶開放域知識搜索體驗,而國網英大推出的中國電力百科網、中國電科院在研的智能標準制度檢索系統(tǒng),則用以支持電力領域百科、標準知識的快速獲取。隨著電力企業(yè)內外業(yè)務部的服務渠道越來越多,智能搜索也將擁有更廣闊的應用前景,比如支撐電力用戶進行電費電價政策檢索、調度領域員工進行故障知識的查詢等。

智能推薦

推薦系統(tǒng)是人與信息的連接器,用已有的連接去預測未來用戶和物品之間會出現(xiàn)的連接。推薦系統(tǒng)本質上處理的是信息,它的主要作用是在信息生產方和信息消費方之間搭建起橋梁,從而獲取人的注意力。推薦系統(tǒng)作為互聯(lián)網和電子商務發(fā)展的新興產物,在電力行業(yè)公司中大多應用于客服、電商以及傳媒業(yè)務。此外,中國電科院還采用領域知識圖譜開展了專家遴選技術的相關研究,以支持國家電網有限公司的科技項目評審業(yè)務。基于領域知識圖譜的智能推薦在電力系統(tǒng)的應用市場極為廣闊,從總體上劃分為基于個體評價的智能推薦與基于群體規(guī)律的智能推薦兩個類別。

智能問答

智能問答可以看做是一種信息檢索的高級模式,系統(tǒng)將知識圖譜看做成一個完備的知識庫,首先對自然語言表示的句子進行分析,將問題轉化成對知識圖譜的查詢,然后在知識圖譜中查詢答案并返回。基于知識圖譜的智能問答應用廣泛,如亞馬遜的自然語言助手Evi、蘋果智能語音助手Siri和出門問問手機應用等,覆蓋了出行、電商、手機等多個行業(yè)。此外,國網客服中心在研的基于知識圖譜的客服智能問答系統(tǒng),有效地提升了工作效率,降低人工參與成本。

智能問答不僅在公司內部業(yè)務場景應用廣泛,其在輔業(yè)公司業(yè)務中也具有多樣化的潛在應用。比如在電力保險行業(yè)、金融行業(yè)進行復雜業(yè)務知識解答,在電動汽車行業(yè)進行交通信息查詢。

智能決策

智能決策是指結合人工智能和知識工程,更充分地應用描述性知識、過程性知識、推理性知識,進而通過邏輯推理來幫助解決復雜決策問題的輔助決策。目前,在電力行業(yè)運檢、調度以及科技等多個業(yè)務領域均已開展了針對基于領域知識圖譜的智能決策的理論探索與技術研究工作。中國電科院基于上述理論構建了輸變電運檢領域知識管理與認知推理平臺與科技項目輔助決策系統(tǒng),實現(xiàn)工作票智能生成、修試記錄智能比對、科技項目查重。

隨著諸多專家學者對電力跨媒體數(shù)據(jù)研究的不斷深入,基于領域知識圖譜的智能決策未來有望進一步在電力行業(yè)調度、配網運檢、綜合能源管控以及需求側響應等方面嶄露鋒芒。

2.未來挑戰(zhàn)

挑戰(zhàn)一:混雜數(shù)據(jù)下的知識提取與圖譜構建

從電力系統(tǒng)中獲取的知識通常具有信息廣泛性、多源異構特性,且有時伴有歧義、噪聲與冗余。對于知識圖譜而言,歧義表現(xiàn)為實體、概念的屬性描述缺乏精確性、一致性或實體間關系錯置、扭曲,使得圖譜結構混亂及語義描述相互沖突,可能導致推理機制紊亂、推理結果失真;噪聲作為互聯(lián)網化數(shù)據(jù)的顯著特征,一定程度上稀釋了數(shù)據(jù)信息內容和價值密度;而冗余則表現(xiàn)為在圖譜中產生大量孤立、無用的實體和屬性關系,占據(jù)大量的存儲空間和關系路徑,使圖譜實體層變得冗余、繁雜,導致存儲資源的浪費和圖譜推理應用的低效。如何將電力領域知識元與互聯(lián)網大數(shù)據(jù)有機融合起來,構建、更新大規(guī)模、結構清晰、可解釋的電力領域知識圖譜,并賦能使之在混雜數(shù)據(jù)下自主進化,是實現(xiàn)電力系統(tǒng)智能化發(fā)展的必由之路。

挑戰(zhàn)二:電網拓撲下的認知推理與輔助決策

目前,領域知識圖譜技術已經在運檢、調度、客服等業(yè)務中實現(xiàn)初步應用。現(xiàn)有的知識推理模型往往需要大量高質量的樣本進行訓練,獲取樣本成本較大。而專家以及一線工作人員則可以依據(jù)先驗知識與小樣本數(shù)據(jù)對于電力拓撲以及運行數(shù)據(jù)進行分析判斷。另一方面,現(xiàn)有的知識推理實現(xiàn)方式,可解決大部分領域和業(yè)務場景的復雜計算需求,但對于計算資源和存儲資源的占用較大,且現(xiàn)有算法效率存在瓶頸,應用到電網系統(tǒng)大規(guī)模數(shù)據(jù)時往往無法滿足實時、準實時或及時的計算決策要求。如何在領域知識圖譜框架下實現(xiàn)對電網拓撲數(shù)據(jù)等原生數(shù)據(jù)的高效利用,仍是為了推動數(shù)據(jù)-知識雙驅動的電力智能信息處理系統(tǒng)發(fā)展的必要研究。

挑戰(zhàn)三:領域知識圖譜的質量評價體系

對領域知識圖譜的質量評價,大多針對實體、關系、屬性三類數(shù)據(jù),通過構建標準測試集或人工抽樣的方式實現(xiàn)。中國電子技術標準化研究院于2019年8月在第二屆智能制造高峰論壇期間發(fā)布了《知識圖譜標準化白皮書》,稱“大規(guī)模知識圖譜的應用場景都是針對特定的任務需求,如何選擇恰當?shù)乃惴úΣ煌乃惴ㄟM行統(tǒng)一的評定,進而實現(xiàn)圖譜的智能化應用仍然是一個研究重點”。此外,電力行業(yè)公司在引入領域知識圖譜技術時,往往旨在提升已有信息化系統(tǒng)、模塊或任務的性能,通過其性能或效果的提升來間接反映領域知識圖譜的質量,但仍缺乏系統(tǒng)化的質量評價方法。

挑戰(zhàn)四:領域知識圖譜的應用開發(fā)技術

隨著電力市場化和服務專業(yè)化的浪潮,負荷集成商、微網能源運行商、智能運維商、數(shù)字節(jié)能服務商、需求響應服務商等一大批新興“線上+線下”數(shù)字化服務企業(yè)即將出現(xiàn),這將給電力行業(yè)公司的信息化工程帶來數(shù)字化浪潮的巨大沖擊。面對由信息服務到知識服務的轉變,有必要提出知識圖譜構建中間應用的技術與平臺,基于知識圖譜構建出檢索系統(tǒng)、問答系統(tǒng)等符合業(yè)務需求的應用工具,以服務不同的行業(yè)和應用。如何提出一套基于領域知識圖譜構建特定業(yè)務應用的方法論,根據(jù)特定業(yè)務應用的數(shù)據(jù)需求,從已有大規(guī)模的電力領域知識圖譜中劃分出所需的子圖,以低人工投入構建出高質量特定業(yè)務領域知識圖譜,用以支撐相關數(shù)據(jù)產品的研發(fā)與迭代,是電力領域知識圖譜工程實現(xiàn)中的又一項挑戰(zhàn)。

06

總結

電力領域知識圖譜,旨在利用結構化方式刻畫電力系統(tǒng)里面的實體概念、屬性、關系相關信息,形成更有效的跨媒體大數(shù)據(jù)的組織管理和認知能力。我們不認為它是一個萬能藥。但是我們希望在電力系統(tǒng)的應用過程中,知識圖譜能夠不斷的進行規(guī)范完善,進而使電力領域知識圖譜滿足電力公司的發(fā)展訴求,找到適用之道。

07

精彩問答

Q:IEC61850規(guī)范能轉化成電力知識圖譜嗎?怎么做的?介紹一下相關的工作。

A:IEC61850屬于比較比較專業(yè)的一個問題,因為IEC61850是一個系列標準,相當于是一個標準簇。從標準簇來講呢,他涉及到整個電力行業(yè),尤其是變電體系,變電調度系統(tǒng)體系。然后緊接會有相關的標準規(guī)劃。我們很難把整個標準套用過來,但一般來講,電網公司里面都會有一個符合IEC61850,或者是相關的一個信息化模型的表征表,像國網公司的說話是sp-cim,南網公司應該是trs-cim,那么這個體系其實是可以對知識圖譜構建能形成比較大的幫助的。

Q:電網一張圖是典型的場景應用,請問這個應用覆蓋了多大的區(qū)域?

A:電網一張圖這個概念是國網公司以前劉廣一老師這邊提出的,如果感興趣可以從知網去搜索一下劉廣一老師的論文。一般來講電網一張圖是一個理念,一張圖這個事情其實因為電網公司去做實物資產管理時候,涉及到場站線相關設備,還有設施的維護過程中,發(fā)現(xiàn)物聯(lián)網的拓撲結構是可以直接拿過來作為圖結構數(shù)據(jù)進行一個表征的,它里面的場站線設施的一些信息,進而也就變成了某一個節(jié)點的相關屬性。這可能是把現(xiàn)實世界的電網信息影射到數(shù)字世界的一個比較好的方式。

今天的分享就到這里,謝謝大家。

(部分內容來源網絡,如有侵權請聯(lián)系刪除)
立即申請數(shù)據(jù)分析/數(shù)據(jù)治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢