




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
ICS19.020
CCSK85
團體標準
T/CSEEXXXX—YYYY
代替T/XXXX
基于隱私計算的電力數(shù)據(jù)共享業(yè)務(wù)互聯(lián)互
通接口規(guī)范
(草案)
InterfaceSpecificationforInterconnectionofPowerDataSharing
ServicesBasedonPrivacy-PreservingComputation(Draft)
(初稿)
20XX—XX—XX發(fā)布20XX—XX—XX實施
中國電機工程學(xué)會發(fā)布
T/CSEE####—2023
1范圍
為了更好利用隱私計算技術(shù)實現(xiàn)電力數(shù)據(jù)的跨業(yè)務(wù)融合應(yīng)用,破解“數(shù)據(jù)孤島”困境,本文件規(guī)定
了電力數(shù)據(jù)多方協(xié)同建模和分析預(yù)測時,與合作方隱私計算平臺之間的接口規(guī)范,包括數(shù)據(jù)聯(lián)邦學(xué)習建
模和多方安全計算時的信息交互技術(shù)框架和接口要求,以滿足與合作方不同技術(shù)架構(gòu)下的隱私計算互聯(lián)
互通需求。
本文件適用于隱私計算電力數(shù)據(jù)共享業(yè)務(wù)中的互聯(lián)互通開發(fā)、測試,以及電力數(shù)據(jù)多方融合應(yīng)用業(yè)
務(wù)建設(shè)時的隱私計算技術(shù)選型。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T25069-2010|信息安全技術(shù)術(shù)語
GB/T35273-2020|信息安全技術(shù)個人信息安全規(guī)范
JR/T0196—2020|多方安全計算金融應(yīng)用技術(shù)規(guī)范
BDC79-2021|隱私計算跨平臺互聯(lián)互通第1部分:總體框架
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
隱私計算privacy-preservingcomputation
在保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對數(shù)據(jù)進行分析計算的一類信息技術(shù),保障數(shù)據(jù)在產(chǎn)
生、存儲、計算、應(yīng)用、銷毀等數(shù)據(jù)流轉(zhuǎn)全過程的各個環(huán)節(jié)中“可用不可見”。
1.術(shù)語條目注1:隱私計算常用技術(shù)方案有多方安全計算(SecureMulti-PartyComputation)、聯(lián)
邦學(xué)習(FederatedLearning)、可信執(zhí)行環(huán)境(TrustedExecutionEnvironment)
等。
2.術(shù)語條目注2:隱私計算常用的底層技術(shù)有混淆電路(GarbledCircuit)、不經(jīng)意傳輸(Oblivious
Transfer)、秘密分享(SecretSharing)、同態(tài)加密(HomomorphicEncryption)等。
[來源:BDC79-2021,3.1]
3.2
聯(lián)邦學(xué)習federallearning
擁有本地數(shù)據(jù)的兩方或多方開展機器學(xué)習聯(lián)合建模,各方在建模過程中不交換本地數(shù)據(jù),而是交換
本地訓(xùn)練的局部參數(shù)或中間結(jié)果,從而協(xié)同構(gòu)建基于各方數(shù)據(jù)的全局模型。
3.3
隱私計算節(jié)點privacy-preservingcomputationnode
各隱私計算技術(shù)平臺部署的互聯(lián)互通網(wǎng)絡(luò)基本組成單元,對外提供交互接口。
[來源:BDC79-2021,3.5]
2
T/CSEE####—2023
3.4
隱私計算平臺privacy-preservingcomputationplatform
一套完整的、嚴密的用于實現(xiàn)隱私計算功能的技術(shù)平臺。
[來源:BDC79-2021,3.3]
3.5
參與方parties
一個或一組自然人或法人,指參與隱私計算跨平臺互聯(lián)互通任務(wù)的主體,包含發(fā)起方、數(shù)據(jù)方、算
法方、計算方、結(jié)果方、協(xié)調(diào)方等多種角色。
[來源:BDC79-2021,3.2]
3.6
互聯(lián)互通interconnection
不同系統(tǒng)架構(gòu)、功能實現(xiàn)方案或算法原理的異構(gòu)隱私計算平臺之間,通過約定最小必要范圍的互通
協(xié)議、接口和實體等定義,能夠跨平臺地進行數(shù)據(jù)多方協(xié)同交互,共同完成同一隱私計算任務(wù)。
[來源:BDC79-2021,3.4]
4縮略語
下列縮略語適用于本文件。
HTTP:超文本傳輸協(xié)議(HyperTextTransferProtocol)
HTTPS:超文本安全傳輸協(xié)議(HyperTextTransferProtocoloverSecuresocketlayer)
RPC:遠程過程調(diào)用(RemoteProcedureCall)
TCP:傳輸控制協(xié)議(TransmissionControlProtocol)
TLS:傳輸層安全協(xié)議(TransportLayerSecurity)
Web:萬維網(wǎng)(WorldWideWeb)
XML:可擴展標記語言(ExtensibleMarkupLanguage)
WOE:證據(jù)權(quán)重(WeightofEvidence)
IV:信息價值(InformationValue)
4.1
加密encipherment/encryption
對數(shù)據(jù)進行密碼變換以產(chǎn)生密文的過程。一般包含一個變換集合,該變換使用一套算法和一套輸入
參量。輸入?yún)⒘客ǔ1环Q為密鑰。
4.2
算法algorithm
用于完成隱私計算任務(wù)的一系列指令,能夠?qū)σ欢ㄒ?guī)范的輸入,獲得所要求的輸出。
4.3
3
T/CSEE####—2023
算法組件algorithmcomponent
用于執(zhí)行隱私計算任務(wù)的一種可代替、可組合的部件,封裝了算法功能的實現(xiàn)并提供一系列可用的
接口。
4.4
互聯(lián)互通網(wǎng)絡(luò)interconnectionnetwork
指不同隱私計算技術(shù)平臺部署后相互連接,通過交互與協(xié)同連接形成的提供跨平臺聯(lián)合隱私計算服
務(wù)的網(wǎng)絡(luò)。
[來源:BDC79-2021,3.4]
5隱私計算基本要求
5.1隱私計算應(yīng)用場景
隱私計算的應(yīng)用可根據(jù)實際場景需求靈活進行擴展、組合或新增,主要分類如下:
a)隱私集合求交:支持對兩方或多方不同數(shù)據(jù)集進行安全求交,在不泄露交集外其他數(shù)據(jù)的前提下
輸出正確交集。
b)隱私信息檢索:支持對兩方或多方不同數(shù)據(jù)集進行依據(jù)某條件的數(shù)據(jù)檢索,在保證查詢方不會泄
露查詢目標,且不能從被查詢方獲得查詢結(jié)果之外的其他信息的前提下,輸出正確的檢索結(jié)果。
c)聯(lián)合基礎(chǔ)運算:
—支持對兩方或多方不同數(shù)據(jù)集進行安全數(shù)值運算,如加、減、乘、除、數(shù)乘等;
—支持對兩方或多方不同數(shù)據(jù)集進行安全單元運算,如標量運算、矢量運算、矩陣運算、
多維數(shù)組運算等;
—支持對兩方或多方不同數(shù)據(jù)集進行安全邏輯運算,如與運算、或運算、非運算、與非運
算、或非運算、與或非、異或運算、同或運算等。
d)聯(lián)合統(tǒng)計分析:支持對兩方或多方不同數(shù)據(jù)集進行各種統(tǒng)計分析,如求和、平方和、均值、方差、
分位數(shù)等計算。
e)聯(lián)邦學(xué)習:
—聯(lián)邦特征工程:支持對兩方或多方不同數(shù)據(jù)集進行特征工程,如在保護標簽信息不被泄
露的前提下,進行WOE和IV值計算等;
—聯(lián)邦建模:支持對兩方或多方不同數(shù)據(jù)集的特征和標簽進行模型訓(xùn)練,如回歸算法、決
策樹算法、聚類算法等;
—聯(lián)邦預(yù)測:支持通過兩方或多方不同數(shù)據(jù)集,使用已有模型對具有指定特征的數(shù)據(jù)進行
預(yù)測,并輸出正確的預(yù)測結(jié)果;
—聯(lián)邦模型評估:支持對已有隱私計算模型進行模型評估,并輸出常見的模型評估指標。
5.2隱私計算參與方
在一個完整的隱私計算中,包含的邏輯角色包括:
a)任務(wù)發(fā)起方:任務(wù)發(fā)起方是發(fā)起隱私計算任務(wù)的角色,并在任務(wù)執(zhí)行前核實各方資源。任務(wù)發(fā)起
方可兼任計算方、任務(wù)調(diào)度方、結(jié)果使用方等角色;
b)任務(wù)調(diào)度方:任務(wù)調(diào)度方是分發(fā)隱私計算任務(wù),分配控制各方資源及協(xié)調(diào)各方行為的角色,通過
協(xié)調(diào)數(shù)據(jù)提供方、計算方、算法提供方等角色來完成隱私計算任務(wù),宜獲得可信第三方的認證。
任務(wù)調(diào)度方可由任務(wù)發(fā)起方兼任;
4
T/CSEE####—2023
c)算法提供方:算法提供方是根據(jù)隱私計算的任務(wù)需求,提供隱私計算算法組件和算法描述的角色。
算法組件包括計算邏輯、算法實現(xiàn)和算法參數(shù),算法描述包括算法的版本號、接口說明、安全
性說明、兼容性說明等;
d)數(shù)據(jù)提供方:數(shù)據(jù)提供方是提供執(zhí)行隱私計算任務(wù)所需的數(shù)據(jù)的角色,為聯(lián)合建模、分析預(yù)測任
務(wù)提供模型訓(xùn)練數(shù)據(jù)和分析預(yù)測數(shù)據(jù);
e)計算方:計算方是提供執(zhí)行隱私計算任務(wù)所需算力的角色。計算方自身算力不足時,可能會設(shè)立
輔助計算方的角色進行輔助計算。計算方可與其他計算方執(zhí)行協(xié)同計算,并確保任務(wù)執(zhí)行過程
不會造成隱私數(shù)據(jù)泄露;
f)結(jié)果使用方:結(jié)果使用方是最終獲得隱私計算任務(wù)計算結(jié)果的角色。只有結(jié)果使用方才能獲取計
算的最終結(jié)果,其它非結(jié)果使用方不能獲得結(jié)果,也不能通過中間計算過程,計算或推斷出最
終結(jié)果。
5.3隱私計算典型流程
隱私計算典型工作流程如圖1所示,各階段工作內(nèi)容為:
a)任務(wù)創(chuàng)建:任務(wù)發(fā)起方利用調(diào)度方發(fā)起隱私計算任務(wù);
b)任務(wù)分配:調(diào)度方將任務(wù)下發(fā)到每個數(shù)據(jù)提供方的計算節(jié)點,當某個節(jié)點有輔助計算節(jié)點時,在
任務(wù)運行過程中會將某個計算邏輯下發(fā)到輔助計算節(jié)點;
c)數(shù)據(jù)輸入:數(shù)據(jù)提供方的計算節(jié)點獲取本地數(shù)據(jù)并進行本地計算;
d)任務(wù)計算:數(shù)據(jù)提供方的計算節(jié)點進行交互,完成隱私計算任務(wù);如有輔助計算方,輔助計算節(jié)
點同時參與隱私計算計算任務(wù);
e)結(jié)果分析:結(jié)果使用方從各個計算節(jié)點獲取結(jié)果數(shù)據(jù),合并成最終結(jié)果。
圖1隱私計算工作流程圖
6互聯(lián)互通概設(shè)
6.1互聯(lián)互通意義
5
T/CSEE####—2023
不同隱私計算平臺在系統(tǒng)架構(gòu)、實現(xiàn)方案、算法原理等方面存在差異,無法直接建立連接并共同執(zhí)
行隱私計算任務(wù),因此必須提出異構(gòu)隱私計算平臺之間的互聯(lián)互通方案。通過約定最小必要范圍的互通
協(xié)議、標準化的接口定義以及明確的實體交互規(guī)則,異構(gòu)隱私計算平臺能夠?qū)崿F(xiàn)跨平臺的數(shù)據(jù)多方協(xié)同
交互,共同完成同一隱私計算任務(wù),進而有效支持多方數(shù)據(jù)融合共享。
實現(xiàn)與合作方異構(gòu)隱私計算平臺間的互聯(lián)互通協(xié)作,才能徹底的打破“數(shù)據(jù)孤島”,保障電力數(shù)據(jù)安
全多方共享協(xié)同,促進電力行業(yè)數(shù)據(jù)要素流通和價值釋放。
6.2互聯(lián)互通框架
通過建立協(xié)議接口規(guī)范,實現(xiàn)異構(gòu)隱私計算平臺之間的兼容與互聯(lián)互通。如圖2所示,電力應(yīng)用隱
私計算互聯(lián)互通包含三個層次。
圖2電力隱私計算互聯(lián)互通框架
a)節(jié)點的互聯(lián)互通,參與隱私計算任務(wù)的不同節(jié)點可以相互發(fā)現(xiàn)、合作授權(quán)、建立連接,是跨平臺
互聯(lián)互通的最基礎(chǔ)環(huán)節(jié);
b)資源的互聯(lián)互通,已建立連接的節(jié)點間可以相互發(fā)現(xiàn)、申請、使用對方的數(shù)據(jù)資源、算法資源、
模型資源等,在節(jié)點互聯(lián)的基礎(chǔ)上實現(xiàn)資源互通;
c)算法組件的互聯(lián)互通,在節(jié)點、資源互通的基礎(chǔ)上,通過調(diào)用相同的算法組件或按照已約定的交
互協(xié)議執(zhí)行算法,實現(xiàn)具體計算任務(wù)的協(xié)同。
6.3互聯(lián)互通總體架構(gòu)
電力隱私計算互聯(lián)互通總體架構(gòu)包含以下部分:
a)對外接口:對節(jié)點互聯(lián)、統(tǒng)一資源和算法組件互聯(lián)協(xié)議中的核心流程進行接口設(shè)計和功能實現(xiàn),
供上層業(yè)務(wù)場景調(diào)用。
b)互聯(lián)協(xié)議:互聯(lián)協(xié)議覆蓋節(jié)點、項目、流程、作業(yè)、任務(wù)、資源和算法組件維度的互聯(lián)協(xié)議棧。
c)通信協(xié)議:隱私計算互聯(lián)互通以統(tǒng)一的平臺間通信要求為基礎(chǔ),包括通信接口、通信框架、數(shù)據(jù)
格式、加密傳輸機制、網(wǎng)絡(luò)環(huán)境等。
6
T/CSEE####—2023
圖3隱私計算互聯(lián)互通總體架構(gòu)
7互聯(lián)互通對象
7.1對象實體
電力隱私計算互聯(lián)互通最小必要的實體元素如下,參與互聯(lián)互通的各方需要對齊這些實體元素的定
義和數(shù)據(jù)結(jié)構(gòu),對與節(jié)點互通無關(guān)的個性化屬性不做限制。
a)節(jié)點(Node):隱私計算生態(tài)中的抽象功能單元,用來指代由機構(gòu)或組織部署的隱私計算平臺;
b)數(shù)據(jù)集(Dataset):可供參與隱私計算的數(shù)據(jù)資源;
c)項目(Project):面向特定目標的,提供一項獨特產(chǎn)品、服務(wù)或成果的隱私計算方案,該實體為
可選項;
d)組件(Component):獨立執(zhí)行隱私計算任務(wù)的模塊單元,其經(jīng)過封裝、符合開放接口規(guī)范、可
以完成某個特定計算或算法,可獨立部署;
e)流程(Flow):采用DAG結(jié)構(gòu)定義的、可編排的隱私計算作業(yè)運行模板;
f)作業(yè)(Job):一個隱私計算流程通過配置運行參數(shù)后的運行實例;
g)任務(wù)(Task):組件運行實例的載體,每個運行實例通過任務(wù)來管理;
h)模型(Model):指通過隱私計算技術(shù)訓(xùn)練完成,可用于進一步推理的模型,或是已有的現(xiàn)成模
型。
7.2對象關(guān)系
7
T/CSEE####—2023
參與互聯(lián)互通合作的異構(gòu)平臺作為節(jié)點(Node)加入到互聯(lián)互通網(wǎng)絡(luò),一個節(jié)點可以創(chuàng)建多個項
目(Project),每個項目中可能包含多個參與該互聯(lián)互通項目的多個節(jié)點。通過項目實體來統(tǒng)一管理項
目中相關(guān)的節(jié)點、數(shù)據(jù)集(Dataset)和模型(Model)等資源,項目中多個合作的節(jié)點可以創(chuàng)建多個流
程(Flow)流程運行多次生成多個作業(yè)(Job),不同作業(yè)可以按照“Conf通用化設(shè)計”配置不同的運
行時參數(shù),一個作業(yè)可能由多個任務(wù)(Task)組成,任務(wù)承接作業(yè)中對應(yīng)的運行時參數(shù)配置,每個任務(wù)
通過調(diào)度底層組件(Component)對應(yīng)的算法資源進而執(zhí)行任務(wù),生成模型、報告等隱私計算結(jié)果。每
個組件都是獨立的算法模塊,例如:PSI、LR等,組件可以按照“DAG通用化設(shè)計”提前配置調(diào)度順
序、輸入輸出關(guān)系等,從而編排形成一個具有完整計算邏輯的流程,作業(yè)和任務(wù)按照DAG配置和Conf
配置調(diào)度和運行相應(yīng)資源,生成對應(yīng)結(jié)果。結(jié)合7.1實體定義,實體間的關(guān)系圖如圖4所示。
圖4隱私計算互聯(lián)互通組最小必要對象
8互聯(lián)互通協(xié)議
8.1節(jié)點互聯(lián)協(xié)議
節(jié)點互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間的節(jié)點發(fā)現(xiàn)、節(jié)點管理和節(jié)點更新等互聯(lián)操作內(nèi)容與流程進
行規(guī)范。節(jié)點互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的基礎(chǔ)。
8.1.1節(jié)點發(fā)現(xiàn)
節(jié)點發(fā)現(xiàn)約定節(jié)點基本信息查詢、合作節(jié)點查詢和節(jié)點合約查詢的技術(shù)要求。
a)節(jié)點基本信息查詢:根據(jù)節(jié)點ID,查詢該節(jié)點基本信息;
b)合作節(jié)點查詢:發(fā)起方查詢合作方節(jié)點信息,無需鑒權(quán);
c)節(jié)點合約查詢:發(fā)起方向合作方查詢合約狀態(tài),確認回調(diào)失敗的兜底操作。
8.1.2節(jié)點管理
8
T/CSEE####—2023
節(jié)點管理約定了節(jié)點簽約、節(jié)點合約確認、節(jié)點簽約取消、節(jié)點健康檢查、節(jié)點解約的技術(shù)要求。
a)節(jié)點簽約:根據(jù)節(jié)點ID、節(jié)點名稱、節(jié)點描述、節(jié)點認證方式、簽約有效期、對外服務(wù)地址等
有效信息,發(fā)起方向合作方申請簽約,且簽約結(jié)果需等待對方通知,節(jié)點雙方簽約成功會生成
有效的合約ID;
b)節(jié)點合約確認:在合約有效期內(nèi),合作方通過認證即可向發(fā)起方確認是否接受本次簽約;
c)節(jié)點簽約取消:發(fā)起方取消指定合約ID的簽約申請,取消合約為待處理狀態(tài)才有效;
d)節(jié)點健康檢查:檢查節(jié)點的狀態(tài),如發(fā)起方取消簽約申請時,待處理狀態(tài)才有效;
e)節(jié)點解約:合作節(jié)點撤銷合約關(guān)系,雙方都可發(fā)起。
8.1.3節(jié)點更新
節(jié)點更新約定了節(jié)點信息更新、節(jié)點信息同步的技術(shù)要求。
a)節(jié)點信息更新:更新當前節(jié)點信息;
b)節(jié)點信息同步:在合約有效期內(nèi),通過合作節(jié)點對外提供服務(wù)的地址,將節(jié)點更新內(nèi)容同步到簽
約方。
8.2項目互聯(lián)協(xié)議
項目互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間的項目創(chuàng)建、項目查詢、項目更新以及項目刪除等互聯(lián)操作
內(nèi)容與流程進行規(guī)范。項目互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的應(yīng)用基礎(chǔ)協(xié)議。
8.2.1項目創(chuàng)建
項目創(chuàng)建約定了自有項目創(chuàng)建和合作項目創(chuàng)建的技術(shù)要求。
a)自有項目創(chuàng)建:發(fā)起方創(chuàng)建一個項目,支持設(shè)置項目名稱、項目描述、和項目類型等基本初始參
數(shù);
b)合作項目創(chuàng)建:發(fā)起方向合作方發(fā)起項目創(chuàng)建請求,用于數(shù)據(jù)同步、審核等場景。
8.2.2項目查詢
項目查詢約定了自有項目查詢、合作項目查詢、自有項目信息查詢、合作項目信息查詢的技術(shù)要求。
a)自有項目查詢:查詢發(fā)起方的自有項目,查詢方式支持模糊查詢和精確查詢,查詢結(jié)果支持列表
展示和統(tǒng)計說明;
b)合作項目查詢:查詢發(fā)起方可以查詢指定合作方的全部合作項目,查詢結(jié)果支持列表展示和統(tǒng)計
說明;
c)自有項目信息查詢:根據(jù)項目ID,查詢單個自有項目詳情;
d)合作項目信息查詢:根據(jù)項目ID,查詢單個合作項目詳情。
8.2.3項目更新
項目更新約定了自有項目更新、合作項目更新的技術(shù)要求。
a)自有項目更新:根據(jù)項目ID,發(fā)起方更新單個自有項目;
b)合作項目更新:根據(jù)項目ID,發(fā)起方向合作方發(fā)起項目更新請求,用于數(shù)據(jù)同步、審核等場景。
8.2.4項目刪除
9
T/CSEE####—2023
項目刪除約定了自有項目刪除的技術(shù)要求。
a)自有項目刪除:根據(jù)項目ID,發(fā)起方刪除單個自有項目。
8.3流程互聯(lián)協(xié)議
流程互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間合作項目的流程創(chuàng)建、流程查詢、流程審批、流程更新以及
流程刪除等互聯(lián)操作內(nèi)容與流程進行規(guī)范。流程互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的應(yīng)用基礎(chǔ)協(xié)議。
8.3.1流程創(chuàng)建
發(fā)起方在指定項目ID下創(chuàng)建流程,支持設(shè)置流程名稱、添加流程描述、DAG和運行時任務(wù)參數(shù)和
配置信息,流程創(chuàng)建成功后可以根據(jù)推薦雪花算法生成或以節(jié)點ID為前綴生成對應(yīng)的流程ID,流程ID
支持跨節(jié)點共享。
其中,DAG是用來描述流程中組件依賴關(guān)系的語言,包括描述流程使用的組件列表的components
字段、輸入數(shù)據(jù)列表的input字段和輸出數(shù)據(jù)列表的output字段,一旦流程確定則DAG內(nèi)容不變,Config
是運行時任務(wù)參數(shù)和配置信息。
8.3.2流程查詢
流程查詢約定了流程列表查詢、流程信息查詢的技術(shù)要求。
a)流程列表查詢:根據(jù)項目ID,查詢該項目下的所有流程,結(jié)果應(yīng)支持列表顯示和查詢總數(shù)統(tǒng)計
說明;
b)流程信息查詢:根據(jù)流程ID,查詢流程信息,結(jié)果應(yīng)支持列表顯示。
8.3.3流程審批
流程審批約定了流程審批發(fā)起、流程審批確認、流程審批查詢的技術(shù)要求。
a)流程審批發(fā)起:通過項目ID、流程ID、流程描述、DAG等參數(shù),觸發(fā)合作節(jié)點對指定ID的流
程內(nèi)容進行審批,并生成特定的審批ID;
b)流程審批確認:合作方向發(fā)起方確認審批結(jié)果,并返回該審批ID及其審批狀態(tài);
c)流程審批查詢:發(fā)起方通過審批ID向合作方查詢流程審批狀態(tài),流程審批查詢操作是確認回調(diào)
失敗的兜底操作。
8.3.4流程更新
發(fā)起方對指定流程進行更新,支持對流程名稱、流程描述、DAG以及作業(yè)運行配置進行更新,且
流程更新操作不影響已經(jīng)在運行的Job。
8.3.5流程刪除
發(fā)起方根據(jù)指定流程ID,刪除對應(yīng)流程。
8.4作業(yè)互聯(lián)協(xié)議
作業(yè)互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間合作項目流程的作業(yè)創(chuàng)建、作業(yè)查詢、作業(yè)啟動、作業(yè)停止
以及作業(yè)重跑等互聯(lián)操作內(nèi)容與流程進行規(guī)范。作業(yè)互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的應(yīng)用基礎(chǔ)協(xié)
議。
8.4.1作業(yè)創(chuàng)建
作業(yè)創(chuàng)建約定了自有作業(yè)創(chuàng)建、合作作業(yè)創(chuàng)建的技術(shù)要求。
10
T/CSEE####—2023
a)自有作業(yè)創(chuàng)建:基于流程創(chuàng)建新的作業(yè),支持設(shè)置DAG和作業(yè)運行時配置信息,如作業(yè)優(yōu)先級、
作業(yè)超時秒數(shù)等,作業(yè)創(chuàng)建成功后生成作業(yè)ID,且該作業(yè)ID在整個流程運行期間不變;
b)合作作業(yè)創(chuàng)建:根據(jù)作業(yè)ID,創(chuàng)建合作方作業(yè)。
8.4.2作業(yè)查詢
作業(yè)查詢約定了作業(yè)列表查詢、作業(yè)信息查詢的技術(shù)要求。
a)作業(yè)列表查詢:根據(jù)指定流程ID,查詢所屬該流程下的全部作業(yè),結(jié)果支持列表顯示和記錄總
數(shù)統(tǒng)計說明;
b)作業(yè)信息查詢:根據(jù)指定作業(yè)ID,查詢作業(yè)詳情信息。
8.4.3作業(yè)啟動
作業(yè)啟動約定了自有作業(yè)創(chuàng)建、合作作業(yè)啟動的技術(shù)要求。
a)自有作業(yè)創(chuàng)建:根據(jù)作業(yè)ID,啟動作業(yè),并開始調(diào)度其相關(guān)任務(wù);
b)合作作業(yè)啟動:根據(jù)作業(yè)ID,啟動合作方作業(yè)。
8.4.4作業(yè)停止
作業(yè)停止約定了自有作業(yè)停止、合作作業(yè)停止的技術(shù)要求。
a)自有作業(yè)停止:根據(jù)作業(yè)ID,停止作業(yè);
b)合作作業(yè)停止:根據(jù)作業(yè)ID,停止合作方作業(yè)。
8.4.5作業(yè)重跑
重跑指定ID作業(yè),重跑作業(yè)過程中支持對DAG中的組件執(zhí)行新的運行配置。
8.5任務(wù)互聯(lián)協(xié)議
任務(wù)互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間合作項目的任務(wù)啟動、任務(wù)查詢、任務(wù)停止、任務(wù)回調(diào)、任
務(wù)重跑以及任務(wù)結(jié)果上報等互聯(lián)操作內(nèi)容與流程進行規(guī)范。任務(wù)互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的
應(yīng)用基礎(chǔ)協(xié)議。
8.5.1任務(wù)啟動
任務(wù)啟動約定了自有任務(wù)啟動、合作任務(wù)啟動的技術(shù)要求。
a)自有任務(wù)啟動:根據(jù)指定作業(yè)ID,啟動新的組件任務(wù),支持對DAG中的組件名稱、新的任務(wù)參
數(shù)、組件任務(wù)運行參數(shù)、任務(wù)優(yōu)先級進行配置,任務(wù)啟動成功后生成對應(yīng)的任務(wù)ID;
b)合作任務(wù)啟動:根據(jù)指定作業(yè)ID,啟動新的組件任務(wù),支持對DAG中的組件名稱、新的任務(wù)參
數(shù)進行配置,任務(wù)ID支持由發(fā)起方指定,合作方直接使用,若任務(wù)ID由發(fā)起方指定,則必
須和入?yún)ask_id相同。
8.5.2任務(wù)查詢
任務(wù)查詢約定了任務(wù)列表查詢、任務(wù)信息查詢、合作任務(wù)信息查詢、任務(wù)日志查詢的技術(shù)要求。
a)任務(wù)列表查詢:根據(jù)指定作業(yè)ID,查詢所屬該作業(yè)下所有的組件任務(wù)列表,結(jié)果支持列表顯示
和記錄總數(shù)統(tǒng)計說明;
11
T/CSEE####—2023
b)任務(wù)信息查詢:根據(jù)指定作業(yè)ID和任務(wù)ID,查詢對應(yīng)任務(wù)詳情;
c)合作任務(wù)信息查詢:根據(jù)指定作業(yè)ID和任務(wù)ID,查詢?nèi)蝿?wù)詳情;
d)任務(wù)日志查詢:根據(jù)指定作業(yè)ID和任務(wù)ID,查詢對應(yīng)任務(wù)日志,結(jié)果顯示應(yīng)支持按時間排序,
且日志查詢結(jié)果應(yīng)包括日志級別、日志內(nèi)容等,顯示的內(nèi)容不應(yīng)超過1M。
8.5.3任務(wù)停止
任務(wù)停止約定了自有任務(wù)停止、合作任務(wù)停止的技術(shù)要求。
a)自有任務(wù)停止:根據(jù)指定作業(yè)ID和任務(wù)ID,停止對應(yīng)組件任務(wù);
b)合作任務(wù)停止:根據(jù)指定作業(yè)ID和任務(wù)ID,停止對應(yīng)的組件任務(wù)。
8.5.4任務(wù)回調(diào)
任務(wù)回調(diào)約定了自有任務(wù)回調(diào)、合作任務(wù)回調(diào)的技術(shù)要求。
a)自有任務(wù)回調(diào):根據(jù)指定作業(yè)ID和任務(wù)ID,回調(diào)當前節(jié)點組件任務(wù);
b)合作任務(wù)回調(diào):根據(jù)指定作業(yè)ID和任務(wù)ID,回調(diào)相關(guān)組件任務(wù)。
8.5.5任務(wù)重跑
任務(wù)重跑約定了自有任務(wù)重跑、合作任務(wù)重跑的技術(shù)要求。
a)自有任務(wù)重跑:根據(jù)指定作業(yè)ID和任務(wù)ID,重跑組件任務(wù),重跑時運行新的任務(wù)參數(shù)且不帶起
下游;
b)合作任務(wù)重跑:根據(jù)指定作業(yè)ID和任務(wù)ID,重跑組件任務(wù),重跑時運行新的任務(wù)參數(shù)且不帶起
下游。
8.5.6任務(wù)結(jié)果上報
根據(jù)指定作業(yè)ID和任務(wù)ID,上報組件任務(wù)運行結(jié)果,組件任務(wù)運行完成上報運算結(jié)果,上報內(nèi)容
應(yīng)包括任務(wù)輸出類型、任務(wù)輸出內(nèi)容。
8.6組件互聯(lián)協(xié)議
組件互聯(lián)協(xié)議是對異構(gòu)隱私計算平臺間的節(jié)點發(fā)現(xiàn)、節(jié)點管理和節(jié)點更新等互聯(lián)操作內(nèi)容與流程進
行規(guī)范。組件互聯(lián)協(xié)議是隱私計算跨平臺互聯(lián)互通的應(yīng)用基礎(chǔ)協(xié)議。
8.6.1組件注冊
注冊組件相關(guān)信息。
8.6.2組件查詢
組件查詢約定了對外組件列表查詢、對外組件信息查詢、組件列表查詢、組件信息查詢的技術(shù)要求。
a)對外組件列表查詢:查詢對外可見的相關(guān)組件,結(jié)果應(yīng)包括組件編碼、組件版本、組件引擎等組
件概要說明,且結(jié)果支持列表顯示和統(tǒng)計說明;
b)對外組件信息查詢:查詢對外可見的相關(guān)組件信息,根據(jù)查詢的組件編碼及其版本描述返回對應(yīng)
的組件名稱、組件地址、組件地址類型、組件入?yún)?、組件出參以及組件開發(fā)者等相關(guān)組件信息;
c)組件列表查詢:組件列表查詢,結(jié)果應(yīng)包括組件編碼、組件版本、組件引擎等組件概要說明,且
結(jié)果支持列表顯示和統(tǒng)計說明;
d)組件信息查詢:組件信息查詢,根據(jù)查詢的組件編碼及其版本描述返回對應(yīng)的組件名稱、組件地
址、組件地址類型、組件入?yún)?、組件出參以及組件開發(fā)者等相關(guān)組件信息。
12
T/CSEE####—2023
8.6.3組件檢查
組件檢查約定了組件參數(shù)驗證、組件健康檢查的技術(shù)要求。
a)組件參數(shù)驗證:根據(jù)組件編碼和組件版本信息,驗證組件參數(shù)是否合法;
b)組件健康檢查:根據(jù)組件編碼和組件版本信息,檢查組件服務(wù)健康狀態(tài)。
8.6.4組件注銷
根據(jù)組件編碼及其版本描述,注銷對應(yīng)組件相關(guān)信息。
8.7統(tǒng)一資源互聯(lián)協(xié)議
8.7.1數(shù)據(jù)集互聯(lián)協(xié)議
自有數(shù)據(jù)集創(chuàng)建
在當前節(jié)點創(chuàng)建自有數(shù)據(jù)集,并對該數(shù)據(jù)集添加數(shù)據(jù)集來源、數(shù)據(jù)集權(quán)限等信息進行設(shè)置,自有數(shù)
據(jù)集創(chuàng)建完成后生成對應(yīng)的數(shù)據(jù)集ID,且該數(shù)據(jù)集ID在節(jié)點內(nèi)唯一。
數(shù)據(jù)集查詢
數(shù)據(jù)集查詢約定了公開數(shù)據(jù)集列表查詢、自有數(shù)據(jù)集列表查詢、授權(quán)數(shù)據(jù)集列表查詢、合作數(shù)據(jù)集
信息查詢、自有數(shù)據(jù)集信息查詢、已授權(quán)數(shù)據(jù)集列表查詢的技術(shù)要求。
a)公開數(shù)據(jù)集列表查詢:發(fā)起方向合作方查詢公開的數(shù)據(jù)集列表,結(jié)果支持列表顯示和記錄總數(shù)統(tǒng)
計說明;
b)自有數(shù)據(jù)集列表查詢:根據(jù)項目ID,查詢當前節(jié)點自有數(shù)據(jù)集,結(jié)果支持列表顯示和記錄總數(shù)
統(tǒng)計說明;
c)授權(quán)數(shù)據(jù)集列表查詢:發(fā)起方向合作方查詢已授權(quán)本方的(不含公開的)數(shù)據(jù)集列表,結(jié)果支持
列表顯示和記錄總數(shù)統(tǒng)計說明;
d)合作數(shù)據(jù)集信息查詢:根據(jù)數(shù)據(jù)集ID,發(fā)起方向合作方查詢公開的或已授權(quán)本方的數(shù)據(jù)集信息;
e)自有數(shù)據(jù)集信息查詢:根據(jù)數(shù)據(jù)集ID,查詢當前節(jié)點單個數(shù)據(jù)集詳情;
f)已授權(quán)數(shù)據(jù)集列表查詢:遵循授權(quán)模式的規(guī)定,查詢當前節(jié)點授權(quán)外部或被授權(quán)的數(shù)據(jù)集列表,
結(jié)果支持列表顯示和記錄總數(shù)統(tǒng)計說明。
數(shù)據(jù)集授權(quán)
數(shù)據(jù)集授權(quán)約定了數(shù)據(jù)集授權(quán)申請、數(shù)據(jù)集授權(quán)申請取消、數(shù)據(jù)集主動授權(quán)、數(shù)據(jù)集授權(quán)確認、數(shù)
據(jù)集授權(quán)查詢的技術(shù)要求。
a)數(shù)據(jù)集授權(quán)申請:發(fā)起方向合作方發(fā)起數(shù)據(jù)集授權(quán)申請,授權(quán)申請包括申請授權(quán)的數(shù)據(jù)集ID、
授權(quán)作用域類型以及權(quán)限有效期等,申請發(fā)起后會生成對應(yīng)的申請ID,結(jié)果需等待對方通知;
b)數(shù)據(jù)集授權(quán)申請取消:根據(jù)數(shù)據(jù)集授權(quán)申請ID,發(fā)起方向合作方取消數(shù)據(jù)集授權(quán)申請,待處理
狀態(tài)才有效;
c)數(shù)據(jù)集主動授權(quán):主動授予合作節(jié)點數(shù)據(jù)集權(quán)限,授權(quán)信息包括申請授權(quán)的數(shù)據(jù)集ID、授權(quán)作
用域類型以及權(quán)限有效期等;
d)數(shù)據(jù)集授權(quán)確認:根據(jù)數(shù)據(jù)集授權(quán)申請ID,合作方向發(fā)起方確認是否接受本次授權(quán);
13
T/CSEE####—2023
e)數(shù)據(jù)集授權(quán)查詢:根據(jù)數(shù)據(jù)集授權(quán)申請ID,發(fā)起方向合作方查詢申請狀態(tài),確認回調(diào)失敗的兜
底操作。
數(shù)據(jù)集權(quán)限撤銷
合作方可以主動撤銷授權(quán)通過的數(shù)據(jù)集權(quán)限。
8.7.2模型互聯(lián)協(xié)議
模型查詢
模型查詢約定了模型列表查詢、模型信息查詢的技術(shù)要求。
a)模型列表查詢:根據(jù)項目ID,查詢當前節(jié)點模型,結(jié)果支持列表顯示和統(tǒng)計說明;
b)模型信息查詢:根據(jù)模型ID,查詢當前節(jié)點單個模型詳情,包括模型名稱、模型所屬任務(wù)、模
型文件位置、模型創(chuàng)建時間、模型算法等。
模型審批
模型審批約定了合作模型審批、合作模型審批確認、合作模型審批查詢的技術(shù)要求。
a)合作模型審批:根據(jù)模型文件的摘要值和模型所屬任務(wù)、所屬作業(yè)、所屬項目,由合作節(jié)點對模
型(碎片)進行審批,并生成對應(yīng)的審批ID;
b)合作模型審批確認:根據(jù)審批ID和審批狀態(tài),由合作節(jié)向發(fā)起方確認審批結(jié)果;
c)合作模型審批查詢:根據(jù)審批ID,發(fā)起方向合作方查詢審批結(jié)果,確定該模型的審批狀態(tài)。
9互聯(lián)互通要求
9.1通信要求
電力隱私計算互聯(lián)互通應(yīng)滿足通信要求包括:
a)互聯(lián)互通場景中,各隱私計算節(jié)點應(yīng)通過協(xié)商機制確定統(tǒng)一的通信規(guī)范,包括通信框架、數(shù)據(jù)格
式、安全機制、網(wǎng)絡(luò)環(huán)境等;
b)各隱私計算節(jié)點通信接口應(yīng)采用國家密碼管理主管部門認證核準的密碼技術(shù)保證通信過程中數(shù)
據(jù)的機密性、完整性和不可否認性,以確保傳送或接收的通信數(shù)據(jù)不發(fā)生泄漏、篡改、抵賴等
情況。
c)應(yīng)提供多種標準通訊協(xié)議支持節(jié)點間進行數(shù)據(jù)交互,如:HTTP(s)、GRPC(s);
d)各隱私計算節(jié)點間應(yīng)通過協(xié)商確定網(wǎng)絡(luò)傳輸環(huán)境,運行于公網(wǎng)、內(nèi)網(wǎng)、運營商專線等物理網(wǎng)絡(luò)環(huán)
境之中,不宜采用無線網(wǎng)絡(luò)連接,如確需采用應(yīng)確保無線網(wǎng)絡(luò)的安全性;
e)建議使用一致的IPV4、IPV6網(wǎng)絡(luò),如果IP格式不一致,應(yīng)具有格式相互轉(zhuǎn)換功能;
f)對于網(wǎng)絡(luò)環(huán)境整體安全性和穩(wěn)定性有更高要求的,建議使用專線網(wǎng)絡(luò)。
9.2數(shù)據(jù)安全合規(guī)要求
電力隱私計算互聯(lián)互通應(yīng)滿足數(shù)據(jù)安全合規(guī)要求包括:
a)節(jié)點參與互聯(lián)互通前應(yīng)經(jīng)過雙向身份認證,以確保連接節(jié)點身份有效性和合法性:
1)各隱私計算節(jié)點的身份標識應(yīng)具有唯一性,通過標識符可唯一確定連接節(jié)點身份;
2)身份認證采用的密碼技術(shù)應(yīng)由國家密碼管理主管部門認證核準;
3)節(jié)點身份認證的內(nèi)容應(yīng)包括IP地址、端口、角色等;
14
T/CSEE####—2023
4)認證證書應(yīng)滿足國家密碼管理部門的相關(guān)要求,同時符合GB/T20518-2006、GB/T27928.1
等標準文件要求;
5)宜具備身份認證失敗的處理能力,當身份認證應(yīng)答超過規(guī)定時限時,平臺宜終止與待接入節(jié)
點之間的當前會話;當經(jīng)過一定次數(shù)的認證失敗后,平臺宜終止由該節(jié)點發(fā)起的建立會話
的嘗試,并在一定的安全時間間隔后恢復(fù)。
b)節(jié)點間應(yīng)協(xié)商建立統(tǒng)一的資源分層授權(quán)訪問控制機制,防止資源越權(quán)訪問:
1)應(yīng)保證權(quán)限最小化原則,滿足資源使用的最低要求即可;
2)各方應(yīng)約定資源使用期限、使用范圍、使用數(shù)量等細節(jié),超出授權(quán)范圍則資源無法被使用;
3)資源所有者應(yīng)能夠?qū)σ咽跈?quán)的資源取消授權(quán),取消授權(quán)后資源無法被外部使用。
4)訪問控制范圍應(yīng)覆蓋各平臺涉及的節(jié)點、資源和操作等,并能夠根據(jù)業(yè)務(wù)需要對訪問權(quán)限進
行配置。
c)節(jié)點提供的數(shù)據(jù)集、模型、算法等資源應(yīng)提供安全性證明,資源被加載進入異構(gòu)的隱私計算平臺
前應(yīng)進行安全性認證和檢測:
1)節(jié)點提供的算法資源應(yīng)確保輸入數(shù)據(jù)明文不出可信域、電力明細數(shù)據(jù)原則上不出數(shù)據(jù)中臺,
且各方明文中間結(jié)果被安全保護;
2)節(jié)點提供的算法資源應(yīng)滿足在半誠實安全模型下不會泄漏敏感信息,支持計算安全強度不低
于112比特,統(tǒng)計安全強度不低于30比特;
3)各節(jié)點可根據(jù)實際需求協(xié)商采取不同的資源安全性認證措施,例如:摘要值比對、漏洞掃描、
數(shù)字簽名等。
d)各平臺應(yīng)具備對關(guān)鍵數(shù)據(jù)和關(guān)鍵行為進行記錄的能力,以滿足內(nèi)外部監(jiān)管審計以及任務(wù)責任歸屬
追溯的需要:
1)存證內(nèi)容應(yīng)支持依據(jù)監(jiān)管方及業(yè)務(wù)的具體需求進行定制化,存證方式包括但不限于日志、區(qū)
塊鏈等;
2)應(yīng)對存證內(nèi)容進行訪問控制,防止非授權(quán)用戶對存證內(nèi)容進行查看、刪除,存證內(nèi)容應(yīng)滿足
不可篡改性;
3)應(yīng)在各參與方約定的期限內(nèi)對存證內(nèi)容進行銷毀,根據(jù)法律法規(guī)要求約定的存儲時限應(yīng)不少
于6個月;應(yīng)采用加密技術(shù)確保存證的數(shù)據(jù)不能暴露或推斷出非授權(quán)的個人隱私數(shù)據(jù);
4)應(yīng)對存證內(nèi)容進行完整性保護和定時備份,當存證內(nèi)容存儲已滿、失敗和受到攻擊時,應(yīng)確
保存證內(nèi)容不被篡改、破壞;
5)為保證后續(xù)對任務(wù)執(zhí)行正確性和計算結(jié)果準確性進行深入審計,宜具備通過授權(quán)后恢復(fù)或部
分恢復(fù)存證內(nèi)容的能力。
e)各隱私計算節(jié)點及平臺應(yīng)具備存儲數(shù)據(jù)的完整性、機密性和可用性保護機制:
1)各平臺應(yīng)采用國家密碼管理主管部門認證核準的密碼技術(shù)保障平臺中存儲數(shù)據(jù)的完整性,存
儲的重要數(shù)據(jù)應(yīng)不能被篡改。
2)各平臺應(yīng)采用國家密碼管理主管部門認證核準的密碼技術(shù)對平臺中存儲的數(shù)據(jù)進行加密存
儲,重要數(shù)據(jù)應(yīng)以密文方式存儲。
3)各平臺應(yīng)采取實時備份方式保證重要數(shù)據(jù)的可用性,當數(shù)據(jù)受到破壞時應(yīng)能及時恢復(fù)。
4)各平臺應(yīng)采取冗余部署模式,保證單個節(jié)點發(fā)生故障時系統(tǒng)業(yè)務(wù)維持穩(wěn)定。
5)各平臺發(fā)生邏輯錯誤時,應(yīng)能夠安全的從錯誤中恢復(fù),并保證數(shù)據(jù)的一致性。
15
T/CSEE####—2023
f)隱私計算互聯(lián)互通全過程中使用的密碼技術(shù)包括加密、簽名、哈希、密碼交換技術(shù)等應(yīng)在國密或
國際標準密碼管理相關(guān)規(guī)定范圍內(nèi)協(xié)商一致,優(yōu)選使用由國家密碼管理主管部門認證核準的國
密算法加強自主可控,且至少滿足安全強度的要求,包括:
1)對稱密碼:SM4(128bits)、AES(128bits);
2)非對稱密碼:SM2(256bits)、ECDSA(256bits)、RSA-2048(112bits);
3)哈希函數(shù):SM3(128bits)、SHA3-256(128bits)、SHA3-512(256bits)、SHA256(128bits);
4)當對密碼技術(shù)有更高要求時,各方可以共同協(xié)商使用安全性比以上更高的加密算法
g)互聯(lián)互通應(yīng)采用安全的通信信道,確保通信過程中的數(shù)據(jù)完整性、真實性,保證通信過程中敏感
信息字段或報文的機密性,保證參與通信的各實體行為的不可否認性,建議采用SSL3.2/TLS1.2
以上的安全通信機制。
h)電力隱私計算平臺應(yīng)支持內(nèi)外網(wǎng)穿透建模能力,確保外網(wǎng)隱私計算平臺和內(nèi)網(wǎng)隱私計算平臺通過
模型中間參數(shù)跨隔離交互,共同完成隱私計算建模。
9.3性能要求
參與電力隱私計算互聯(lián)互通的隱私計算平臺應(yīng)滿足性能要求包括:
a)互聯(lián)互通對隱私計算平臺通信效率和計算效率產(chǎn)生的影響應(yīng)在業(yè)務(wù)需求可接受的范圍內(nèi);
b)支持完成海量數(shù)據(jù)的處理、計算,如:十億級數(shù)據(jù)的安全融合,百億級數(shù)據(jù)的安全查詢,億級數(shù)
據(jù)的安全計算,萬級數(shù)據(jù)、百級特征的聯(lián)合建模,億級數(shù)據(jù)的模型在線推理等;
c)宜支持多個維度的效率優(yōu)化,包括軟硬件升級、專用計算芯片、算法優(yōu)化等。
9.4準確性要求
參與電力隱私計算互聯(lián)互通的隱私計算平臺應(yīng)滿足準確性要求包括:
a)在聯(lián)合基礎(chǔ)運算、聯(lián)合統(tǒng)計分析場景中,明文本地計算結(jié)果與隱私計算結(jié)果之間的相對誤差應(yīng)保
持在合理范圍內(nèi),計算精度≥32。(該項指標取值代表計算結(jié)果與相同明文數(shù)據(jù)計算結(jié)果連續(xù)
相同的有效位數(shù)(以二進制表示);
b)在隱私集合求交、隱私信息檢索場景中,得到的結(jié)果應(yīng)與明文本地計算結(jié)果保持一致;
c)在聯(lián)邦機器學(xué)習場景中,使用相同的數(shù)據(jù)集樣本、輸入特征和訓(xùn)練參數(shù)進行訓(xùn)練,隱私計算得到
的模型應(yīng)與在明文數(shù)據(jù)集上訓(xùn)練得到的模型在新數(shù)據(jù)上的預(yù)測結(jié)果保持一致。
16
T/CSEE####—2023
附錄A
(資料性)
隱私計算電力應(yīng)用實踐用例
A.1基于聯(lián)邦學(xué)習的重點污染企業(yè)排放監(jiān)測
A.1.1業(yè)務(wù)背景
環(huán)境問題關(guān)乎國計民生。為響應(yīng)生態(tài)環(huán)境部門關(guān)于重點污染企業(yè)排放監(jiān)測中對電力數(shù)據(jù)的需求,將
電力數(shù)據(jù)賦能重點污染企業(yè)排放監(jiān)測工作,同時為保證生態(tài)環(huán)境部門重點污染企業(yè)負面數(shù)據(jù)不外泄,以
及企業(yè)用電數(shù)據(jù)不外泄。通過隱私計算技術(shù)實現(xiàn)“重點污染企業(yè)排放監(jiān)測”場景。利用電力數(shù)據(jù)和生態(tài)
環(huán)境數(shù)據(jù),能夠?qū)χ攸c污染企業(yè)的生產(chǎn)排污情況進行監(jiān)測,實現(xiàn)企業(yè)污染排放全場景在線監(jiān)測,及時發(fā)
現(xiàn)企業(yè)生產(chǎn)過程中的違規(guī)生產(chǎn)的現(xiàn)象,提升污染防治精準管控水平。
A.1.2數(shù)據(jù)準備
電網(wǎng)企業(yè)和生態(tài)環(huán)境部門各自擁有重點污染企業(yè)的關(guān)鍵企業(yè)信息、用電數(shù)據(jù)、企業(yè)限停產(chǎn)政策數(shù)據(jù),
以及重污染天氣氣象等級等數(shù)據(jù),從聯(lián)合建模分析的角度出發(fā),首先構(gòu)建融合電力和環(huán)境的多維數(shù)據(jù)特
征。
表1數(shù)據(jù)特征維度
數(shù)據(jù)種類數(shù)據(jù)特征
企業(yè)名稱
統(tǒng)一社會信用代碼
表號
企業(yè)日用電量
電力數(shù)據(jù)
合同容量
企業(yè)用電量級別
企業(yè)歷史典型用電量
是否為高耗電企業(yè)(布爾)
重點污染企業(yè)名稱
政府生態(tài)環(huán)境部門數(shù)據(jù)統(tǒng)一社會信用代碼
停限產(chǎn)政策
停限產(chǎn)時間
17
T/CSEE####—2023
重污染天氣氣象等級
有無響應(yīng)重污染天氣停限產(chǎn)政策
A.1.3模型設(shè)計
(1)數(shù)據(jù)虛擬融合
建模中涉及的相關(guān)方在數(shù)據(jù)上不但由參與方各自持有,還呈現(xiàn)出多尺度,多模態(tài)等特性。結(jié)合上述
特點,模型中采用了數(shù)據(jù)源的虛擬融合和特征工程兩個環(huán)節(jié)實現(xiàn)了安全聯(lián)邦建模前的數(shù)據(jù)準備,如圖5
所示。前者解決了任務(wù)合作方數(shù)據(jù)安全,實現(xiàn)了任務(wù)發(fā)起方對數(shù)據(jù)持有方的數(shù)據(jù)申請授權(quán)以及對齊;后
者解決了復(fù)雜數(shù)據(jù)的特征統(tǒng)計學(xué)習分析。
圖5聯(lián)合建模數(shù)據(jù)準備工作流程
(2)數(shù)據(jù)特征工程
特征工程環(huán)節(jié)中,采用了數(shù)據(jù)挖掘和統(tǒng)計學(xué)習方法。重點污染企業(yè)違規(guī)排放建模中使用了9項處理
流程:特征篩選、樣本抽樣、缺失值處理、異常值處理、標準化歸一化處理、數(shù)據(jù)集劃分、變量分項、
WOE轉(zhuǎn)化、特征統(tǒng)計。下表中闡述了特征工程環(huán)節(jié)中的9項操作。
表2數(shù)據(jù)特征工程流程
步驟實施流程描述
根據(jù)數(shù)據(jù)特點選擇缺失值比例篩選、方差篩選、變
1特征篩選異系數(shù)篩選、iv值篩選、逐步回歸篩選、手動篩選
等,保證特征有效性。
對樣本中的類別不均衡問題實現(xiàn)樣本過采樣或欠
2樣本抽樣采樣,按Y值取值樣本量的比例設(shè)置抽樣或按Y
值取值樣本量的數(shù)量設(shè)置抽樣。
聯(lián)合建模前對缺失值進行處理,解決多數(shù)算法無法
3缺失值處理
直接處理缺失數(shù)據(jù)的問題
數(shù)據(jù)中的異常值會影響模型計算的準確性,建模前
4異常值處理
先識別是否存在異常值,如果存在則對異常值進行
18
T/CSEE####—2023
替換處理。
歸一化/標準化模塊用于數(shù)據(jù)縮放,數(shù)據(jù)縮放可以消
除數(shù)據(jù)量綱影響,提升模型的收斂速度。數(shù)據(jù)進行
5標準化歸一化處理
歸一化后可縮放到0-1之間。數(shù)據(jù)進行標準化后服
從標準正態(tài)分布。
在進行模型訓(xùn)練時,將建模樣本劃分為訓(xùn)練集和測
6數(shù)據(jù)集劃分試集兩部分。訓(xùn)練集用于模型訓(xùn)練,測試集用于測
試模型的效果。
根據(jù)等頻分箱、等距分箱、卡方分箱等連續(xù)型變量
分箱和一般離散型變量分箱、高基類變量分箱等離
7變量分箱
散型變量分箱對連續(xù)變量離散化,特征離散化后,
保證模型穩(wěn)定,降低模型過擬合風險。
分箱之后得到了一系列的離散變量,對變量進行編
8WOE轉(zhuǎn)化
碼,保證字符型變量可在算法中進行入模。
根據(jù)變量類型不同,按不同維度進行特性統(tǒng)計并生
9特征統(tǒng)計
成統(tǒng)計分析報告。
(3)模型設(shè)計
重點污染企業(yè)違規(guī)排放模型中,生態(tài)環(huán)境部門作為企業(yè)排放監(jiān)測任務(wù)發(fā)起方,需要電力有關(guān)數(shù)據(jù)支
持和賦能,基于企業(yè)用電量等數(shù)據(jù)和重點污染企業(yè)數(shù)據(jù),通過隱私計算平臺的聯(lián)邦學(xué)習功能模塊構(gòu)建重
點污染企業(yè)違規(guī)排放模型,通過模型確定各重點污染企業(yè)有無按照政策在重污染天氣時安規(guī)定減產(chǎn)或停
產(chǎn)。重點污染企業(yè)違規(guī)排放模型選擇了基于同態(tài)加密的縱向邏輯回歸V-LR算法。
如下圖所示,在樣本對齊及模型訓(xùn)練過程中,參與方各自的數(shù)據(jù)均保留在本地,且訓(xùn)練過程中各節(jié)
點之間只交互梯度值,不會導(dǎo)致數(shù)據(jù)隱私泄露,模型訓(xùn)練結(jié)果參與方只保存己方特征對應(yīng)的模型參數(shù),
無法獲取其他參與方特征的模型參數(shù)。因此,雙方在聯(lián)邦學(xué)習的幫助下得以實現(xiàn)合作訓(xùn)練模型。
圖6重點污染企業(yè)違規(guī)排放建模
19
T/CSEE####—2023
重點污染企業(yè)違規(guī)排放模型構(gòu)建完成后,通過AUC、KS等評價指對模型評價,根據(jù)模型報告了解
各字段對模型訓(xùn)練的貢獻率。同時使用LR模型產(chǎn)出的模型系數(shù)標結(jié)合企業(yè)日用電量、企業(yè)歷史典型用
電量、重污染天氣氣象等級等x值對重點污染企業(yè)進行預(yù)測,判斷企業(yè)有無響應(yīng)重污染天氣停限產(chǎn)政策。
A.1.4應(yīng)用成效
通過對電力數(shù)據(jù)及重點企業(yè)污染數(shù)據(jù)進行聯(lián)邦學(xué)習模型構(gòu)建,打造重點污染企業(yè)違規(guī)排放模型落地
重點污染企業(yè)排放監(jiān)測場景,可將企業(yè)有無響應(yīng)重污染天氣停限產(chǎn)政策結(jié)果數(shù)據(jù)反饋給生態(tài)環(huán)境部門,
幫助生態(tài)環(huán)境部門及時了解企業(yè)排放現(xiàn)狀及政策落實有效性,敦促在嚴控生產(chǎn)過程中的污染物排放的同
時,達成特定天氣環(huán)境狀態(tài)下的節(jié)能要求。推進重點企業(yè)污染防治綜合性工作,強化重點企業(yè)污染防治
目標責任、調(diào)整優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、實施重點企業(yè)污染防治重點工程、加強重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 外籍人員用餐管理辦法
- 維修質(zhì)量風險管理辦法
- 電廠燃料采購管理辦法
- 后勤職工培訓(xùn)課件
- 肝膿腫護理課件下載
- 肝臟生理功能課件中醫(yī)
- 福州八上期中數(shù)學(xué)試卷
- 肝病用藥護理課件
- 肝病心理護理課件下載
- 高中學(xué)考往年數(shù)學(xué)試卷
- 2022年浙江紹興市新聞傳媒中心招聘工作人員筆試備考題庫及答案解析
- 施工現(xiàn)場臨時用電驗收表參考模板范本
- 煤礦門益門區(qū)益門
- 八年級語文課外文言文閱讀 專項訓(xùn)練
- 國際貿(mào)易出口業(yè)務(wù)一般流程
- 2023年物流公司介紹PPT
- 2023山西高考志愿填報指南(詳細)
- GB/T 8431-1998紡織品色牢度試驗光致變色的檢驗和評定
- GB/T 19889.5-2006聲學(xué)建筑和建筑構(gòu)件隔聲測量第5部分:外墻構(gòu)件和外墻空氣聲隔聲的現(xiàn)場測量
- GB/T 18391.1-2009信息技術(shù)元數(shù)據(jù)注冊系統(tǒng)(MDR)第1部分:框架
- GB/T 1048-2019管道元件公稱壓力的定義和選用
評論
0/150
提交評論