寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的應(yīng)用研究。最近陳智罡博士的團(tuán)隊(duì)開發(fā)了一個(gè)將SEAL全同態(tài)加密庫映射到Python上的接口,解
寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的應(yīng)用研究。最近陳智罡博士的團(tuán)隊(duì)開發(fā)了一個(gè)將SEAL全同態(tài)加密庫映射到Python上的接口,解決了機(jī)器學(xué)習(xí)庫與全同態(tài)加密庫對(duì)接的問題,極大的方便了機(jī)器學(xué)習(xí)領(lǐng)域人員使用全同態(tài)加密算法,為其它領(lǐng)域需要用到全同態(tài)加密庫的人們提供便利的工具。該庫已經(jīng)在GitHub上開源(github.com/Huelse/pyseal)。全世界各地的工程技術(shù)人員都可以使用該庫。
微軟的SEAL全同態(tài)加密庫包含BFV和CKKS兩種全同態(tài)加密方案,陳智罡博士團(tuán)隊(duì)要做的就是將這個(gè)庫的所有可用接口都映射到Python上來,并使之在Python上正確運(yùn)行。顯然這是一個(gè)全新的項(xiàng)目。
經(jīng)過分析討論,技術(shù)路線確定為使用微軟最新的SEAL庫(3.3版本)做為基礎(chǔ),與Pybind11官方頭文件庫作為中間件綁定,使用Setuptools或CMake編譯生成動(dòng)態(tài)鏈接庫。這樣就可供Python上調(diào)用SEAL庫接口。技術(shù)框架如下:
這不是一個(gè)簡單問題。初期,他們遇到了復(fù)雜的環(huán)境和標(biāo)準(zhǔn)問題,經(jīng)過反復(fù)確認(rèn),團(tuán)隊(duì)選擇使用是C++17標(biāo)準(zhǔn)和Python3.6.8的穩(wěn)定版作為開發(fā)環(huán)境。然而接下來團(tuán)隊(duì)碰到了三個(gè)棘手問題。
第一個(gè)問題,在最新版的SEAL庫中,其使用的是一個(gè)名為MemoryPoolHandle的類和MemoryManager基類作為計(jì)算過程中的指針與內(nèi)存池管理。因?yàn)镻ython的內(nèi)存管理是自動(dòng)化的,所以這個(gè)在Python里是無法直接實(shí)現(xiàn)。于是團(tuán)隊(duì)在wrapper綁定文件中,將其作為一個(gè)參數(shù)類導(dǎo)入,最終達(dá)成了相同的功能。
第二個(gè)問題,SEAL庫的Cipertext明文類中有一個(gè)關(guān)鍵參數(shù)scale,在測(cè)試環(huán)節(jié)中是要做到可自定義修改的,但問題在于這是一個(gè)私有變量。在C++中,定義好共有方法后,可通過應(yīng)用的方式對(duì)其賦值,但在Python中因?yàn)槠湔Z言特性,同樣不可能實(shí)現(xiàn)對(duì)私有變量的直接修改。所以經(jīng)過研究,團(tuán)隊(duì)的解決方法是在Cipertext類中增加一個(gè)共有方法set_scale(),該函數(shù)方法是整個(gè)項(xiàng)目唯一對(duì)SEAL庫做出修改的地方,也僅應(yīng)用于測(cè)試環(huán)節(jié)的使用,對(duì)全同態(tài)加密整體是無影響的。
第三個(gè)問題,出自于Python的內(nèi)存管理,這是一個(gè)技術(shù)難點(diǎn)與重點(diǎn)。提前說明一下,Python中假如我們?cè)诖a文件里定義一個(gè)變量a=0,我們?cè)賹懸粋€(gè)帶參數(shù)的函數(shù)foo(a),然后函數(shù)里會(huì)對(duì)a變量進(jìn)行一系列運(yùn)算使之改變。當(dāng)我們將a帶入到這個(gè)函數(shù)并使之運(yùn)行后我們發(fā)現(xiàn),在該函數(shù)里,a這個(gè)變量的確被運(yùn)算過了,但是在這個(gè)函數(shù)體之外的那個(gè)a,它的值并不會(huì)變。通過id()方法觀察內(nèi)存,最終確認(rèn)是這樣的。
而在C++里通過指針的方式實(shí)現(xiàn)對(duì)傳入?yún)?shù)的修改,SEAL庫多處的encode和decode函數(shù)都是這樣使用的。要在盡可能不改變SEAL庫源碼的情況下將其轉(zhuǎn)移到Python上來,且Python不能操控指針,僅這個(gè)問題困擾了團(tuán)隊(duì)很久。最終團(tuán)隊(duì)給出的方案是自定義一個(gè)變量類。
雖然在Python中單一的變量作為參數(shù)不會(huì)發(fā)生改變,但如果是一個(gè)類作為參數(shù)傳入,那它的改變是全局性的。比如uIntVector類在c++中的原型是std::vector,DoubleVector類其原型是std::vector。團(tuán)隊(duì)對(duì)類的包裝完成了這兩者最基本的數(shù)據(jù)交互,這樣CKKS方案就能完美運(yùn)行。至此陳智罡博士團(tuán)隊(duì)的Pyseal項(xiàng)目的主要工作也已完成。
最后,陳智罡博士的團(tuán)隊(duì)使用Pyseal將SEAL官方給出的6個(gè)樣例在Python上全部實(shí)現(xiàn),且運(yùn)行效率也并未減少。接口已經(jīng)在Github上開源。
寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的研究與開發(fā),希望能給全世界更多的技術(shù)工程人員帶來便利,更加方便地使用全同態(tài)加密庫。(致遠(yuǎn)博士)