歐盟GDPR認(rèn)證

日前,第四范式先知(Sage)企業(yè)級AI平臺完成了PrivacySealEU認(rèn)證工作程序,率先通過歐盟GDPR認(rèn)證,成為國內(nèi)第一款通過該認(rèn)證的AI平臺產(chǎn)品。

眾所周知,數(shù)據(jù)隱私保護(hù)一直是大眾和企業(yè)用戶關(guān)心的AI應(yīng)用焦點(diǎn)問題,而歐盟GDPR則是隱私保護(hù)領(lǐng)域最為權(quán)威和細(xì)致的立法,是全球個(gè)人數(shù)據(jù)保護(hù)和企業(yè)AI應(yīng)用的最高標(biāo)準(zhǔn),被稱為“史上最嚴(yán)個(gè)人數(shù)據(jù)保護(hù)法”,其通過約束信息處理行為,賦予公民對其個(gè)人數(shù)據(jù)更大的控制權(quán)。

此次先知(Sage)平臺通過歐盟GDPR認(rèn)證,在證明第四范式產(chǎn)品及隱私計(jì)算技術(shù)的數(shù)據(jù)安全性和可信任性的同時(shí),也帶來給我們一些思考,國內(nèi)的AI企業(yè)想要走出去,GDPR是一張不可或缺的入場劵和法律保障,更進(jìn)一步從行業(yè)角度來分析,眼下我們距離拿到這張門票還有多遠(yuǎn)的路要走,路又該怎么走?

“先知”完成歐盟GDPR認(rèn)證,其中蘊(yùn)含了哪些邏輯?

歐盟GDPR認(rèn)證的這條路,并不好走。

“我們一年多前就開始準(zhǔn)備相關(guān)的申請,PrivacySealEU不同于其它標(biāo)準(zhǔn)認(rèn)證,在條款上已經(jīng)細(xì)化到具體數(shù)據(jù)流問題,GDPR的條款‘多且細(xì)’,只有在確保所有條款‘絕對合規(guī)’時(shí),對方才會給予通過,因此我們準(zhǔn)備了大量的材料,涉及產(chǎn)品架構(gòu)設(shè)計(jì)、數(shù)據(jù)處理流程、技術(shù)端和法律、管理端等方方面面。”在接受鈦媒體專訪時(shí),第四范式主任科學(xué)家涂威威對鈦媒體表示。

在談及先知平臺之所以能夠通過歐盟GDPR認(rèn)證時(shí),涂威威告訴鈦媒體,主要有以下兩個(gè)方面的原因:

其一,得益于第四范式在隱私保護(hù)領(lǐng)域的持續(xù)投入和深厚積累,第四范式很早便投入到隱私保護(hù)技術(shù)探索中,并取得了一些實(shí)質(zhì)性的成果,比如第四范式的差分隱私算法,與其它差分隱私工作相比,在獲得相同隱私保護(hù)強(qiáng)度的同時(shí),擁有著還能得到更有效的分析結(jié)果;

其二,第四范式在安全性和合規(guī)性的意識較好,自成立之初便開始服務(wù)于金融類客戶,而金融正是安全高敏感行業(yè),因而客戶對于數(shù)據(jù)隱私的要求往往比其它領(lǐng)域要高,因此第四范式也更加了解企業(yè)對于隱私保護(hù)的要求和標(biāo)準(zhǔn)。

近年來,企業(yè)逐漸認(rèn)識到了AI的價(jià)值,將其視為“數(shù)智化轉(zhuǎn)型”的利器。AI的本質(zhì)在于能更有效、更精細(xì)化地挖掘數(shù)據(jù)的價(jià)值,而挖掘數(shù)據(jù)的同時(shí),伴隨著泄露隱私的風(fēng)險(xiǎn)。因此,企業(yè)以及AI技術(shù)廠商在應(yīng)用AI的同時(shí),更加注重在流程規(guī)范、人員培訓(xùn)、產(chǎn)品設(shè)計(jì)及功能、技術(shù)等方面“把好每一道關(guān)”。

從產(chǎn)品側(cè)來看舉個(gè)簡單的例子,為了提高AI模型效果,業(yè)界有些做法是通過網(wǎng)絡(luò)上爬數(shù)據(jù)或從第三方獲得一些數(shù)據(jù)來使用。而第四范式在先知產(chǎn)品的建模技術(shù)不依賴于任何第三方數(shù)據(jù),“客戶在完成工作后,其相應(yīng)的數(shù)據(jù)也隨之銷毀,數(shù)據(jù)無痕是先知平臺的基本特性。”第四范式國際化產(chǎn)品負(fù)責(zé)人王榮興對鈦媒體補(bǔ)充到。

不僅如此,第四范式資深研究員郭夏瑋介紹說:“先知平臺從一開始的系統(tǒng)設(shè)計(jì)以及算法設(shè)計(jì)就做了很多合規(guī)性方面的準(zhǔn)備。因?yàn)槲覀兊睦砟钍菍I賦能給企業(yè),讓企業(yè)擁有AI的能力,我們提供安全合規(guī)的數(shù)據(jù)治理加上客戶提供的合規(guī)數(shù)據(jù),再基于我們自研的保護(hù)隱私的AI算法,在保護(hù)用戶隱私的同時(shí)也可實(shí)現(xiàn)優(yōu)秀的效果,這樣的理念也得到了客戶的認(rèn)可和信任。因此,我們主要集中在技術(shù)上的打磨和產(chǎn)品的迭代。

另外,先知平臺還提供數(shù)據(jù)破解保護(hù),對于用戶地址、電話、身份證號、姓名等敏感信息進(jìn)行常規(guī)的匿名化處理,同時(shí)還支持更加嚴(yán)格的防止撞庫、差分攻擊等攻擊手段的先進(jìn)數(shù)據(jù)匿名化技術(shù),所有的可訪問接口均由完善的多層權(quán)限保護(hù)系統(tǒng)來控制。值得一提的是,先知平臺無論是公有云、私有云還是私有化部署,均達(dá)到了GDPR的要求。

在隱私保護(hù)中,技術(shù)起到了哪些關(guān)鍵作用?

事實(shí)上,AI模型訓(xùn)練涉及到大量用戶數(shù)據(jù)的使用,這些數(shù)據(jù)或多或少包含了敏感信息。

然而,以往常用的加密手段并不能完全保證數(shù)據(jù)安全,攻擊者還可以對分析結(jié)果的差分攻擊以及查表撞庫等方法反推原數(shù)據(jù)。此前,卡內(nèi)基梅隆大學(xué)Latanya Sweeney教授在《簡單的人口統(tǒng)計(jì)往往能識別出人的獨(dú)特性》報(bào)告中提到,在基于美國選舉人公共注冊信息的基礎(chǔ)上,87%的美國人基于郵編、性別、出生日期即有可能被識別出個(gè)人身份。“甚至是統(tǒng)計(jì)數(shù)據(jù)也可能泄露用戶隱私”,涂威威提到,“有一種針對統(tǒng)計(jì)數(shù)據(jù)的重建攻擊,可以通過數(shù)據(jù)方發(fā)布的大量統(tǒng)計(jì)數(shù)據(jù)、模型等,反向求解重建數(shù)據(jù)信息,例如美國2010年人口普查,基于3億人口,發(fā)布50億統(tǒng)計(jì)指標(biāo),通過求解線性系統(tǒng)就可以很大程度上重建原數(shù)據(jù),早在2003年就有公開論文詳細(xì)描述了這種攻擊方法”。

在兼顧發(fā)揮AI價(jià)值以及保護(hù)隱私的情況下,有著充分理論基礎(chǔ)的差分隱私技術(shù)正在成為隱私保護(hù)以及AI領(lǐng)域的關(guān)注焦點(diǎn)。在《麻省理工科技評論》最新發(fā)布的2020“全球十大突破性技術(shù)”中,該技術(shù)位列其中。

針對于此,涂威威對鈦媒體談到,“差分隱私是一個(gè)數(shù)學(xué)上的約束定義,假設(shè)把一個(gè)操作當(dāng)成一臺機(jī)器,輸入是數(shù)據(jù),輸出是根據(jù)數(shù)據(jù)產(chǎn)生的一些結(jié)果,那么這些結(jié)果是可能泄露數(shù)據(jù)隱私的。我們所說的這臺機(jī)器滿足差分隱私,直觀上就是假如輸入數(shù)據(jù)在有限的改變情況下,輸出的改變也應(yīng)該滿足一定范圍,如果輸出改變很大,那么就容易使用類似“差分攻擊”的手段從輸出結(jié)果來竊取用戶隱私。具體的方法,是對原操作中的某些步驟,通過注入噪聲、混淆等形式,來使得操作得到差分隱私保證。然而就目前的大多數(shù)方法以及對應(yīng)的理論來看,對于隱私保護(hù)的要求越高,需要注入的噪聲強(qiáng)度越大,從而對算法效果造成嚴(yán)重負(fù)面影響。

第四范式對目前的差分隱私技術(shù)進(jìn)一步優(yōu)化,通過更好的分配隱私預(yù)算、更有效的分配噪聲等方法,做到了在保護(hù)數(shù)據(jù)隱私的同時(shí),提升分析結(jié)果的有效性。目前,該技術(shù)可廣泛應(yīng)用于數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)發(fā)布等階段。

值得一提的是,該方法還可以直接拓展到遷移學(xué)習(xí)上來,第四范式與瑞金醫(yī)院合作的“瑞寧知糖”,便應(yīng)用了該方法,系統(tǒng)可從數(shù)據(jù)較為完善的大型醫(yī)院中遷移出有價(jià)值且受隱私保護(hù)的知識,去幫助地方醫(yī)院、社區(qū)醫(yī)院、體檢中心等機(jī)構(gòu)做更加完善的醫(yī)療診斷。

更進(jìn)一步,當(dāng)前的隱私保護(hù)技術(shù)使用門檻較高,在保護(hù)隱私的前提下,多方聯(lián)合數(shù)據(jù)建模的常見做法依然需要比較多的專家人工介入到數(shù)據(jù)預(yù)處理、特征工程、模型調(diào)參當(dāng)中,第四范式也進(jìn)一步提出了保護(hù)隱私的自動(dòng)多方機(jī)器學(xué)習(xí)的方法,綜合差分隱私技術(shù)、自動(dòng)化機(jī)器學(xué)習(xí)技術(shù),減少了專家人工的介入,一方面進(jìn)一步提升了安全性,另一方面也大幅降低了隱私保護(hù)技術(shù)的使用門檻,使得廣泛落地成為可能。

同時(shí),涂威威也指出,以差分隱私為代表的隱私保護(hù)技術(shù)仍需要在理論、效果、應(yīng)用、成本等方面進(jìn)一步解決和優(yōu)化。

在隱私保護(hù)這條道路上,AI企業(yè)是否有捷徑可走?

隨著人工智能與各類行業(yè)、多個(gè)場景深度融合加速,針對數(shù)據(jù)隱私、數(shù)據(jù)安全的防護(hù)已然成為產(chǎn)品不可或缺的一環(huán)。

但隱私泄漏事件在AI圈卻屢見不鮮,就在日前,美國人臉識別創(chuàng)企Clearview AI就被爆出重大數(shù)據(jù)泄露丑聞,企業(yè)稱其整個(gè)客戶名單都被盜,包括美國警方、執(zhí)法機(jī)構(gòu)和銀行,在社會上掀起軒然大波的同時(shí),這家公司目前也面臨多起訴訟和調(diào)查。

根據(jù)相關(guān)報(bào)道稱,Clearview AI從網(wǎng)絡(luò)社交媒體上抓取了超過30億張照片,形成了龐大的生物特征信息數(shù)據(jù)庫,有600多家執(zhí)法機(jī)構(gòu)及一些私人安保公司都在使用它的人臉識別產(chǎn)品。只要上傳任何一張照片到Clearview AI的軟件,就能查到這個(gè)人在各社交媒體平臺上的照片,甚至是姓名、地址以及其他身份信息,而且這些數(shù)據(jù)還未經(jīng)過被抓取照片者本人同意,這顯然是AI產(chǎn)品不合規(guī)化發(fā)展帶來的必然結(jié)果。

眼下,國內(nèi)在數(shù)據(jù)合規(guī)方面的整體意識不斷增強(qiáng),無論是政府、企業(yè)還是大眾,都越來越重視隱私保護(hù)。這就意味著,AI企業(yè)在隱私保護(hù)和數(shù)據(jù)安全這條道路上并沒有什么捷徑可走,AI企業(yè)必須靜下心來做好產(chǎn)品本身。在涂威威看來,數(shù)據(jù)隱私、數(shù)據(jù)安全將會是接下來的行業(yè)熱點(diǎn)話題,而數(shù)據(jù)作為AI技術(shù)應(yīng)用的核心基礎(chǔ),更必須要打牢。

從某種程度上來分析,第四范式先知成為國內(nèi)首個(gè)通過GDPR認(rèn)證AI平臺對于行業(yè)來說,很有可能讓國內(nèi)AI企業(yè)對于數(shù)據(jù)隱私、數(shù)據(jù)安全的建設(shè)提上日程,而日后的AI競爭格局,也將上升到更高的維度。

(本文首發(fā)鈦媒體,作者/桑明強(qiáng))

本文系作者 桑明強(qiáng) 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報(bào)

更多

14:30

3月31日全國農(nóng)產(chǎn)品批發(fā)市場豬肉平均價(jià)格為15.31元/公斤,比昨天下降1.0%

14:25

工信部:前2個(gè)月我國集成電路設(shè)計(jì)收入636億元,同比增長15.7%

14:23

工信部:前2個(gè)月我國軟件業(yè)務(wù)收入21534億元,同比增長11.7%

14:17

聯(lián)合利華與味可美就食品業(yè)務(wù)進(jìn)行深入談判,最早于今日達(dá)成協(xié)議

14:16

南向資金凈買入額達(dá)50億港元

14:02

英國第四季度GDP年率終值為1%

13:58

吉利旗下沃飛長空增資至3.6億

13:55

瑞銀:預(yù)計(jì)到年底金價(jià)將逐漸回落,未來幾年將走低

13:54

光纖概念震蕩回升,特發(fā)信息漲停

13:51

高盛:參考1990年石油危機(jī),美聯(lián)儲終將降息

13:50

創(chuàng)新藥概念午后再度活躍,海創(chuàng)藥業(yè)漲超11%

13:50

支付寶發(fā)布國內(nèi)首個(gè)“支付集成Skill”

13:46

騰訊WorkBuddy小程序上線,支持"云端+本機(jī)"雙模式運(yùn)行

13:39

寧波商業(yè)航天產(chǎn)業(yè)基地項(xiàng)目將于4月開啟招標(biāo),預(yù)計(jì)總投資額86.6億

13:39

滬深京三市成交額超1.5萬億元,較上日此時(shí)放量62億元

13:29

瑞銀:中國市場調(diào)整或已過度,優(yōu)質(zhì)AI股票迎來布局窗口

13:24

北京消費(fèi)品以舊換新政策持續(xù)落地,帶動(dòng)銷售額約50億元

13:23

全國新能源汽車動(dòng)力電池溯源信息平臺正式啟動(dòng)

13:22

深圳:規(guī)模建設(shè)先進(jìn)級智能工廠

13:20

摩托車概念異動(dòng),宏昌科技走出20cm2連板

1

掃描下載App