• <track id="6sua3"></track>

  • <menuitem id="6sua3"></menuitem>
  • <menuitem id="6sua3"></menuitem>

    <progress id="6sua3"><bdo id="6sua3"></bdo></progress>
    <samp id="6sua3"></samp>

        1. <samp id="6sua3"></samp>

            第四范式AI平臺通過GDPR,保護隱私有哪些關鍵技術?

            2020-03-02 09:58:49     來源:鳳凰網

            歐盟GDPR認證

            日前,第四范式先知(Sage)企業級AI平臺完成了PrivacySealEU認證工作程序,率先通過歐盟GDPR認證,成為國內第一款通過該認證的AI平臺產品。

            眾所周知,數據隱私保護一直是大眾和企業用戶關心的AI應用焦點問題,而歐盟GDPR則是隱私保護領域最為權威和細致的立法,是全球個人數據保護和企業AI應用的最高標準,被稱為“史上最嚴個人數據保護法”,其通過約束信息處理行為,賦予公民對其個人數據更大的控制權。

            此次先知(Sage)平臺通過歐盟GDPR認證,在證明第四范式產品及隱私計算技術的數據安全性和可信任性的同時,也帶來給我們一些思考,國內的AI企業想要走出去,GDPR是一張不可或缺的入場劵和法律保障,更進一步從行業角度來分析,眼下我們距離拿到這張門票還有多遠的路要走,路又該怎么走?

            “先知”完成歐盟GDPR認證,其中蘊含了哪些邏輯?

            歐盟GDPR認證的這條路,并不好走。

            “我們一年多前就開始準備相關的申請,PrivacySealEU不同于其它標準認證,在條款上已經細化到具體數據流問題,GDPR的條款‘多且細’,只有在確保所有條款‘絕對合規’時,對方才會給予通過,因此我們準備了大量的材料,涉及產品架構設計、數據處理流程、技術端和法律、管理端等方方面面。”在接受鈦媒體專訪時,第四范式主任科學家涂威威對鈦媒體表示。

            在談及先知平臺之所以能夠通過歐盟GDPR認證時,涂威威告訴鈦媒體,主要有以下兩個方面的原因:

            其一,得益于第四范式在隱私保護領域的持續投入和深厚積累,第四范式很早便投入到隱私保護技術探索中,并取得了一些實質性的成果,比如第四范式的差分隱私算法,與其它差分隱私工作相比,在獲得相同隱私保護強度的同時,擁有著還能得到更有效的分析結果;

            其二,第四范式在安全性和合規性的意識較好,自成立之初便開始服務于金融類客戶,而金融正是安全高敏感行業,因而客戶對于數據隱私的要求往往比其它領域要高,因此第四范式也更加了解企業對于隱私保護的要求和標準。

            近年來,企業逐漸認識到了AI的價值,將其視為“數智化轉型”的利器。AI的本質在于能更有效、更精細化地挖掘數據的價值,而挖掘數據的同時,伴隨著泄露隱私的風險。因此,企業以及AI技術廠商在應用AI的同時,更加注重在流程規范、人員培訓、產品設計及功能、技術等方面“把好每一道關”。

            從產品側來看舉個簡單的例子,為了提高AI模型效果,業界有些做法是通過網絡上爬數據或從第三方獲得一些數據來使用。而第四范式在先知產品的建模技術不依賴于任何第三方數據,“客戶在完成工作后,其相應的數據也隨之銷毀,數據無痕是先知平臺的基本特性。”第四范式國際化產品負責人王榮興對鈦媒體補充到。

            不僅如此,第四范式資深研究員郭夏瑋介紹說:“先知平臺從一開始的系統設計以及算法設計就做了很多合規性方面的準備。因為我們的理念是將AI賦能給企業,讓企業擁有AI的能力,我們提供安全合規的數據治理加上客戶提供的合規數據,再基于我們自研的保護隱私的AI算法,在保護用戶隱私的同時也可實現優秀的效果,這樣的理念也得到了客戶的認可和信任。因此,我們主要集中在技術上的打磨和產品的迭代。”

            另外,先知平臺還提供數據破解保護,對于用戶地址、電話、身份證號、姓名等敏感信息進行常規的匿名化處理,同時還支持更加嚴格的防止撞庫、差分攻擊等攻擊手段的先進數據匿名化技術,所有的可訪問接口均由完善的多層權限保護系統來控制。值得一提的是,先知平臺無論是公有云、私有云還是私有化部署,均達到了GDPR的要求。

            在隱私保護中,技術起到了哪些關鍵作用?

            事實上,AI模型訓練涉及到大量用戶數據的使用,這些數據或多或少包含了敏感信息。

            然而,以往常用的加密手段并不能完全保證數據安全,攻擊者還可以對分析結果的差分攻擊以及查表撞庫等方法反推原數據。此前,卡內基梅隆大學Latanya Sweeney教授在《簡單的人口統計往往能識別出人的獨特性》報告中提到,在基于美國選舉人公共注冊信息的基礎上,87%的美國人基于郵編、性別、出生日期即有可能被識別出個人身份。“甚至是統計數據也可能泄露用戶隱私”,涂威威提到,“有一種針對統計數據的重建攻擊,可以通過數據方發布的大量統計數據、模型等,反向求解重建數據信息,例如美國2010年人口普查,基于3億人口,發布50億統計指標,通過求解線性系統就可以很大程度上重建原數據,早在2003年就有公開論文詳細描述了這種攻擊方法”。

            在兼顧發揮AI價值以及保護隱私的情況下,有著充分理論基礎的差分隱私技術正在成為隱私保護以及AI領域的關注焦點。在《麻省理工科技評論》最新發布的2020“全球十大突破性技術”中,該技術位列其中。

            針對于此,涂威威對鈦媒體談到,“差分隱私是一個數學上的約束定義,假設把一個操作當成一臺機器,輸入是數據,輸出是根據數據產生的一些結果,那么這些結果是可能泄露數據隱私的。我們所說的這臺機器滿足差分隱私,直觀上就是假如輸入數據在有限的改變情況下,輸出的改變也應該滿足一定范圍,如果輸出改變很大,那么就容易使用類似“差分攻擊”的手段從輸出結果來竊取用戶隱私。具體的方法,是對原操作中的某些步驟,通過注入噪聲、混淆等形式,來使得操作得到差分隱私保證。然而就目前的大多數方法以及對應的理論來看,對于隱私保護的要求越高,需要注入的噪聲強度越大,從而對算法效果造成嚴重負面影響。”

            第四范式對目前的差分隱私技術進一步優化,通過更好的分配隱私預算、更有效的分配噪聲等方法,做到了在保護數據隱私的同時,提升分析結果的有效性。目前,該技術可廣泛應用于數據收集、數據分析、數據發布等階段。

            值得一提的是,該方法還可以直接拓展到遷移學習上來,第四范式與瑞金醫院合作的“瑞寧知糖”,便應用了該方法,系統可從數據較為完善的大型醫院中遷移出有價值且受隱私保護的知識,去幫助地方醫院、社區醫院、體檢中心等機構做更加完善的醫療診斷。

            更進一步,當前的隱私保護技術使用門檻較高,在保護隱私的前提下,多方聯合數據建模的常見做法依然需要比較多的專家人工介入到數據預處理、特征工程、模型調參當中,第四范式也進一步提出了保護隱私的自動多方機器學習的方法,綜合差分隱私技術、自動化機器學習技術,減少了專家人工的介入,一方面進一步提升了安全性,另一方面也大幅降低了隱私保護技術的使用門檻,使得廣泛落地成為可能。

            同時,涂威威也指出,以差分隱私為代表的隱私保護技術仍需要在理論、效果、應用、成本等方面進一步解決和優化。

            在隱私保護這條道路上,AI企業是否有捷徑可走?

            隨著人工智能與各類行業、多個場景深度融合加速,針對數據隱私、數據安全的防護已然成為產品不可或缺的一環。

            但隱私泄漏事件在AI圈卻屢見不鮮,就在日前,美國人臉識別創企Clearview AI就被爆出重大數據泄露丑聞,企業稱其整個客戶名單都被盜,包括美國警方、執法機構和銀行,在社會上掀起軒然大波的同時,這家公司目前也面臨多起訴訟和調查。

            根據相關報道稱,Clearview AI從網絡社交媒體上抓取了超過30億張照片,形成了龐大的生物特征信息數據庫,有600多家執法機構及一些私人安保公司都在使用它的人臉識別產品。只要上傳任何一張照片到Clearview AI的軟件,就能查到這個人在各社交媒體平臺上的照片,甚至是姓名、地址以及其他身份信息,而且這些數據還未經過被抓取照片者本人同意,這顯然是AI產品不合規化發展帶來的必然結果。

            眼下,國內在數據合規方面的整體意識不斷增強,無論是政府、企業還是大眾,都越來越重視隱私保護。這就意味著,AI企業在隱私保護和數據安全這條道路上并沒有什么捷徑可走,AI企業必須靜下心來做好產品本身。在涂威威看來,數據隱私、數據安全將會是接下來的行業熱點話題,而數據作為AI技術應用的核心基礎,更必須要打牢。

            從某種程度上來分析,第四范式先知成為國內首個通過GDPR認證AI平臺對于行業來說,很有可能讓國內AI企業對于數據隱私、數據安全的建設提上日程,而日后的AI競爭格局,也將上升到更高的維度。

            科技新聞傳播、科技知識普及 - 中國科技新聞網
            關注微信公眾號(kjxw001)及微博(中國科技新聞網)
            微信公眾號
            微博

            免責聲明

            中國科技新聞網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。

            相關標簽:

            推薦閱讀
            已加載全部內容
            點擊加載更多
            www.97sese.com.