• <track id="6sua3"></track>

  • <menuitem id="6sua3"></menuitem>
  • <menuitem id="6sua3"></menuitem>

    <progress id="6sua3"><bdo id="6sua3"></bdo></progress>
    <samp id="6sua3"></samp>

        1. <samp id="6sua3"></samp>

            ?專訪楊天若院士:大數據是“人機物融合”的血液,存在三大“卡脖子”問題

            2021-10-28 16:22:30     來源:中國科技新聞網

            中國科技新聞網10月28日訊(高運韜)近年來,隨著信息技術的飛速發展,其應用特征已經逐步從人機或物機二元世界融合向以社會資源人、信息資源機和物理資源物三元世界融合演進。

            加拿大工程院院士、歐洲科學院院士楊天若在“2021年大數據科技傳播與應用高峰論壇暨‘科創中國’試點城市推進式”會后接受了中國科技新聞網的采訪。他表示:“物聯網的時代來臨,大數據是當下串聯人、機、物最為有效的途徑。目前,大數據在蓬勃發展的同時也面臨著一些亟待重視的問題。”

            加拿大工程院院士、歐洲科學院院士楊天若(中國科技新聞網/攝)

            大數據是人機物融合最為有效的手段

            隨著互聯網和物聯網的高速發展及人類信息網絡的高速擴展,信息網絡逐漸涵蓋傳統人類社會網絡和物理世界的絕大部分信息,形成集人、機 、物于一體的三元融合型信息世界。

            “我們日常生活中的每一個場景,比如交通、醫療、零售業以及我們身邊的智慧家庭等,都只是人、機、物融合的具體案例。數據就像人、機、物這一體系中流淌的血液,將三者有機地結合起來。”楊天若向中國科技新聞網表示。

            2018年,知名零售商亞馬遜公司推出其首個無人便利店——Amazon Go。這是一家沒有收銀員的商店,顧客不必排隊等待購物。要進入商店只用掃描他們的智能手機即可。

            商店里遍布傳感器和攝像頭,顧客在商店中購物,攝像頭能夠區分其中的每一個人,并且跟蹤他們放入購物車或返回貨架的所有產品。

            重量傳感器提供了一個額外的控制點:他們可以識別特定的產品已經不在貨架。當顧客完成購物時,他們選擇的所有產品都顯示在真實和虛擬的籃子中,顧客可以離開商店,系統將進行收費。

            事實上,Amazon Go就是人、機、物融合的基礎體系和大數據分析技術的具體應用。

            楊天若院士提到:“針對人類、物理以及計算機的研究都存在豐富的學科體系以及方法論,但想要將人、機、物三者進行融合串聯,目前只能依靠數據。另外,大家對‘人機物融合’的研究還處于一種‘零散’的狀態,包括對大數據在‘人機物融合’中應用的研究并沒有形成一套完善的理論。”

            楊天若院士

            大數據發展面臨三大“卡脖子”問題

            “大家現在對這一領域的應用和研究,有點像‘老瓶裝新酒’。把原有的理論方法一用再用,因而也沒有一些完備的、突破性的理論方法。所以大數據的發展目前主要面臨三個問題。”楊天若表示,“第一個問題是數據快速處理,數據這么多,體積這么大,應該如何進行迅速的反應,及時的處理。”

            由于需要處理的數據量太大,并且數據增長過快,而業務需求和競爭壓力對數據處理的實時性、有效性又提出了更高要求。傳統的系統軟件根本無法應付。在這種情況下,從業者無法有效地對海量數據進行  有效地收集、處理和分析。

            由于不能從海量的數據中迅速獲取信息,便出現了各種各樣的風險,并對各種硬、軟件的數據存儲以及數據處理性能提出了非常高的要求。

            “第二個問題是數據高效分析,不僅僅是數據體量的問題,還存在著視頻、圖片等各種各樣的形式以及數據質量的高低不齊等問題。方法理論也沒有突破。”

            美國作者納特·西爾弗在其出版物《信號與噪聲:為什么大多數的預測都是錯誤的》【The Signal and the Noise: Why most predictions fail and some don’t (中國科技新聞網/譯)】中提出了質疑:真的是信息越多,離真相越近嗎?

            在海量的、尤其是形態各異的數據當中,哪些數據能夠作為信號,用于判斷事件現狀以及未來發展走向;又有哪些數據是對判斷只起干擾作用的噪聲,很難進行分辨。如果一味的使用某些固定的方法模型去分析數據,數據可靠性就無法受到保障,就無法對真實情況及未來趨勢做出合理判斷。

            舉一個例子——“過度擬合”。在統計中,過度擬合是“過于緊密或精確地對應于特定數據集的分析結果,因此可能無法擬合其他數據或可靠地預測未來的觀察結果”。一種過度擬合模型是一個統計模型包含多個參數比可以由數據是合理的。過度擬合的本質是在不知不覺中提取了一些殘余變化(即噪聲),好像該變化代表了基礎模型結構一樣。

            北京的交通信息管理中心的監控視頻資料平均每過21天就會被覆蓋,在如此龐大的視頻數據量的基礎上,視頻清晰度參差不齊,數據分析過程就會受到所謂的“噪聲”干擾,從而出現錯誤。

            賓夕法尼亞大學的理查德·伯克教授建立了一個大數據模型,他聲稱這個模型可以預測一個判緩刑的人一旦釋放是否會再次犯罪。

            伯克說這一模型對未來預測的準確性可以達到75%,但也僅僅是75%。如果嚴格按照這一模型來執行,就意味著,每四個人里就有一個人是被誤判。

            以上提到的兩個大數據分析中的實例,其他領域也是同理。

            “針對數據處理和分析的瓶頸,現在大家都是在自己的領域去研究方法以及理論,沒有整體突破性的進展。”楊天若院士表示。

            大數據隱私將愈加受到關注

            楊天若告訴中國科技新聞網:“除了數據處理以及分析上的瓶頸,還有一個十分重要的卡脖子問題。目前,大家還沒有感到緊迫感,那就是大數據帶來的隱私問題。”

            “在西方國家學習生活期間,我能感覺到他們對這個情況是非常看重的。我們的優勢是能夠獲取大量的數據,但是大家對隱私問題還沒有那么敏感。”

            有一個常見的現象,用戶在網頁上搜索的信息,可能會在任何一個APP中發現與其相關的廣告。甚至連社交軟件上語音對話的內容,都可能出現在某一條手機推送上面。

            這似乎意味著,大數據時代下,我們正在被各式各樣的硬件軟件所監視:淘寶在監視著我們近期的購物需求;百度在觀察著我們想要解決的問題;抖音也在編織一個看似完美的信息繭房。然而,大數據時代下的隱私問題遠遠不止于此。

            據了解,2018年3月,《紐約時報》等媒體揭露稱一家服務特朗普競選團隊的數據分析公司Cambridge Analytica獲得了Facebook數千萬用戶的數據,并進行違規濫用。

            紐約時報相關報道原標題

            Cambridge Analytica自稱主要為政界人士和企業客戶提供消費者研究、定向廣告和其他與數據有關的服務。

            Cambridge Analytica 官網截圖

            該公司宣稱,它可以開發消費者和選民的心理特征,然后用這個“秘密武器”來影響消費者和選民的意愿,這比傳統廣告更加有效。其最著名的工作是曾協助原美國總統特朗普的2016年總統競選活動。另外,這家機構還參與到了英國退歐公投活動中。

            除此之外,各種各樣的機構組織對于這類數據的濫用很可能形成惡性循環。這些機構組織可以輕而易舉地看到大數據的價值潛力,這極大刺激著他們進一步采集、存儲并循環利用個人數據的野心。

            值得一提的是,基于大數據的規模以及多維度的特性,簡單匿名化的脫敏處理似乎已經失去了意義。

            據中國科技新聞網了解到,普林斯頓大學的一個研究員曾表示,如果能夠獲得美國的信用卡數據,通過了解信用卡在某時某地進行消費,就能通過算法定位到個人。雖然這些數據都是脫敏的,沒有名字,沒有聯系方式,但可以通過算法找到一個人的消費習慣,從而侵犯到個人隱私。

            這樣看來,從算法角度來分析并解決隱私問題成為了一件十分困難的事情。

            “隨著生活水平的提高,大家將會對大數據的隱私問題愈加關注。但當下,這也是一個‘卡脖子’的問題。”楊天若院士稱。

            楊天若出席“2021年大數據科技傳播與應用高峰論壇暨,‘科創中國’試點城市推進式”(中國科技新聞網/攝)

            楊天若簡介:

            加拿大工程院院士、加拿大工程研究院院士、歐洲科學院院士、IEEE/IET會士、國家特聘專家、全球高被引學者、ACM杰出科學家、海南大學講席教授。

            科技新聞傳播、科技知識普及 - 中國科技新聞網
            關注微信公眾號(kjxw001)及微博(中國科技新聞網)
            微信公眾號
            微博

            免責聲明

            中國科技新聞網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。


            推薦閱讀
            已加載全部內容
            點擊加載更多
            www.97sese.com.