日前,「模型思辨」國內大模型產業生態研討會在北京舉辦,Zilliz與360集團、阿里巴巴、昆侖萬維等來自大模型產業鏈的頭部公司及投資機構參會,會上Zilliz創始人兼首席執行官星爵、360集團創始人周鴻祎、昆侖萬維創始人方漢等重量級嘉賓更是從不同角度分享了對大模型的獨到見解,精彩觀點的交織與碰撞背后,是眾人對于中國大模型未來的積極探索與期待。
其中,值得關注的是對于向量數據庫的探討,星爵從大模型存儲的角度為大家詳解向量數據庫之于大模型的重要意義。
星爵認為:
●移動應用時代程序開發經歷了從復雜到簡單的過程,AI浪潮的來臨卻從側面提高了程序開發的成本,大模型時代之下CVP Stack這種新范式的出現改變了這一現狀,在其加持下,人人都可能是AI時代的工程師。
●大模型的發展離不開存儲這一關鍵點,其中以Milvus和Zilliz Cloud為代表的向量數據庫扮演著大模型記憶體的角色,可以讓大模型們進行知識增強。
●下一個殺手軟件會是智能體,它同樣需要向量數據庫的存儲和檢索能力。可以預見,向量數據庫將迎來快速的市場規模增長,未來可期。
圖為Zilliz創始人兼首席執行官星爵
以下是星爵演講的精彩觀點:
從移動應用時代到大模型時代
當下的時代常被冠以很多花里胡哨的稱謂,然而早在十年前,硅谷便感受過同樣的熱情。當時硅谷的每個周末或者任何一座大城市都有一群人在興奮地探討iOS和Android。十年,我們見證了移動技術的成長,改變了生活的方方面面。
十年前,之所以有那么多移動開發者涌入這個賽道,原因是安卓和iOS極大地簡化了移動開發的工具棧,降低了手機程序應用開發的難度。回到AI領域,盡管在過去十多年的時間里它一直處于不斷升溫的狀態,但實際上整個領域的Stack比重相當高。這意味著,如果你想開發一個完整的AI程序,需要在不同板塊中至少選擇1-2個項目,并將這幾十個項目串成自己要做的解決方案。
大模型出現以后,工具棧變得更加簡化,開發者可以在一個周末的時間做出一個不錯的demo。而這并非是天方夜譚,CVP Stack模式就可以實現。其中,C的意思是以ChatGPT為代表的大模型,它在AI程序中充當中央處理器的角色;V代表Vector Database,即以Milvus為代表的向量數據庫,充當embedding storage的角色;最終會通過prompt的方式進行交互。
總結來看,在大模型時代下,無論你是否寫過代碼,只要你有一個ChatGPT賬號、會寫prompt、找到一個embedding的數據庫為模型提供相關領域的知識,甚至說為其提供一個緩存層,具備以上條件,你可以輕而易舉地成為一個很好的工程師。舉個例子,我們的同事用了兩天就做出了一個ChatGPT + Milvus向量數據庫的應用,他的名字叫OSSChat(https://osschat.io),用于解決開源項目文檔冗長、不易查找等問題,目前已經支持幾十個主流的開源項目,每天都有很大的訪問量,用戶甚至可以去生成開源項目的代碼。
存儲比計算更便宜,大模型也不例外
大模型更新的時間比較長,知識也具有一定的滯后性(例如ChatGPT的知識只停留在2021年底),如果用現在的數據庫存儲方式,可以把最新的知識提供給向量數據庫,對大模型進行知識增強,可以得到更好的答案。不止如此,大模型的訓練成本高昂也是不爭的事實。
這次我想重點談談成本問題。在計算機發展史中,最經典的架構是馮·諾伊曼架構,最核心的貢獻就是實現存儲與計算分離,即把所有信息、所有計算歸為計算問題和存儲問題。存儲與計算分離有各種各樣的好處,傳統的馮·諾伊曼架構是把信息用二進制代表,實現存儲和計算分離。
大模型的本質是復雜的神經網絡,在這個神經網絡中任何數據的傳輸都需要embedding作為中間介質,可以說,embedding就是傳輸信息的基本單元。因此,embedding是在傳統的抽象之上覆蓋了一層適合AI或大語言模型進行語義抽象的數據表示。
而向量數據庫負責的是embedded語義數據的存儲與檢索。我們要把大語言模型和向量數據庫分為兩個模塊,就是存儲與計算分離,正如馮諾伊曼架構一樣。這樣做的好處就是歷史上存儲價格永遠比計算價格便宜幾個數量級以上,大語言模型也不例外。假設有一個大模型可以做100 KB Token,同樣條件下,給到大語言模型運算的成本遠大于做向量召回。如果這個大模型要做1000 Token呢?運算成本將更加昂貴。雖然大語言模型未來會有越來越大的Token窗口,但我們本質上不會把所有信息都分到大模型里面,且大模型不能覆蓋全世界所有信息。
未來向量數據庫應該會成為大語言模型存儲的標配,傳統的數據庫之所以不適合為大模型做存儲,是因為它們沒有語義表達且不能提供語義存儲。如果說現在有一種數據庫方案和存儲方案,能夠提供語義檢索的話,只能是向量存儲。
下一個Killer App
講完過去一年半年的機會,我們來聊聊下一個機會是什么?
老周和軼航的對話有講到智能體越來越被認為是下一代Killer App,對此,我很認同。大模型還需要人不停地給予提示,智能體就是希望通過做任務和場景拆解,解決無限復雜的問題,最終實現和人一樣的自我演進的能力,或者形成自己獨特觀點和演化的能力。
智能體需要記憶。人類的大腦有一個區域叫做海馬體,負責長期記憶。記憶是人類智能很重要的部分,不可能今天把昨天的事情忘記還說自己很聰明。行業里面的正在嘗試用向量數據庫為智能體存儲長期記憶,因為向量數據庫的成本是很可控的。
未來如果每個人都能夠有幾十個智能體幫助我們生產生活,像向量數據庫這樣具有語義檢索的存儲市場會迎來很大的增長。Zilliz開始做世界上第一款向量數據庫的時候,內存應用場景根本不是大語言模型,更多的是圖片搜索、視頻搜索,包括個性化的搜索引擎,但本質上都是用神經網絡做成向量嵌入。大語言模型開發門檻的降低讓這個領域成為面向開發者友好的Killer領域,所以我們認為向量數據庫這個領域未來幾年將迎來快速的增長與更加龐大的市場規模。
大模型時代,未來可期,而作為大模型記憶體的向量數據庫,同樣值得期待!
(免責聲明:該文章系我網轉載,旨在為讀者提供更多新聞資訊。所涉內容不構成投資、消費建議,僅供讀者參考。)
關注微信公眾號(kjxw001)及微博(中國科技新聞網)

