中國科技新聞網10月10日訊(楊晶佳 趙芙瑤) 10月10日,2021大數據科技傳播與應用高峰論壇暨“科創中國”試點城市推進式在湖南衡陽召開,論壇上揭曉了“大數據科技傳播獎”,其中,來自58同城AI Lab的“靈犀”智能語音語義平臺團隊,摘得團體獎-創新獎。
事實上,隨著我國大數據、人工智能等新興產業飛速發展,語音識別技術已經日趨成熟,AI語音機器人也已不算新鮮事物,不過,在復雜的方言口音、多變的口語化表達面前,人工智能變“人工智障”的尷尬現象層出不窮。
作為58同城自研的智能語音語義識別平臺,能聽懂帶方言口音的“塑料”普通話、能理解缺字少字的口語化表達;在和C端用戶對話溝通過程中不僅可以回答用戶咨詢,還能主動反問用戶獲取商機信息,并能向B端商家及時傳達商機;節省大量人力成本、每月創造數百萬收入……“靈犀”究竟是怎么做到的?
論壇現場,58同城AI Lab負責人詹坤林接受中國科技新聞網專訪,就上述問題進行了分享。
58同城AI Lab負責人詹坤林接受中國科技新聞網專訪
用自己的數據訓練自己的模型 中臺與前臺構建虛擬項目組協作共贏
中國科技新聞網:在智能語音語義識別領域,科大訊飛、百度等都有長期的積累和成熟的應用,58同城定位生活服務平臺,自研“靈犀”的契機是什么?“靈犀”為58同城帶來了哪些改變?
詹坤林:我們選擇自研智能語音語義識別系統主要基于三點考慮:一是58同城每年會產生超過千萬小時的語音數據,而第三方語音識別技術的采買價格是每小時幾塊錢不等,若采買第三方技術,每年將花費數千萬元,成本非常高。
第二是我們的場景較垂直化,包括房產、招聘、汽車、本地生活服務等等垂直領域場景產生的語音數據,直接使用第三方通用的語音識別引擎識別效果并不好,在我們這種垂直業務場景下需要去做語音識別模型的定制優化。所以我們選擇自研“靈犀”,用自己的數據去訓練自己的模型,并針對不同業務做定制優化,最終的效果是超越第三方的。
第三點是自研更加靈活,可以快速響應業務需求,隨著我們的業務發展,相應場景下語音數據也會不斷發生變化,語音識別模型需要持續更新迭代,如果我們采買第三方語音識別技術,更新優化模型需要再付費,并且需要時間,而自研系統可以保證持續的更新迭代,并能根據業務需求進行定制優化。
基于以上三點,我們打造了“靈犀”智能語音語義平臺,它包括基礎語音識別、NLP自然語言處理能力,支持人機對話、人-人對話內容分析兩大功能,并針對58同城多樣化的業務場景開發了智能聊天助手、智能外呼助手、智能語音質檢系統等數十款AI應用,靈活滿足各類需求的同時,也提高了人效、收入和用戶體驗,為公司產業化升級貢獻了一份力量。
中國科技新聞網:當下,AI中臺的概念比較火熱,根據介紹,“靈犀”是一個公共的智能語音語義平臺,也屬于AI中臺類產品,58同城則包含房產、招聘、汽車、本地生活服務等眾多前臺業務。那么,58同城AI中臺和前臺業務是如何協作,來實現共贏的?
詹坤林:“靈犀”智能語音語義平臺確實是一個AI中臺產品,這個平臺可以應用到不同的業務方,比如剛才說的招聘、房產、汽車、本地生活服務等等。我們的協作模式一般分為兩方面,一是我們去給這些業務線推廣“靈犀”,告訴他們哪些場景可以用到“靈犀”,當給某個業務方推廣能力時,我們會分享其他業務的成功應用案例,我們也會調研業界的成熟應用,給業務線提供參考。二是由于“靈犀”在58同城內部已經有了一定基礎,比如說房產業務線已經在使用我們這個平臺的功能,那招聘業務線可能聽到類似的應用就會主動來找我們,向我們提需求。
當需求確定之后,我們AI中臺和前臺業務會構建一個虛擬項目組,以協同項目的形式進行協作,前臺和中臺密切配合,共同設定目標,雙方圍繞統一的目標去開展業務,最終實現共贏。在我們的經驗中,這種虛擬項目組的形式下,前臺和中臺開放協作,最終能取得較好的成果,我們當前所有項目都以這種方式進行。
58同城AI Lab負責人詹坤林
定制性優化使方言口音更易懂 智能機器人邊回答邊反問
中國科技新聞網:據了解,“靈犀”的語音轉寫文本準確率達到了90%。58同城業務覆蓋招聘、房產、汽車、金融等多個領域,除各領域專有詞匯外,客戶們還可能有復雜的方言口音,“靈犀”如何克服這些難點,實現語音轉寫高準確率?
詹坤林:首先,不同的業務確實有不同的專業術語,比如房產經紀人、招聘HR都有各自的術語,針對這些我們會區分出不同的業務線、標注不同的語音數據,建立聲學模型、語言模型等等,進行定制性優化,解決不同業務線的問題。
方言口音是整個語音識別技術面臨的一個難點。當前我們主要解決的是帶方言口音的普通話,對于我們來說,58同城的定位是本地生活服務平臺,它有很強的地域性,我們會針對全國不同的城市去做優化。我舉個例子,比如湖南這邊有長沙話,很多人可能就會講帶長沙話口音的普通話,目前基本全國所有城市,帶一點方言口音的普通話我們都能夠識別。但我們當下還沒有在純方言識別上去投入,純方言語音的識別是語音領域的難點,這里需要較大的投入成本,我們可能會針對性分析應用場景,并作詳細評估,不排斥采買第三方的純方言識別技術。
中國科技新聞網:據介紹,58同城用“靈犀”打造了IM文本對話機器人,當用戶聯系商家時,由機器人和用戶對話,在對話過程中,機器人如何判斷是否形成有效商機?確定商機后,機器人如何將用戶的具體意愿及需求轉達給商家?
詹坤林:這個問題是指我們的黃頁商家智能聊天助手這個應用,我先大概介紹一下背景, 當用戶有保潔、搬家、維修等需求時會通過微聊(58同城自研的IM聊天工具)以文本對話的方式聯系58同城平臺上的商家,而商家由于工作繁忙往往無法及時回復用戶,造成商機流失。為了解決該問題,黃頁業務線構建了一支人工客服團隊,由人工客服來代替商家接待用戶,當人工客服和用戶溝通完形成有效商機信息后再轉交給商家,從而幫助商家獲客。在這樣的場景下,我們應用“靈犀”平臺中的人機對話平臺打造了文本對話機器人,當用戶來聯系商家時,先由機器人接待,若機器人能夠聊出商機則結束對話,若不能則轉接人工客服,這種人機協作的方式可以大大節省客服人力。
這里的有效商機指什么呢?比如對搬家用戶而言,用戶會提供起點、終點以及需要的車型等基本訴求,在和用戶聊天的過程中,機器人就會根據對話,識別出相關信息,形成有效商機,更有利于商家的及時高效處理。同時,也還會通過智能外呼機器人去主動打電話提醒商家來處理商機,以進一步促進服務的效率。
當然,在這個過程中我們也很注重C端用戶的體驗,保障機器人對話的流暢性,比如在聊天過程中,根據用戶咨詢的問題,機器人就會去理解用戶的意圖,然后把問題的答案給到用戶。第二是我們的機器人會在適當時機主動詢問用戶相關訂單需求信息,比如他是從北京的回龍觀搬到大興,這時我們機器人又會去識別用戶說的這句話,通過自然語言處理技術,把回龍觀和大興識別出來。所以“靈犀”IM文本機器人相當于是有兩個主要功能,一是回答用戶的提問,二是向用戶反問,通過這樣來回、多輪次的溝通,最終獲取有效商機。
中國科技新聞網:根據有效商機轉化率指標來評價,“靈犀”機器人的能力已經達到了商機組人員的80%水平,甚至有的已經超過了商機組人員。那么,當前機器人的工作量相當于多少商機組人員的工作量?和真人相比,“靈犀”機器人還有哪些提升空間?
詹坤林: “靈犀”作為智能化產品需要不斷進行機器學習,舉例來看,我們正在優化中的一個應用——黃頁銷售智能外呼助手。黃頁業務線的銷售團隊會以電話銷售的方式來向商家客戶推薦會員產品。黃頁銷售團隊由商機組、銷售組兩類人員構成:商機組人員的工作任務是與客戶溝通商機方面的需求,將意向客戶標記為有效商機,交由銷售組人員進一步提供服務;銷售組會跟進客戶需求,在一段時間內,幫助客戶了解并認可會員產品,并成為會員。在這樣的銷售模式下,商機組人員的工作任務較標準化,我們應用“靈犀”平臺中的人機對話平臺打造了語音對話機器人,形成了銷售智能外呼助手,將商機交給機器人自動外呼,由機器人來和客戶對話,對話結束后自動判斷是否繼續跟進客戶。當前我們機器人在全國的平均水平達到了人工銷售的80%,已經使用的機器人相當于50名商機組人員人效,并正在全國逐步推廣。
至于為什么機器人只有人工80%的水平,關鍵在于AI對話永遠是在標準化的場景中更有優勢,而在更復雜的個性化場景里,機器人就很難達到人工的水平,不過我們的80%是全國幾十個城市的平均水平,其實在部分城市我們的機器人已經超過了人工的水平,比較困難的是在一些方言口音比較重的地區,語音識別的準確率沒有那么高,就會影響機器人的理解和判斷能力。
58同城AI Lab負責人詹坤林
數十款AI應用提高用戶體驗 “靈犀”從應用中來到應用中去
中國科技新聞網:“靈犀”的智能語音質檢系統能將對話轉為文本,進行語義理解,且語義標簽準確率已經達到了95%。通常語義理解要比語音識別更加困難,人們在日常溝通中會省略很多字詞,語氣、重音等等也會導致語義變化,“靈犀”是如何克服這些困難,提高語義標簽準確率的?
詹坤林:其實語音識別和語義理解的困難不好對比,語音識別的難點在于方言口音、嘈雜環境等等,語義理解的難點在于用戶的語言習慣,比如多說幾個字、少說幾個字,這個在我們的機器學習模型里叫語料,比如一句話里少了幾個字但含義不變,我們會收集大量的語料把它標注出來,機器學習模型就會在下一次遇到類似語料的時候識別出相應的標簽,這樣就解決了口語化表達中少字的問題。
最難的可能就是您說到的語氣變化的問題,比如在情感類型的表達場景下,用戶反問和質疑、聲調高和聲調低都會對語義產生影響,這也是學術界和工業界研究的難點,不過在我們目前的應用場景里,這類問題其實占比很小,可能連1%都不到,所以它的影響也還好。
中國科技新聞網:在“靈犀”智能平臺衍生出的數十款AI應用中,哪款應用付費用戶最多?整體盈利狀況如何?除了58同城,“靈犀”能否為其他企業提供智能語音語義技術支持?
詹坤林:剛才我們講到的黃頁商家智能聊天助手產品已經進行了商業化,命名為“微聊管家”,向商家進行售賣,當前每月開通該功能的商家數量過萬家。
另外,“靈犀”具備為同類型的公司提供智能語音語義識別技術的能力,類似百度云、騰訊云,但目前我們還沒有對外開放,因為涉及到一些商業合作層面的事宜。
中國科技新聞網:與純粹的語音識別公司不同,58同城的“靈犀”是從應用中來,到應用中去,這里面你認為最大的區別是什么?58同城所掌握的用戶數據以及場景是不是其核心競爭力?
詹坤林:“靈犀”不僅有語音識別,還包括了語義理解,也就是上層的NLP自然語言處理這一塊,而很多傳統的純語音識別公司可能只做語音識別部分,就是把語音轉成文本。
“靈犀”的核心競爭力是什么呢?首先,我們的優勢是積累了大量的垂直業務場景的語音數據,像房產、招聘、汽車、本地生活服務這些生活服務領域的所有語料就是我們的平臺價值所在,基于這樣多元化的業務場景,打造語音識別模型,它比業界通用的語音識別模型效果要好。
另外,我們貼近業務場景,在58同城產業化升級的大背景下,靈犀作為AI中臺會和業務深入協同合作,通過深鉆業務打造的AI應用能夠有效提高58同城平臺上B端商家、C端用戶的用戶體驗、人效,這也是我們的核心競爭力所在。
關注微信公眾號(kjxw001)及微博(中國科技新聞網)

