• <track id="6sua3"></track>

  • <menuitem id="6sua3"></menuitem>
  • <menuitem id="6sua3"></menuitem>

    <progress id="6sua3"><bdo id="6sua3"></bdo></progress>
    <samp id="6sua3"></samp>

        1. <samp id="6sua3"></samp>

            科大訊飛的錄音筆,是黑科技or智商稅?

            2021-08-02 16:18:23     來源:星空財富

            作者:星空財富

            現在我可怕別人和我提人工智能了。

            因為一般人工智能的產品,到我手里就是人工智障。比如,我家的人工智能掃地機器人,由于它太智障了,已經成了我爸的花盆拖(攤手)。

            不過,人工智能在二級市場上還真是蹭熱點小能手,有了AI屬性不管是定增還是解禁,都不愁沒資金眷顧。我的偏見就在于,越是給自己貼上智能標簽的,我越想看看這是不是真的智能。這讓我對于人工智能一哥科大訊飛(002230),一直抱有一絲疑慮,想去一探究竟。

            以前看研報上介紹的最多的就是科大訊飛的語音識別技術,而且在這次對于在線教育行業的整頓中,科大訊飛也成功的參與了教育產業轉型升級的浪潮,也讓自己的股價漲了不少。但是,眾多投資者和我一樣,心中一直有一個疑問,明明錄音這種功能的實現可以用一個手機APP就可以實現的功能,為何要單獨做成一個硬件產品?

            這句的潛臺詞是,難道因為做成硬件可以方便圈錢?

            帶著這個疑問,本周二(7月20日)我應邀參加了百度百家號與中國科技新聞網聯合舉辦的走進未來公司第一期的活動——走進科大訊飛(002230)。

            一、人工智能是個筐,什么場景都能往里裝

            我理解科大訊飛的核心技術是感知智能(讓機器能聽會說)和認知智能(讓機器會思考),這是軟件方面的算法技術,那么,軟件和硬件的結合能有多大的想象空間呢?我看研報里更多的是說對于教育培訓體系的應用。這次來到科大訊飛的人工智能體驗中心,我看到了語音識別技術的場景有如此廣泛。

            其中有3個場景很打動我:

            1. 人工智能主播小晴。這位主播看上去仿佛一位活生生的央視新聞主持人,她可以同時用多國語言播報新聞。現場聽上去完全沒有違和感,就和活生生的主播說話別無兩樣;

            2. 人工智能課堂。從畢業后不知道多少年都沒再坐到教室里了。這次在科大訊飛的智能課堂,我像小學生一樣坐在座椅上,看到智能課堂可以根據學生對于知識的掌握情況而出題,不需要學生做大量的題海戰術,依舊能有針對性的提升學習成績,這點還是對于現在的教育改革和減負很有必要的。另外還可以輔助老師批改試卷,特別是自動讀作文并且評分,也減輕了教師的工作負擔;

            3. OCR技術賦能的文秘神器。我們看到屏幕中掃描文件,可以被科大訊飛的神器通過圖像掃描,識別圖像中的信息,并把信息數據庫中進行匹配,找到相關聯的其他數據。最神奇的是,可以把這些案例在電腦顯示的地圖上標注出來。這對于我們平時的調研工作,和一般的文秘工作減少了不少重復性勞動。說明機器真的會認知智能,也就是可以和人一樣思考問題。

            此外,還有一些我之前就比較能想得到的。

            1. 醫生看病。把一些常見病通過OCR識別技術先做初步篩查和診斷;

            2. 智能音箱操縱家里的窗簾、家電等,這屬于智能家居場景。不過市面上的智能音箱比較多,這點我覺得不能算是科大訊飛的特色;

            3. 錄音筆用在大學講堂、會議。這種在20年前就有,訊飛的產品有個可以翻轉的屏幕,可以一邊聽英語,一邊看漢語翻譯,使用上我認為更多的是硬件的設計改觀。

            其他的功能,比如87種語言同步翻譯,這屬于詞庫和算法的優化就不再次贅述。

            二、可以戴在手上的錄音筆,用處大嗎?

            與科大訊飛的企業放進行交流。在這之前,發給了每個人一塊腕式錄音筆。

            這東西我乍一看比較像智能手表,但實際上他是一款錄音筆。通過下載訊飛極智APP可以和該設備進行關聯,實現一邊開會一邊錄音并轉錄成文字,實現上傳云端,并且能翻譯成多國語言。我當場測試了一下,我覺得有三點比較神奇:

            1. 可以自動對語序進行糾錯。在口語交流的場景中,我們難免會出現語序顛倒等問題,這個設備都可以糾正;

            2. 可以識別方言。我特別用天津話試了一些,還算是翻譯的比較流暢;

            3. 可以把一些口語中的停頓語,比如嗯、啊之類的詞語做優化。在形成文本的時候把這些詞直接就刪除了,方便編輯。

            這些是基于我現場做的5次測試的結果,此外,我覺得這個產品還有一些可以改進的地方:

            1. 在說漢語的同時,夾雜一些專業用語轉錄的不準確。比如,現場說道的OCR,在錄音的時候被識別為“區塊鏈”,顯然是不正確的(腕式錄音筆適合近場錄音,高階產品不會有這種情況)。科大訊飛的楊猛經理當時告訴我們,這算是語義翻譯最難的地方,這里他們應用了卷積神經網絡技術,這種技術實際是人工智能里比較高級的算法,能夠像人類一樣的辨識語言。不過目前我目測這個技術還有提升的空間;

            2. 可以轉錄的時長。我現場看能錄5分鐘就要重新按一下按鍵。很多場景5分鐘的顯示略顯不足(據企業方介紹轉錄在后臺仍然進行,只是APP只能顯示5分鐘);

            3. 導入云端后有存儲空間限制,也就是類似于icloud,需要續費買空間。這點也不能說是問題,可能是增加用戶粘性的一種方式。

            三、語音識別到底有多硬核?是智商稅嗎?

            回到本文開頭我的那個疑問,明明錄音這種功能的實現可以用一個手機APP就可以實現的功能,為何要單獨做成一個硬件產品?

            這個問題在交流的時候,科大訊飛副總裁李傳剛介紹到,因為一般的手機錄音軟件只是針對近場錄音,但專業的錄音需要遠場錄音手機無法實現準確識別轉錄并且做降噪處理。比如15米這種常見的會議場景,會有不同人發言,可能會有爭辯,這時對于秘書、律師等一些專業人員提升工作效率,還是直接用這樣的硬件會比較好。

            說到底,手機下載一個錄音軟件,受手機本身的麥克風設計的局限,就不可能和專業的錄音筆去比。專業的錄音筆會用麥克風陣列,訊飛這邊一般是8麥,相互糾音,所以才能提高錄音筆的正確率。

            當被問及海外市場情況時,李傳剛副總裁還介紹到,科大訊飛已經進入日本市場,未來在全球還有4倍的增長空間。目前是400萬臺,未來全球市場有2000萬臺的需求。看來這塊蛋糕真是又大又圓。

            這次科大訊飛一行,對我之前的認知算是一次刷新。不能說人工智能就是一個噱頭,它是在發展中的技術。目前錄音筆和其他產品確實對我們的生活和工作能起到一定。科大訊飛參會人員介紹目前50%的市場占有率還是不夠的,希望兩年內能成為全球錄音筆市場第一品牌。

            我也希望以后吐槽人工智能智障的會越來越少。語音翻譯和錄音的需求是存在的,公司能否在業績上一個臺階,最核心的是占領市場的速度,畢竟現在不是大的吃小的,而是快的吃慢的。

            以后的產品要是能把那些專業詞匯都智能識別,相信會更好的提升效率。

            #走進未來公司#


            科技新聞傳播、科技知識普及 - 中國科技新聞網
            關注微信公眾號(kjxw001)及微博(中國科技新聞網)
            微信公眾號
            微博

            免責聲明

            中國科技新聞網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。


            推薦閱讀
            已加載全部內容
            點擊加載更多
            www.97sese.com.