很多人用 “機器不會有思維能力” 的理由來反駁人工智能威脅論,但是 NLP(自然語言理解)技術的出現又一次打破了這樣的認知。機器通過數據訓練,深度學習也可以理解人類表達的模糊的指令并自如的進行對話,目前它們能做到多聰明多智能?近期,有媒體接觸了基于 NLP 技術的人工智能生活語音對話助理“玩秘”,創始人余軻曾經說過他們的愿景是:讓人類把部分思考的工作交給機器。
玩秘隸屬于北京輪子科技有限公司,是一家 NLP 語音對話助理服務商。玩秘于 2018 年正式服務于智能音箱小米小愛同學、天貓精靈,于 2019 年正式服務于小米手機。在 2019 年 8 月于上海舉辦的世界人工智能大會閉幕式上,玩秘作為 8 家被選中的優秀企業,與上海市人工智能產業投資基金完成了意向性簽約。
玩秘通過語言對話與用戶交互,與 Siri 等語音助手的簡單百科式問答不同,玩秘強調思考和分析能力,能模仿人類復雜的決策過程,做出基于眾多數據和因素的智能決策和推薦。
玩秘選擇從生活消費和吃喝玩樂這個領域入手,余軻介紹說是因為與購物和資訊相比,本地休閑生活除了具備人性化需求和豐富供給的特點,還包含時間、地點、場景等更多維度,AI 個性化給用戶創造的附加值更大,優于傳統個性化推薦方法的人工智能架構功效也會發揮得更加充分。
目前,玩秘已經明確了三個主要的 B 端終端場景:手機、智能音箱、汽車。手機語音助手是玩秘主要的應用場景,針對手機語音助手,玩秘采用 GUI(圖像交互)和 VUI(語音交互)相結合的展現形式,通過多條件指令識別、多輪對話、模糊指令識別等功能,為用戶提供深度語義理解交互服務,讓用戶不用打開任何 App 即可完成院線觀影、訂酒店、外賣等服務閉環。
玩秘近期可以做到多智能?余軻舉例說,在人性化升級完成后,比如用戶發出指令:幫我買兩張晚上十點在天幕影城的復聯 4 的票。玩秘獲取之后會根據已知的海量院線信息,輸出自己的人性化建議:有一個場次是十點半的,但電影結束就凌晨 1:30 了,會不會有點晚,要不要換成 9 點半的場次?在此基礎上,用戶可以進行下一輪對話,比如:9 點有點早了;還有別的影院選擇么?玩秘會根據進一步的指令做出下一個推薦。除了像這樣多條件的指令,還可以向玩秘發起多樣化或非模版式的指令,比如詢問某個電影怎么樣?附近有什么電影院推薦,價錢比對等,玩秘都可以一一作答。甚至用戶搞不清想看電影的名字,只要說起其中演員的名字等比較模糊的指令,玩秘也可以理解用戶的意圖。具體而言,「玩秘」將根據用戶特征進行類人腦推理,生成智能化的生活解決方案。隨著深度學習訓練,「玩秘」將越來越人性化,理解率和應答率也會逐漸提高。
余軻表示,做人工智能語音助理面臨兩大難點:NLP 語義理解和人性化推薦。團隊核心的挑戰以及技術壁壘便是 NLP 技術,即機器對人類指令的準確理解。“這是我們首先要做到的第一步,讓機器更好的理解人類的意圖。” 余軻說,人性化推薦則依靠數據和機器學習,核心是在于對用戶和 POI 的刻畫,標簽經緯度要足夠多、足夠深,數據來源玩秘則通過與業內知名互聯網票務平臺、酒旅平臺、外賣等合作來獲取。
在盈利模式上,玩秘目前主要方向是在用戶產生消費以后,從電影票務平臺、酒店平臺等內容提供商獲得服務分成。
目前,玩秘已經覆蓋全國 95% 以上的地級市,主要提供電影和酒店的服務信息。今年 6 月份,玩秘的功能在小米手機中上線(只需對「小愛同學」說 “電影助手” 即可通過語音對話的方式很便捷的購買電影票)。除了小米手機之外,中國四大手機品牌中的另外兩家也已與「玩秘」達成合作,服務預計將于今年四季度上線。余軻表示,未來人類與機器以及機器人的交互形式一定會過渡到語音對話。與文字編輯、手動按鍵等現有的方式相比,自然語言傳達的信息密度和效率要高得多。玩秘也將深耕吃喝玩樂的生活服務領域,打造生活全場景人工智能服務大腦。
據了解,玩秘目前已經完成了三輪融資,最近一輪是今年一月份由越榕資本領頭的 A 輪融資。創始人兼 CEO 余軻牛津本科畢業,在斯坦福和普林斯頓分別完成了深度學習專業碩士和博士學位,有 10 年 NLP 自然語言理解與大數據分析行業領域研究和行業經驗,曾任摩根大通公司的全球人工智能算法交易總負責人(能源與資源);其余核心成員來自平安集團陸金所、思必馳、豆瓣等公司。