聯系我們
——
咨詢與建議
——
友(yǒu)情鏈接
——
區(qū)塊鏈是500年來(lái)金融領域最偉大(dà)的發明(míng)
——華爾街(jiē)日報 2015.1.24-25
行(xíng)業資訊
——
News centre
2019語音(yīn)技(jì)術(shù)報告:語音(yīn)經濟規模将超移動應用
騰訊科技(jì)訊美國投資機構Mangrove Capital Partners本周發布了2019年“語音(yīn)技(jì)術(shù)報告”。報告題為(wèi)“語音(yīn):歡迎下一代的颠覆者”,分析了語音(yīn)助理(lǐ)服務的日益普及,并對2020年Siri的動向做(zuò)出了有(yǒu)趣的預測。
以下為(wèi)騰訊科技(jì)(微信号ID:qqtech)編譯整理(lǐ)的報告全文:
在過去多(duō)年的鍵盤輸入和(hé)點擊手機屏幕之後,我們正在回歸到最初的“用戶界面”:語音(yīn)。雖然我們尚未感受到語音(yīn)技(jì)術(shù)帶來(lái)的全部影(yǐng)響,但(dàn)這種技(jì)術(shù)正在改變我們與數(shù)字世界互動的方式。
重要的是,這種轉變影(yǐng)響的遠遠不止是查看天氣預報,獲取音(yīn)樂,以及設置鬧鍾。語音(yīn)帶來(lái)了平台和(hé)用戶界面的轉變,足以與網頁和(hé)智能手機相媲美。作(zuò)為(wèi)人(rén)工智能和(hé)機器(qì)學習的入口,語音(yīn)技(jì)術(shù)将通(tōng)過強大(dà)的新方式為(wèi)我們提供服務。
在Mangorve,我們相信,語音(yīn)将成為(wèi)未來(lái)10年決定性的主題之一。除了用數(shù)字服務影(yǐng)響各行(xíng)各業以外,語音(yīn)技(jì)術(shù)還(hái)将培育出新一代的科技(jì)公司。與人(rén)工智能一起,語音(yīn)技(jì)術(shù)将從根本上(shàng)改變人(rén)和(hé)機器(qì)的關系,給下一代軟件創造巨大(dà)價值。
向語音(yīn)的轉移
自2011年蘋果推出Siri以來(lái),語音(yīn)技(jì)術(shù)已經取得(de)了長足發展。随着機器(qì)學習的發展,我們在語音(yīn)識别(語音(yīn)轉文字)和(hé)自然語言處理(lǐ)(識别文本中的指令)兩方面都獲得(de)了相當大(dà)的進步。事實上(shàng),語音(yīn)系統的單詞識别準确率已超過95%,這意味着它們已經具備了與人(rén)類相仿的語言理(lǐ)解能力。相對于打字,語音(yīn)産品提供了更自然、更便利、更高(gāo)效的溝通(tōng)形式。因此,語音(yīn)注定将成為(wèi)最主要的人(rén)機互動接口。
根據Juniper Research的數(shù)據,目前市面上(shàng)已有(yǒu)25億個(gè)語音(yīn)助理(lǐ)存在。随着科技(jì)巨頭争相加入競争,越來(lái)越多(duō)家(jiā)庭正在啓用語音(yīn)服務。在美國,家(jiā)用智能音(yīn)箱的總數(shù)2018年大(dà)幅增長78%,從6670萬台增加至1.855億台。亞馬遜在這個(gè)市場(chǎng)的份額達到64.6%。Canalys預計(jì),全球範圍內(nèi)智能音(yīn)箱的裝機量到2023年将增長至5億台。
語音(yīn)也在成為(wèi)智能家(jiā)居和(hé)物聯網的入口。亞馬遜宣布,已有(yǒu)4500個(gè)品牌提供2.8萬款支持Alexa的智能家(jiā)居設備,包括電(diàn)視(shì)機、炊具和(hé)機器(qì)人(rén)吸塵器(qì)。除了進入家(jiā)庭場(chǎng)景之外,語音(yīn)助手也在進入萬豪等酒店(diàn)的房(fáng)間(jiān),并且在汽車(chē)信息娛樂系統中也很(hěn)受歡迎。亞馬遜正在與多(duō)家(jiā)汽車(chē)公司展開(kāi)談判,有(yǒu)報道(dào)稱亞馬遜的車(chē)內(nèi)産品Echo Auto預售訂單已超過100萬。Echo Auto提供全方位的免提體(tǐ)驗,包括打電(diàn)話(huà)、導航,以及操控智能家(jiā)居設備。
語音(yīn)技(jì)術(shù)也在超越語言障礙。目前谷歌(gē)的服務已經支持30種語言,甚至可(kě)以同時(shí)理(lǐ)解用戶所說的多(duō)種語言。有(yǒu)趣的是,在中國語音(yīn)服務的普及更快,阿裏巴巴在中國的智能音(yīn)箱市場(chǎng)處于領先。
各類受歡迎應用的出現令人(rén)聯想到App Store發展的早期。亞馬遜Alexa提供的功能包括為(wèi)新媽媽提供母乳喂養支持,鼓勵孩子們刷牙,幫助用戶鍛煉,指導足球隊,以及指引人(rén)們如何禱告。
語音(yīn)電(diàn)商的崛起
由于亞馬遜Alexa直接關聯至全球最大(dà)的電(diàn)商平台之一,語音(yīn)購物也在初步發展。亞馬遜已經看到,Alexa平台的電(diàn)商交易在2018年假日季同比增長至三倍。沃爾瑪近期也推出了基于谷歌(gē)語音(yīn)助手的在線生(shēng)鮮購物服務,支持購物者通(tōng)過谷歌(gē)Home、智能手機或智能手表将産品添加到購物車(chē)。
根據Juniper的數(shù)據,在美國和(hé)英國,語音(yīn)電(diàn)商的規模将從2018年的20億美元增長至2022年的400億美元。有(yǒu)趣的是,語音(yīn)電(diàn)商最熱門(mén)的三大(dà)商品品類都是低(dī)價商品:生(shēng)鮮雜貨(20%)、娛樂(19%)和(hé)電(diàn)子(17%)。
因此對零售商來(lái)說,獲得(de)“亞馬遜精選”的地位将會(huì)比以往更加重要。根據OC&C戰略咨詢公司的數(shù)據,亞馬遜購物者中有(yǒu)85%最終會(huì)選擇亞馬遜推薦的商品。不過目前外界仍然不清楚,具體(tǐ)商品要如何才能獲得(de)這樣的推薦。
無論是在線上(shàng)還(hái)是線下,語音(yīn)技(jì)術(shù)已經在指引消費者購物。快消品廠商正在探索,基于語音(yīn)體(tǐ)驗,對于制(zhì)作(zuò)雞尾酒和(hé)品嘗威士忌等場(chǎng)景,可(kě)以如何提升産品定位和(hé)用戶忠誠度。
你(nǐ)不會(huì)再感到孤單
重要的是,語音(yīn)服務正在從事務性向對話(huà)性轉變。這種趨勢的最終結果很(hěn)難完全被理(lǐ)解,但(dàn)你(nǐ)可(kě)以考慮這一點:你(nǐ)永遠不會(huì)再感到孤單,無論是在與Alexa說話(huà),還(hái)是與另一個(gè)人(rén)或人(rén)工智能說話(huà)。人(rén)工智能的第一次浪潮使用算(suàn)法去建立推薦引擎,提供訪問互聯網服務,例如谷歌(gē)、亞馬遜和(hé)Facebook的快捷方式。而第二次浪潮則是幫助企業利用結構化數(shù)據去優化決策流程。類似Palantir的公司開(kāi)始崛起,它們挖掘大(dà)量結構化數(shù)據,找出人(rén)眼和(hé)人(rén)腦(nǎo)難以發現的信息關聯性。
人(rén)工智能的第三次浪潮正在到來(lái)。人(rén)工智能獲得(de)了眼睛、耳朵和(hé)無數(shù)其他感官,從而可(kě)以收集從來(lái)沒有(yǒu)過的新數(shù)據,随後使用這些(xiē)數(shù)據推動更複雜的流程自動化。與此同時(shí),我們也在從基于命令的靜态流程轉向動态流程。這是計(jì)算(suàn)領域的結構性變化,将徹底改變我們體(tǐ)驗軟件,與軟件交互的方式,模糊了數(shù)字世界和(hé)現實世界之間(jiān)的關聯。
随着人(rén)工智能系統在對話(huà)中變得(de)更熟練,收集關于人(rén)們及其周圍世界的更多(duō)數(shù)據,它們将可(kě)以了解情景信息。人(rén)類通(tōng)常可(kě)以不費力地掌握這些(xiē)關聯信息,并将其應用在對話(huà)中。情景信息将幫助人(rén)類和(hé)機器(qì)以更自然的方式互動和(hé)協作(zuò)。而随着體(tǐ)驗的優化,變得(de)更有(yǒu)用,他們将會(huì)更加頻繁的互動,而機器(qì)也将掌握更多(duō)知識。
這樣的良性循環意味着,在未來(lái)3到5年內(nèi),計(jì)算(suàn)機的對話(huà)能力将變得(de)更複雜,更具變革性。與其将我們的時(shí)間(jiān)花(huā)在鍵盤打字和(hé)智能手機觸控上(shàng),我們可(kě)以很(hěn)方便地與無所不在的人(rén)工智能交談。重要的是,我們與軟件互動的方式将被永久改變:表單将會(huì)消亡,接觸點将變成“監聽(tīng)點”。
這就可(kě)以解釋,為(wèi)何全球最大(dà)的科技(jì)公司向語音(yīn)技(jì)術(shù)進行(xíng)了大(dà)筆投資。語音(yīn)技(jì)術(shù)帶來(lái)了平台和(hé)用戶界面的改變,這足以媲美此前的網頁和(hé)智能手機,而不同之處僅僅隻是,用戶向語音(yīn)的轉移不需要任何訓練。對于這種未來(lái)主導性的平台,大(dà)型科技(jì)公司不容有(yǒu)失。因此,亞馬遜已有(yǒu)超過1萬名員工從事Alexa項目,而亞馬遜也是對語音(yīn)技(jì)術(shù)創業公司最熱衷的投資方之一。
語音(yīn)優先界面的黎明(míng)
語音(yīn)技(jì)術(shù)的影(yǐng)響非常深遠,每家(jiā)公司都需要重新考慮如何與用戶進行(xíng)互動。這不僅僅是調整SEO(搜索引擎優化)等方面的工作(zuò),或是開(kāi)發自己的Alexa“技(jì)能”或谷歌(gē)的“操作(zuò)”。
企業最終需要提供能感知情景、語音(yīn)優先的界面。能建立用戶認知和(hé)情感連接的企業将可(kě)以更好地吸引用戶,而如果隻是用預設腳本去被動響應用戶問題,那(nà)麽企業将處于明(míng)顯的劣勢。嚴重依賴通(tōng)知去驅動應用使用的科技(jì)公司可(kě)能需要重新審視(shì)策略。消費者對于那(nà)些(xiē)用太多(duō)通(tōng)知去打破“聲音(yīn)門(mén)檻”的公司(例如LinkedIn)不會(huì)再有(yǒu)太多(duō)耐心。
最熱門(mén)的移動應用成為(wèi)了今天的主導平台,而最能吸引用戶的語音(yīn)優先界面将會(huì)成為(wèi)明(míng)天的主導服務。很(hěn)難預測理(lǐ)想的界面應該是什麽樣,但(dàn)下一代Airbnb、Monzo和(hé)Uber的出現很(hěn)可(kě)能隻要3到5年。
無屏幕手機,例如Light Phone的出現向我們展示了未來(lái),這樣的手機不依賴于我們了解并喜愛(ài)的移動應用。考慮到語音(yīn)服務的學習曲線很(hěn)短(duǎn),能明(míng)顯減少(shǎo)用戶的使用障礙,因此可(kě)以很(hěn)合理(lǐ)地假設,在我們注意到全部潛力之後,語音(yīn)經濟将快速發展。
語音(yīn)時(shí)代的工作(zuò)
在我們與軟件交互的過程中,所花(huā)費時(shí)間(jiān)最長的場(chǎng)景就是工作(zuò)。因此可(kě)以合理(lǐ)假設,在工作(zuò)場(chǎng)景我們将會(huì)看到最明(míng)顯的變化。盡管我們可(kě)能仍然需要與屏幕互動,但(dàn)鍵盤很(hěn)可(kě)能會(huì)變成多(duō)餘的。畢竟,普通(tōng)人(rén)每分鍾可(kě)以用鍵盤輸入40個(gè)單詞,但(dàn)卻可(kě)以說出150個(gè)單詞。
無所不在的人(rén)工智能可(kě)以支持我們日常工作(zuò)中的許多(duō)任務和(hé)流程,例如回複電(diàn)子郵件,整理(lǐ)會(huì)議信息,向團隊成員發布信息,以及用數(shù)據更新相關系統等。這也可(kě)能意味着,我們将不再被捆綁在辦公桌,不必再久坐(zuò)不動。
更進一步,無所不在的人(rén)工智能可(kě)以注意到效率最高(gāo)的員工,并告知他人(rén)他的工作(zuò)方式,從而優化工作(zuò)産出。能持續識别高(gāo)績效者的特定策略,并将最佳績效建議分發給網絡中其他人(rén)的人(rén)工智能學習循環已經開(kāi)始出現。這些(xiē)優化網絡不是為(wèi)了取代人(rén)工,而是依靠人(rén)類去學習并優化流程。人(rén)類仍然會(huì)處于循環中。
一個(gè)值得(de)關注的案例是Chorus.ai,該服務能加入通(tōng)話(huà),同時(shí)就有(yǒu)效回複做(zuò)出提示。Chorus.ai并不是給銷售電(diàn)話(huà)提供預設的腳本,而是會(huì)分析團隊成員的不同方法,帶來(lái)更積極的成果,并鼓勵創造性。
通(tōng)過讓人(rén)類變得(de)更聰明(míng)、更高(gāo)效,新一代的SaaS(軟件即服務)産品将可(kě)以收取更高(gāo)的訂購費用,從而成為(wèi)更具價值的一代企業軟件。
從虛拟人(rén)物到虛拟醫(yī)生(shēng)
我們已經看到,虛拟KOL逐漸興起。例如,來(lái)自洛杉矶、19歲的虛拟KOL莉兒·米克拉(Lil Miquela)在Instagram上(shàng)積累了150萬粉絲,目前已經參與過Calvin Klein等知名時(shí)尚品牌的營銷活動。
位于舊(jiù)金山(shān)的創意工作(zuò)室Fable正在虛拟人(rén)物方面邁進更多(duō)一步。該公司的虛拟人(rén)物具有(yǒu)完整的互動能力,并且有(yǒu)自己的個(gè)性。很(hěn)快,我們就能創建人(rén)工智能全息伴侶,例如《銀翼殺手》中的喬伊。喬伊由Wallace Corp制(zhì)造,可(kě)以成為(wèi)“你(nǐ)想看到的全部一切”。
虛拟人(rén)物很(hěn)可(kě)能會(huì)改變娛樂和(hé)客服的表現形式,與此同時(shí)在給老年人(rén)和(hé)其他需要幫助的人(rén)群提供服務方面也可(kě)以扮演關鍵角色。畢竟,被認為(wèi)孤獨的人(rén)群健康下降的風險要高(gāo)出59%,而社交孤立也是造成抑郁症的最常見原因之一。
總部位于巴塞羅那(nà)的Safe365作(zuò)為(wèi)由科技(jì)驅動的社區(qū)和(hé)互助網絡已經吸引了許多(duō)老年人(rén)。語音(yīn)産品提供了對用戶非常友(yǒu)好的方式,監控健康和(hé)認知能力,并提供關于鍛煉和(hé)服藥的提醒。
事實上(shàng),語音(yīn)和(hé)人(rén)工智能最終有(yǒu)可(kě)能完全取代醫(yī)生(shēng)。K Health已經開(kāi)發了一款人(rén)工智能,将數(shù)千名醫(yī)生(shēng)的經驗結合在一起,以做(zuò)出準确的診斷。借助語音(yīn)技(jì)術(shù),人(rén)工智能還(hái)可(kě)以像人(rén)類醫(yī)生(shēng)一樣給病人(rén)提供安慰。
對語音(yīn)技(jì)術(shù)融資的分析
根據我們的分析,對語音(yīn)創業公司的投資正在加速。語音(yīn)技(jì)術(shù)創業公司今年已融資7.86億美元,遠遠超過2018年的5.81億美元以及2017年的2.98億美元。這樣的融資增長表明(míng)了市場(chǎng)的信心,即語音(yīn)技(jì)術(shù)将帶來(lái)變革。融資的規模也在大(dà)幅上(shàng)升,2019年到目前為(wèi)止平均交易規模是3000萬美元,而2018年和(hé)2017年分别為(wèi)1800萬美元和(hé)1750萬美元。
娛樂和(hé)播客是已經吸引了大(dà)量興趣的領域之一。Spotify收購了播客創業公司Gimlet和(hé)Anchor,總共花(huā)費3.37億美元。這個(gè)領域其他值得(de)關注的創業公司還(hái)包括制(zhì)作(zuò)語音(yīn)優先收費內(nèi)容的Sybel。
與此同時(shí),從2015年成立以來(lái),亞馬遜Alexa基金已經進行(xíng)了72筆投資。過去18個(gè)月中,該基金投資的創業公司涉及娛樂、健康、教育、交通(tōng)、電(diàn)商、酒店(diàn)和(hé)SaaS等行(xíng)業。這表明(míng),亞馬遜相信語音(yīn)技(jì)術(shù)将改變一系列行(xíng)業。
我們的分析還(hái)顯示,在語音(yīn)技(jì)術(shù)創業公司的融資活動中,美國處于領先。美國此類創業公司獲得(de)了超過10億美元的投資,而歐洲隻有(yǒu)1.18億美元。這尤其值得(de)關注,因為(wèi)語音(yīn)技(jì)術(shù)代表着範式轉換。如果歐洲希望在下一代技(jì)術(shù)發展中建立自己的地位,歐洲的創業者和(hé)投資人(rén)需要快速做(zuò)出響應。
挑戰
語音(yīn)技(jì)術(shù)領域最大(dà)的挑戰之一是隐私保護。微軟的數(shù)據顯示,41%的語音(yīn)助手用戶對信任、隐私和(hé)被動監聽(tīng)感到擔憂。谷歌(gē)Nest設備中被發現存在隐藏的麥克風造成了不利影(yǐng)響,而亞馬遜申請(qǐng)專利“監聽(tīng)房(fáng)間(jiān)裏的所有(yǒu)對話(huà)”也是如此。
如何回應這些(xiē)關切取決于科技(jì)公司,而蘋果在這方面的工作(zuò)卓有(yǒu)成效。蘋果收購Silk Labs值得(de)贊賞,後者開(kāi)發在設備中運行(xíng)的人(rén)工智能軟件,而不必使用雲計(jì)算(suàn)平台去處理(lǐ)數(shù)據。
蘋果在圍繞語音(yīn)服務構建生(shēng)态方面進展緩慢。實際上(shàng),蘋果1987年提出的“知識導航工具”給出了更明(míng)确的語音(yīn)服務願景。語音(yīn)服務社區(qū)期望蘋果在2020年全球開(kāi)發者大(dà)會(huì)(WWDC)上(shàng)為(wèi)開(kāi)發者社區(qū)發布Siri操作(zuò)系統,從而加速創新和(hé)普及。
Voicebot.ai的編輯和(hé)出版人(rén)布雷特·金塞拉(Bret Kinsella)表示:“Siri操作(zuò)系統對于鼓勵創新是有(yǒu)必要的。許多(duō)人(rén)認為(wèi),蘋果需要匹配亞馬遜和(hé)谷歌(gē)語音(yīn)助手取得(de)的進展。”
《機械姬》等熱門(mén)電(diàn)影(yǐng)中提出的一個(gè)問題是,如果我們癡迷于機器(qì)人(rén),愛(ài)上(shàng)代碼而不是其他人(rén),那(nà)麽人(rén)工智能将成為(wèi)人(rén)類的威脅。盡管對某些(xiē)人(rén)來(lái)說這種說法聽(tīng)起來(lái)很(hěn)牽強,但(dàn)約會(huì)模拟遊戲已被證明(míng)非常受歡迎。在中國,名為(wèi)《戀與制(zhì)作(zuò)人(rén)》的遊戲在上(shàng)線首個(gè)月下載量突破700萬。
盡管挑戰了我們對隐私保護的觀念,就人(rén)類與技(jì)術(shù)的關系提出了新問題,但(dàn)我們仍然有(yǒu)很(hěn)多(duō)理(lǐ)由對語音(yīn)技(jì)術(shù)保持樂觀。這種技(jì)術(shù)将驅動新的生(shēng)産力提升浪潮,造福消費者、企業和(hé)社會(huì)。并且,這也将幫助我們更好地照料老年人(rén),同時(shí)讓全球7.74億不識字的人(rén)群可(kě)以使用互聯網。
語音(yīn)時(shí)代的預測
鍵盤的消亡:我們不再需要打字,而是可(kě)以使用語音(yīn)和(hé)手勢。鍵盤将在未來(lái)5到10年內(nèi)基本上(shàng)消亡。
語音(yīn)技(jì)術(shù)将帶來(lái)全新的産品門(mén)類,包括無屏幕智能手機。
品牌很(hěn)快需要通(tōng)過“聲音(yīn)身份”來(lái)被識别,産品搜索将被徹底改變。
因為(wèi)在使用語音(yīn)服務時(shí)用戶不太能注意到具體(tǐ)應用,因此硬件将重新變得(de)比軟件更重要。
虛拟伴侶将變成現實,滿足你(nǐ)生(shēng)活的全部需求。
蘋果将于2020年推出Siri操作(zuò)系統,從而在語音(yīn)經濟中推動巨大(dà)的創新。到2025年,語音(yīn)經濟的規模将達到1萬億美元,超過移動應用經濟。