智能音箱是偶然產品? 未來語音交互什麼樣?






蘋果HomePod發布後,智能音箱市場又迎來新的一輪升溫。無論是科技巨頭還是創業公司,無論是硬體廠商還是內容服務提供商,無論是平台提供方還是技術提供方,都在圍繞智能音箱打造一套完整的生態體系。智能音箱也被賦予了更多功能,除了聽音樂、百科知識、控制家電之外,還被接入了更多第三方服務,比如購物需求、基於LBS的服務:叫快遞、叫出租、叫家政等等。

不過,對於智能音箱未來發展形態,智能音箱是否會成為智能家庭的控制中心,智能音箱可能會增加的應用場景,用戶畫像會是怎樣,智能音箱是巨頭的市場還是創業者的天下,如果智能音箱洗牌的話,誰會最先被洗掉?……對於這些問題,業內似乎有了更冷靜的思考。

網易科技第49期五道口沙龍邀請到了靈隆科技副總裁方律、蜻蜓FM技術總監金鑫、思必馳CMO龍夢竹、小米智能服務總監王剛、順為資本副總裁段譽、海知智能創始人兼CEO謝殿俠、出門問問公司產品副總裁林宜立、Sugr米唐科技創始人兼CEO宋少鵬,這些分別來自平台方、硬體廠商、內容提供商、技術服務提供商、投資者的專業人士,對上述問題進行了闡述。

Echo與國內智能音箱用戶差異

Echo可以說是智能音箱成功的典範,只要提到智能音箱必提Echo,而且國內智能音箱評測也總會對比上Echo。但對於Echo與國內智能音箱市場的差異,龍夢竹認為,國外更重視從0到1的基礎創新,而中國的優勢在於從1到N的未來應用級創新。她認為,中國肯定會有產品超過Echo,這是值得期待的。

方律表示其實差不多,Echo使用用戶和國內用戶都是使用點播內容比較多。另外,國內目前越來越多O2O服務,比如購物服務等。

而宋少鵬則分享了Echo用戶經歷的三個階段:第一階段,最早的一批嘗鮮用戶是科技極客,以男性為主,時間是2015年,大概是35歲甚至以上;第二階段:2016年開始介入到更廣義的消費人群,女性用戶開始增加,從35到50多;第三階段,2017年開始進入到更廣義的消費者,男女比例居中入門年齡開始下探到20幾歲。

出門問問則預測大概有幾類人會購買自己的音箱:第一類是科技極客人群;第二類為年齡偏年輕的人,父母有小孩的可能會關注一些,給孩子買;第三類則是年輕學生和白領。

3-5年智能語音的交互形態?

龍夢竹認為,Echo是一個偶然性的產品,而整個必然發展的方向其實是背後的Alexa,而Echo的未來可能不只是智能音箱,它可能會以電視的形態、以冰箱的形態、以路由器的形態,甚至以一支筆的形態出現。

對此,王剛也絕不認為智能音箱是家庭的中心,未來的語音交互一定會過渡到多個中心,在更遠的將來就變成去中心化,不是一個設備,可能是所有設備都具備語音交互能力。

金鑫則認為,語音交互還是很主要的一種交互方式,如果配合圖形、圖像更好。蜻蜓FM希望用戶對內容需求更強,對智能設備操控更多以及個人助理的需求更高。

方律則認為,短期內除了音箱之外第一個適合語音交互的產品耳機,因此會在耳機上有更多嘗試。宋少鵬表示大家不要被「音箱」兩個字限制了思考,今天的手機已經不是15年前的手機了,以未來若干年音箱並不是今年音箱的概念去看,以這種眼光會看到很多機會,以及很多可以嘗試的切入點。

未來呈現最多的服務形態

用戶畫像有了,用戶使用的服務會是什麼呢?

宋少鵬表示,目前Echo在典型應用上主要三大類:音樂、時間類、信息類。而出門問問則預測,常用的應用會是聽歌、聽內容。金鑫認為,內容會是一個非常強的需求,另外一個是外賣。外賣是目標性比較強的需求。排在第三的是對智能家居的控制。

龍夢竹,首先產品會細分,從而導致大批內容會細分。國內現有的音箱產品,一個是小米小愛對智能家居和小米生態鏈控制;第二個是天貓精靈帶來的整個支付、線上體驗戶有提升;第三是其他產業做的語音筆記類服務會提升。

方律透露叮咚音箱會提供購物服務,但體驗並不夠好。明年會推出帶有螢幕的交互產品,因此購物會是一個主要方向;另外,一個是教育方向,比如與新東方的合作。還有一個是對智能設備的控制。

王剛則表示,第一件想做的是跟微信打通;另外則是做一個開放平台,讓開發者可以把自己的應用和需求在小米平台上進行集成。

巨頭的未來還是創業者的天下?

國外Echo、Google、蘋果和微軟都相繼推出了智能音箱,並占據了更多市場份額,國內國內阿里巴巴出了天貓精靈,京東、騰訊、百度也都在布局。那麼,到底最後智能音箱是巨頭的天下還是創業者的天下?

謝殿俠認為,國內情況比較複雜,中國人多,市場也比較多元。因此,國內有可能是一兩家巨頭,再加一些新領域的長尾。巨頭的話,謝殿俠認為小米比較有優勢。

宋少鵬則認為,智能音箱只是語音交互落地的第一個形態,會迭代出更多形態。如果以音箱這個形態落地的話,騰訊有著天然的優勢。而其他領域,小米也會有優勢。「巨頭之間的競爭也會以場景來進行區隔,就像是移動互聯網BAT三家以不同的場景來解決各個場景的問題一樣,進入語音交互之後我們也持同樣的觀點。」宋少鵬表示。

林宜立則認為,在未來這個時代一定是開放的,哪怕是巨頭,如果東西是封閉的,最後還是可能會被其他人打敗。因此,他認為AI智能硬體的時代還是很開放的。

九成會死掉? 誰會堅持的更久

有數據統計,智能音箱玩家明年會有九成死掉,那麼怎樣做才能堅持的更久一些呢?

林宜立認為,賺不到錢又沒有錢可以燒的公司一定會死掉。「如果做音箱的企業,在價格上沒有優勢、在體驗上沒有優勢、在管道上沒有優勢,那可能真的很危險,到最後真的就會是為數不多好的產品和廠家留下。」林宜立表示。

宋少鵬認為,智能音箱今年剛剛開始,打著智能音箱旗號的企業都已經有很多了,但一定會被市場一點點淘汰。如果要在某個領域有優勢,要麼管道、要麼品牌、要麼用戶體驗、要麼價格成本,想要存活,一定要給用戶帶來價值。

謝殿俠也表示同意上述觀點,但他也表示不管巨頭也好還是百花齊放,可能都會持續一段時間。所以有可能明年還是會持續繁榮,除了幾個大品牌之外,細分領域、細分行業、細分市場這類的智能音箱仍然會大量存在,也許再過幾年競爭門檻高了,但應該會比手機的周期更長一些。

智能音箱技術突破點

從技術角度來說,智能音箱會涉及到對自然語言的理解。語音對話技術近期會有怎樣的突破呢?

謝殿俠認為,現有的技術如果限定了領域、限定了場景、限定了使用對象,有足夠多的數據,構建了相對比較成熟的圖譜,體驗的底線會讓大家覺得比手機、比任何傳統體驗要好。

但問題就在於數據這方面,數據臟亂差,對機器來講,機器的容錯率沒有那麼高,最後給的結果不是想要的。

另外一個是算法本身,在語言理解這個環節也有很大突破,但只是相對很大,什麼時候能達到人臉識別或語音識別這樣跟人的肉身相比有可比性甚至是超越的情況,還需要若干年探索。

宋少鵬補充道,技術問題分兩層回答,一個是眼前的,一個是未來的。眼前的一些實際的技術問題,比如語音的大規模應用還是會面臨地域性的問題,中國就是一個很大的國家,全世界又是更大的範圍,在這個範圍內的地域性問題所帶來的語音模型差異、語義模型差異都需要時間和工程去解決。

另外一個更有挑戰的是未來科技行業在打造人工智能產品的時候,人文的東西會起到越來越關鍵的作用。

無論是否是智能音箱的形態,語音交互的市場未來無可限量。嘉賓們均認為,語音交互突破1億的單位將會是近一兩年的事情,發展將會很快。智能語音將會是個藍海市場。