眼下,智慧化趨勢如火如荼。 不過,無論是智慧語音技術還是智慧硬體,作為新興行業,其都存在短期內被高估、長期又被低估的尷尬境地。 實際上,目前的智慧語音和智慧硬體都是更多的像是一種創客行為,大多停留在好玩有趣的角度,儘管其在國外已經形成了產業,但在國內還尚未進入大眾市場。
深究下來,其背後是一種改良與創造的市場回饋差異。 改良的潛臺詞是使用者市場已經存在,而創造則是需要挖掘一個新的市場。 所以,我們能夠看到,雖然智慧可穿戴設備在極客圈內已經十分流行,但在大眾市場卻鮮有成功案例。 相反,像極路由這樣的改良型產品卻能輕鬆推廣。 從這個角度看,創造性的智慧家居還處於爆發前夜。 而對於更多的智慧語音和智慧產品而言,改良會不會是一個更好的選擇呢?
2012年,Siri 讓 iPhone 4S成為最受歡迎的手機,也讓人們恍然發現,智慧語音控制即將進入日常生活,脫離雙手的控制行為正在成為可能。 但是,Siri並沒有給智慧語音控制的普及帶來質的飛躍。 更多時候,Siri成為了被調戲的物件,隨之興起的智慧語音創業專案也逐漸式微。 對於Siri和它的模仿者來說,智慧語音控制處在一個無用武之地的尷尬境地。
歸結語音控制發展困境的原因,大概有兩個:一個是交互尷尬,由於搭載語音控制的智慧手機不「智慧」,無法識別人的需求,在交互環境中語音控制所耗費的成本相比手動操作不降反增;另一個是手機功能限制, 儘管目前手機有成為移動生活中心之勢,但其絕大部分功能依然是基於軟體層面,相關操作的物件也被局限在手機本身。
如此說來,如果一款產品能夠避免使用者交互尷尬,能夠智慧識別使用者需求,還能增加控制的場景,是否就能脫穎而出呢?聚熵科技所開發的小智超級音箱就正試圖打造這樣一款產品。
簡單的人機交互
從產品形態來看,小智是一款集成了智慧作業系統的音響,擁有獨立CPU、4G存儲空間以及獨立的無線通訊模組。 使用者能夠通過語音指令對小智進行控制,實現歌曲的自動播放、下載、鬧鐘提醒等功能,是一台真正實現了語音控制的智慧音響。
小智工作在聯網環境下,能夠識別普通話,在1米範圍內,正確識別率96%,3米範圍內,約為94%的識別率。 除了獨立工作之外,小智也可以連接到更高許可權的手機APP上,接受遠端指令。
可以說,小智是一個會根據人們的語音命令唱歌的智慧型機器人。
可擴展的智慧控制應用
語音辨識和基於雲端資料庫的語義分析實現了小智的基本功能,除此之外,小智的運算能力、處理能力還賦予了它人工智慧控制系統的角色。 通過開放介面接入協力廠商智慧設備,小智可以實現對任何智慧家居設備的控制。
我們可以想像這樣的場景:當你覺得空氣不好,只要對小智說聲「啟動空氣淨化器」,空氣淨化器就被打開了。 更新升級小智的軟體版本,就可以接入新的智慧家電。 整個過程中,小智就像是一個小機器人,你只需要通過聲音發出指令,它就會完成所要求的任務。
不過,目前的小智還只能接入少數智慧設備。 開發者希望,年底對接的硬體廠商能夠達到50~100家左右。 到那時候,整套智慧家居就能基本實現獨立于手機運作。
硬體是智慧語音的未來?
小智的開發前身是聚熵科技的智慧語音應用「智慧360」。 2012年1月15日,在Siri被整合發佈後的3個月,這款能夠智慧聊天、打電話、發短信的智慧語音應用的下載量就已過萬。 到2013年4月,使用者數突破千萬。
單純從體量上看,作為一款智慧語音軟體,「智慧360」成績不菲。 但彼時,由於巨頭進入,整個市場競爭格局發生巨變。 為了尋找新的機會,他們曾經嘗試過語音軟體平臺化的道路,最終選擇了進入硬體。
為什麼選擇這樣的發展途徑?聚熵科技李傳豐解釋說,智慧語音應用應當基於兩項內容:一是語音語義識別,二是具備資料分析和學習能力的智慧系統。 沒有人工智慧的進步,語音控制就毫無意義。 而如果想要完美融合這兩套系統並實現場景應用,智慧化的語音硬體是必然的趨勢。
再回過頭來看Siri的興起,它其實更多的是刺激了創業者關於未來的神經,其帶來的創業和資本興奮,讓智慧語音的創業走到現在。 而眼下,智慧語音已經開始跨界,走向了軟硬體結合的新方向。 不過,在面對一個尚未普及的智慧硬體市場,智慧語音軟體能夠轉型成功嗎?
且行且珍惜。
(責任編輯:mengyishan)