這幾天,可穿戴設(shè)備突然一下熱起來(lái)了,國(guó)內(nèi)廠商一口氣發(fā)布了好幾款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果殼電子的GeakWatch等,當(dāng)然,最重頭的還是三星在德國(guó)舉行的發(fā)布會(huì)上,發(fā)布了智能手表Galexy Gear。
智能手表不是新發(fā)明的,有很多早就在市面上流行的產(chǎn)品,如索尼的SmatWatch等,就連做芯片的高通也發(fā)布了一款智能手表。大家早就看出,這里面是有前景的,是未來(lái)的一大趨勢(shì),只是如果巨頭不出手,這個(gè)市場(chǎng)就很難被激活。
智能手表到底是用來(lái)做什么的?在當(dāng)前技術(shù)條件下,還只能發(fā)短信,拍個(gè)照,記錄筆記,充當(dāng)健身輔助設(shè)備,在手機(jī)的支持下實(shí)現(xiàn)通話等,或許未來(lái)還可以在NFC的支持下完成近場(chǎng)支付等功能。智能手表的未來(lái),一定不是滿足用戶的娛樂(lè)需求,而是著眼于普通人日常生活領(lǐng)域的諸多實(shí)際需求,這是由其自身特點(diǎn)所決定的。但我更關(guān)心的是,智能手表靠什么輸入文字,傳送信息。
智能手表屏幕較小,使用額外的S-pen一類的輔助工具也并不現(xiàn)實(shí),在當(dāng)前條件下看,唯有依靠語(yǔ)音輸入了。語(yǔ)音輸入看上去是個(gè)不大的基礎(chǔ)應(yīng)用,實(shí)現(xiàn)起來(lái)卻需要非常復(fù)雜的技術(shù)能力,已經(jīng)涉及到人工智能AI的范疇,而且這個(gè)技術(shù)已經(jīng)進(jìn)化了幾十年,似乎還沒得以大規(guī)模商用,可見其開發(fā)難度。
13年前我曾買過(guò)一張IBM的Viavoice光盤,裝到電腦上后對(duì)著電腦練了一下午,希望其能快速熟悉我的個(gè)人口音,哪怕能有90%的識(shí)別率,也能為我繁重的文案工作減輕不少負(fù)擔(dān)。這次試驗(yàn)最終還是失敗了,卻并不令人沮喪,至少領(lǐng)略了世界前沿的語(yǔ)音識(shí)別技術(shù),理解到識(shí)別自然語(yǔ)言對(duì)于計(jì)算機(jī)而言有多么難了。在當(dāng)時(shí),Viavoice是世界最尖端的語(yǔ)音識(shí)別技術(shù)。
Gear中內(nèi)置了三星自己的S-Voice,另外也和百度合作,將百度語(yǔ)音助手預(yù)裝了進(jìn)去。看來(lái)百度與三星的關(guān)系相當(dāng)不一般,前有百度云,后有語(yǔ)音助手,對(duì)看重安卓更甚iOS的百度,支持力度相當(dāng)大。不過(guò),還是有理由相信,百度語(yǔ)音助手的技術(shù)實(shí)力已達(dá)到三星所期望的程度,預(yù)裝其語(yǔ)音產(chǎn)品,可以給智能手表帶來(lái)更好的用戶體驗(yàn)。語(yǔ)音有可能是智能手表的唯一輸入方式,在這方面無(wú)法做到準(zhǔn)確,易用,快捷,是很難讓用戶買單的,會(huì)成為其發(fā)展瓶頸。
在周日的下午下載了百度語(yǔ)音助手,進(jìn)行了一番測(cè)試。我發(fā)現(xiàn),普通話方面的語(yǔ)音識(shí)別準(zhǔn)確率,已經(jīng)到了令人驚喜的地步。除了一些停頓和轉(zhuǎn)折,機(jī)器在識(shí)別上仍有一定困難外,基礎(chǔ)字詞很少會(huì)出現(xiàn)錯(cuò)誤,只要對(duì)自己的普通話有一定自信,基本都能做到99%以上的識(shí)別率。
之后我還對(duì)百度語(yǔ)音助手進(jìn)行了上海話和英文的測(cè)試,發(fā)現(xiàn)效果并不理想,用上海話說(shuō)了一串上海市井小吃的名字,基本無(wú)法識(shí)別,但在將上海的區(qū)縣名稱挨個(gè)念出來(lái)后,發(fā)現(xiàn)還是有一定的識(shí)別率。至于英文,則是基本無(wú)法識(shí)別??磥?lái),這一版語(yǔ)音助手,仍是以普通話識(shí)別為基礎(chǔ)的,還沒有考慮到更多需求。
我不知道這是否代表中文普通話語(yǔ)音識(shí)別的最高水平了,其他一些語(yǔ)音識(shí)別工具,如搜狗和科大訊飛等產(chǎn)品,是不是也能做到差不多的識(shí)別效果。這一次的測(cè)試,與13年前的那次從感覺上完全不一樣。Viavoice是一種學(xué)習(xí)型的語(yǔ)音識(shí)別軟件,你需要適時(shí)地對(duì)識(shí)別結(jié)果進(jìn)行調(diào)整,以方便機(jī)器下一次識(shí)別,積累下來(lái)的識(shí)別數(shù)據(jù)要妥善保護(hù),要是因?yàn)橐淮沃匮b系統(tǒng)而導(dǎo)致丟失的話,一切都得重來(lái)。從商用角度來(lái)看,這還做不到多好的商用體驗(yàn),而如今的語(yǔ)音識(shí)別技術(shù),從體驗(yàn)上明顯已能讓人看到曙光。
甚至可以認(rèn)為,只有在語(yǔ)音識(shí)別技術(shù)取得革命性突破之后,可穿戴設(shè)備真正的爆發(fā)之日才會(huì)到來(lái)。設(shè)想你可以與智能手表和眼鏡實(shí)現(xiàn)人機(jī)對(duì)話,戴著眼鏡時(shí)不必再傻傻地說(shuō)句OK
Glass才能開啟攝像,只需用生活中最自然的語(yǔ)言即可完成指令發(fā)送,之后再由機(jī)器將任務(wù)完成情況用語(yǔ)音反饋給你,到那時(shí),屏幕的作用將弱化,移動(dòng)互聯(lián)網(wǎng)的新入口將誕生。
過(guò)去一年,百度在硅谷建立了IDL實(shí)驗(yàn)室,進(jìn)行深度學(xué)習(xí)方面的研究,在利用軟硬件模擬人腦方面試圖獲得更多成果。而這些工作,在過(guò)去印象中總是由IBM,貝爾實(shí)驗(yàn)室等大機(jī)構(gòu)所做的,出了能商用的成果,大家去買授權(quán)好了,像百度這樣的廣告公司也來(lái)搞這個(gè),著實(shí)令人感慨萬(wàn)分。
不過(guò),這些耗費(fèi)甚巨卻見不到短期產(chǎn)出的基礎(chǔ)研究項(xiàng)目,使得百度在語(yǔ)音識(shí)別技術(shù)方面有了相當(dāng)不錯(cuò)的進(jìn)步,還沒有達(dá)到商用化的地步,最起碼也已可以進(jìn)行積極布局,積累用戶了。
未來(lái)隨著手持設(shè)備的小型化,甚至穿戴化,各種智能眼鏡,手表等層出不窮,誰(shuí)能在語(yǔ)音輸入方面取得領(lǐng)先優(yōu)勢(shì),誰(shuí)就能掌握了用戶的一個(gè)基礎(chǔ)需求,誰(shuí)也就能在這個(gè)由鼠標(biāo)鍵盤、觸屏和語(yǔ)音所組成的互聯(lián)網(wǎng)世界里,占據(jù)一個(gè)重要入口。
轉(zhuǎn)載請(qǐng)注明出處。