12月21日,科大訊飛召開年度發(fā)布會,發(fā)布新產(chǎn)品,展示大型會議上同步將演講者語音轉(zhuǎn)換為文字的技術(shù),總結(jié)成績,公布“訊飛超腦”科研項(xiàng)目進(jìn)展,最終展望未來:3~5年內(nèi),讓機(jī)器人考上大學(xué)!
低調(diào)了一年,科大訊飛在各家紛紛推出人工智能產(chǎn)品的2015年末尾,一次性宣告其在該領(lǐng)域的江湖地位。
這不禁讓筆者想起科大訊飛的2014年度發(fā)布會,主題為“語音點(diǎn)亮生活”。發(fā)布會上,科大訊飛為普羅大眾勾勒的還是“無論你在開車,看電視,還是玩手機(jī),只要動動嘴就能“下命令”的美好生活。
但也正是在這場發(fā)布會上,科大訊飛宣布正式啟動“訊飛超腦”計(jì)劃,研發(fā)基于類人神經(jīng)網(wǎng)絡(luò)的認(rèn)知智能引擎,賦予機(jī)器從“能聽會說”到“能理解會思考”的能力,并希望研發(fā)出第一個(gè)中文認(rèn)知智能計(jì)算引擎。而其團(tuán)隊(duì)由來自語言國家工程實(shí)驗(yàn)室、清華大學(xué)、加拿大約克大學(xué)等10多位人工智能領(lǐng)域頂級專家組成,組長是來自加拿大約克大學(xué)的江輝教授。
1年過去,科大訊飛再提目標(biāo),讓機(jī)器人在3~5年內(nèi)考上大學(xué)。相較之下,暫不提谷歌大腦、微軟“Adam計(jì)劃”、Facebook邀請Yann LeCun建立的人工智能實(shí)驗(yàn)室、Tesla創(chuàng)始人Elon Musk的“Open AI”有多牛,僅國內(nèi),李彥宏今年在某次活動上透露百腦大腦如今智力已達(dá)到3、4歲孩子智力水平,而人工智能初創(chuàng)團(tuán)隊(duì)圖靈機(jī)器人在今年年底發(fā)布的機(jī)器人操作系統(tǒng)號稱已擁有4、5歲孩子智商,各家“大腦“拼智商時(shí)代似乎到來。
這不禁讓筆者覺得,今年年初那個(gè)文能療傷,武能打怪獸的暖男大白已經(jīng)不遠(yuǎn)了。但冷靜下來發(fā)現(xiàn),訊飛超腦才1歲啊,它真能讓速記員失業(yè),讓機(jī)器人3年后考上大學(xué)嗎?這場野心勃勃的發(fā)布會似乎在努力回答這一問題。
先看訊飛超腦是怎么煉成的?
發(fā)布會上,科大訊飛董事長劉慶峰、副總裁兼研究院院長胡郁首次對其進(jìn)行詳細(xì)解讀,筆者總結(jié)如下:
人工智能的三個(gè)層次是計(jì)算智能、感知智能和認(rèn)知智能,前兩者機(jī)器的能力已經(jīng)超越人類,讓機(jī)器實(shí)現(xiàn)認(rèn)知智能是科研焦點(diǎn)?;乜慈祟愖陨戆l(fā)展,產(chǎn)生認(rèn)知智能的標(biāo)志是語言的廣泛使用,因此科大訊飛選擇從”自然語言理解“這一方向去尋找人工智能突破口,實(shí)現(xiàn)感知智能和認(rèn)知智能。
經(jīng)驗(yàn)論,工業(yè)界在這一方向取得進(jìn)步主要基于三大關(guān)鍵因素,即深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和漣漪效應(yīng),訊飛超腦也是基于這三大因素去實(shí)現(xiàn)的,深度神經(jīng)網(wǎng)絡(luò)是研究方法,大數(shù)據(jù)和漣漪效應(yīng)依靠的是科大訊飛的產(chǎn)業(yè)化路徑,即“產(chǎn)學(xué)研”一體化。
具體到感知智能(能聽會說)層面,訊飛超腦的構(gòu)(核)型(心)是利用FLN神經(jīng)網(wǎng)絡(luò)來讓機(jī)器聽懂世界,根據(jù)測試機(jī)構(gòu)ICDIR的測試結(jié)果,如今效果可以達(dá)到93%。
(核心在于構(gòu)型,即重構(gòu)的能力。因?yàn)樗^深度神經(jīng)網(wǎng)絡(luò)只是基于數(shù)學(xué)統(tǒng)計(jì)模式識別的一個(gè)很小分支,它起源于上世紀(jì)60年代,用于模擬人腦思考方式。2012年,訊飛將深度神經(jīng)網(wǎng)絡(luò)用于參數(shù)語音合成,使其效果提升30%。但人腦記憶包括短時(shí)記憶、瞬時(shí)記憶和長時(shí)記憶,而深度神經(jīng)網(wǎng)絡(luò)處理短時(shí)記憶能力比較弱,新的方式叫回歸神經(jīng)網(wǎng)絡(luò),它可以將前一個(gè)時(shí)塊的信息輸入到當(dāng)前時(shí)刻,以此提高記憶能力。而訊飛自己的構(gòu)型FLN神經(jīng)網(wǎng)絡(luò)可縮短響應(yīng)時(shí)間。)
在認(rèn)知層面,當(dāng)感知層面的各種信息集到認(rèn)知層面,類大腦就要去進(jìn)行語音理解、知識表達(dá)、邏輯推理和最后決策。簡單來說,就像你看到一只貓,腦海中形成貓的概念,同時(shí)還知道摸貓的感覺。為了實(shí)現(xiàn)這樣一個(gè)系統(tǒng),訊飛超腦框架被定義為自然意義下的語言生成及知識表達(dá)推理。而這其中有詞語、句子、篇章等不同層面。在最難的篇章層面,目前訊飛超腦可以做到的正確率為51%。
而在此基礎(chǔ)上,訊飛超腦要做兩件事情,第一,語言生成與理解,第二,知識的表述及推理。目前,訊飛超腦已可以作詩、評分等。還是數(shù)據(jù)說話:
此外,訊飛超腦還有一個(gè)重要特點(diǎn),它沒有喜怒哀樂。“我們從大腦中學(xué)習(xí)的越多,越可以把大腦主管智能的這部分和主管自我意識,即喜怒哀樂的這部分區(qū)分開來。我們可以讓將來人工智能機(jī)器人掌握智能,不一定非要有自我意識和喜怒哀樂。”胡郁介紹。
圍繞訊飛超腦,這兩年科大訊飛做了什么?
科大訊飛2014年年報(bào)顯示,其營業(yè)收入為17.7億,研發(fā)投入為5.1億,占營業(yè)收入的29.18% 。而圍繞訊飛超腦計(jì)劃,其業(yè)務(wù)在面向各行業(yè)數(shù)千家開發(fā)伙伴提供語音能力的基礎(chǔ)上,加快布局教育、移動互聯(lián)、智能客服、智能電視、車載等領(lǐng)域。2015年上半年報(bào)告顯示,其上半年?duì)I業(yè)收入10.3億,同比增長60.44%,主要是行業(yè)應(yīng)用產(chǎn)品等業(yè)務(wù)增長所致,這也反映出其在行業(yè)拓展方面的成績。
劉慶峰認(rèn)為,這是因?yàn)榭拼笥嶏w做對了三件事,首先選準(zhǔn)了切入點(diǎn),從語音合成到語音識別再到語音理解,并將其產(chǎn)業(yè)化形成自我造血和迭代;其次是有真正有抱負(fù)的核心人才,最后是產(chǎn)業(yè)路徑,從語音云平臺到教育、客服等領(lǐng)域,具有2B和2C的雙輪驅(qū)動能力。
下一步,科大訊飛計(jì)劃怎么做?
在創(chuàng)業(yè)邦看來,除了其基于語音交互技術(shù)系列產(chǎn)品帶來的大數(shù)據(jù)和漣漪效應(yīng),科大訊飛新推出的人機(jī)交互新產(chǎn)品AIUI和其在人工智能領(lǐng)域的布局才將是關(guān)鍵。
1、 AIUI、標(biāo)準(zhǔn)、全球化
據(jù)介紹,科大訊飛AIUI系統(tǒng)是集成了包括全雙工技術(shù)、麥克風(fēng)陳列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和內(nèi)容服務(wù)等科研成果和服務(wù)的產(chǎn)品。
這也將是其在行業(yè)布局的拳頭產(chǎn)品,“基于此,我們會積極制定標(biāo)準(zhǔn),并將標(biāo)準(zhǔn)利用AIUI優(yōu)勢全球化。 教育領(lǐng)域?yàn)槔?,目前,科大訊飛已經(jīng)在同新加坡、澳洲、東南亞國家合作進(jìn)行語音評測。”胡郁告訴創(chuàng)業(yè)邦。
2、智能機(jī)器人領(lǐng)域布局
在智能機(jī)器人行業(yè),科大訊飛有三方面的計(jì)劃。第一,為所有機(jī)器人公司提供語音和語言交互方案,第二,選擇家庭服務(wù)機(jī)器人、產(chǎn)業(yè)機(jī)器人領(lǐng)域的優(yōu)秀公司,為其提供定制方案和投資;第三,主導(dǎo)開發(fā)機(jī)器人。
劉慶峰介紹,科大訊飛目前看好的方向有三個(gè),第一是以陪伴和安防為主的家庭機(jī)器人;第二是教育行業(yè)的真正人型機(jī)器人或虛擬服務(wù)形態(tài)機(jī)器人;第三是客服領(lǐng)域,代替人工的機(jī)器人。
而創(chuàng)業(yè)邦查詢科大訊飛2014年年報(bào)和2015年上半年、第三季度報(bào)告,尚未發(fā)現(xiàn)其具體在智能機(jī)器人領(lǐng)域的投資,但發(fā)布會上可以看到,科大訊飛更多是將以提供解決方案形式參與其中,例如同Ninebot&Segway合作開發(fā)了“服務(wù)機(jī)器人”、ROOBO、UBTECH開發(fā)的系列機(jī)器人也利用了其核心技術(shù)等。
最后,創(chuàng)業(yè)邦不禁幻想,幾年后,戴著各家“大腦”的機(jī)器人共同坐在考場上,孰優(yōu)孰劣,考上一本再說吧!