近些年來, Google、Microsoft和Facebook等幾大玩家都創(chuàng)建了自己的AI研發(fā)團隊,并取得了一些令人矚目的成果。
2015年11月9日,谷歌宣布TensorFlow開源,這是一個在GPU上進行快速梯度式機器學習的巨大數(shù)據(jù)庫。一些文章推測TensorFlow會帶來一場人工智能革命,稱谷歌的這一舉動很大膽,因為Torch(由Facebook人工智能實驗室的Ronan Collobert維護)已經(jīng)提供了相似的深度學習開放資源,同時Yoshua Bengio教授的實驗室對Theano(深度學習領(lǐng)域的先驅(qū),一個適合普通大眾的革命性軟件)已經(jīng)進行了長期的維護開發(fā)。在Wired的一篇文章中,Cade Metz把TensorFlow描述成谷歌的”人工智能引擎“。
這篇文章講的是進行線性代數(shù)和求導計算的開源數(shù)據(jù)庫,甚至標題也十分夸張。許多其他新聞報道中,卻對谷歌把代碼設(shè)為公開資源感到驚詫。從更加技術(shù)的一方來看,從夸張的贊揚到潑冷水,各種反響都有。Soumith Chintala發(fā)布了一套應對所有競爭軟件包的標準,為人們提供了一種定量的評價,它顯示TensorFlow的首個版本落后于Torch和Caffe,特別在卷積神經(jīng)網(wǎng)絡(luò)方面。
神經(jīng)網(wǎng)絡(luò)使用硬件和軟件搭建出了類似于人腦的神經(jīng)元網(wǎng)絡(luò),這可以追溯到上世紀80年代,但直到2012年,Krizhevsky和Hinton才開始發(fā)明在圖形處理器(GPU)上運行神經(jīng)網(wǎng)絡(luò)的技術(shù)。GPU原本是為游戲和其它高性能圖像軟件設(shè)計的專用處理芯片,但事實證明,它們也非常適合驅(qū)動神經(jīng)網(wǎng)絡(luò)。
谷歌、Facebook、Twitter、微軟和其它許多公司現(xiàn)在都使用GPU驅(qū)動的人工智能來處理圖像識別等多種任務(wù),包括互聯(lián)網(wǎng)搜索和安全應用等。Krizhevsky和Hinton后來加入了谷歌。
微軟的一個研究團隊設(shè)計了一個遠比“典型設(shè)計”復雜的神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠進行多達152層的復雜數(shù)學運算,而典型設(shè)計一般只有六到七層。這預示著未來幾年,微軟這樣的公司將能使用GPU及其它專用芯片的龐大集群來極大提升包括圖像識別在內(nèi)的各種各樣的人工智能服務(wù),包括識別語音甚至理解人類自然表達的口語。但是建造這樣的大型神經(jīng)網(wǎng)絡(luò)是極其困難的。
為了確定每一層的工作模式以及與其它層的通信方式,需要將不同的特定算法部署到每一層上,但這卻是一個極其艱難的任務(wù)。但微軟在這里也有技巧。他們設(shè)計了一個能夠幫助他們建造這些網(wǎng)絡(luò)的計算系統(tǒng)。研究人員可以識別一些可能有用的大型神經(jīng)網(wǎng)絡(luò)部署方式,然后該計算系統(tǒng)可以在一系列的可能性上對此進行循環(huán)計算,直到確定出最佳選擇。
據(jù)深度學習創(chuàng)業(yè)公司Skymind的首席研究專家Adam Gibson介紹,類似的做法現(xiàn)在越來越普遍。這被稱為“超參數(shù)優(yōu)化”(hyper parameter optimization)。
他說:”人們可以讓一群機器跑起來,一次運行10個模型,然后找出最好的那個使用就行了。他們可以輸入一些基本參數(shù)(基于直覺確定),然后機器在此基礎(chǔ)上確定什么才是最好的解決方案。“Gibson說,去年Twitter收購的一家公司W(wǎng)hetlab就提供了類似的”優(yōu)化“神經(jīng)網(wǎng)絡(luò)的方法。
預計2016年將會是機器情緒識別的分水嶺,而且情緒會成為我們與機器交互的強有力的新通道,并且由于照相機技術(shù)和計算機視覺算法的發(fā)展,未來機器通過我們?nèi)祟惖拿娌勘砬?、眼動方式、肢體語言、說話方式甚至抬頭等理解我們的能力會大大提高。
卡耐基梅隆大學機器人研究所的Fernando De la Torre發(fā)明了特別強大的面部識別軟件,被稱作 IntraFace。他的團隊采用機器學習的方法來教IntraFace如何以一種適用于大多數(shù)面孔的方式來識別和追蹤面部表情。然后他們創(chuàng)建了個性化算法能夠讓軟件對個人進行情感表達分析。不僅準確,而且高效,該軟件甚至能在手機上運行。
未來機器能更加理解我們的情緒,我們與機器的交互也會變得更加豐富??突仿〈髮W的Justine Cassell研究虛擬同伴在教育行業(yè)的應用,她發(fā)現(xiàn)當虛擬同伴能對學生們的情緒狀態(tài)做出適當反應,甚至在某些場合嘲笑他們時,學生們會更積極地參與也會學得更好。不難想象商業(yè)領(lǐng)域會多么喜歡用這個功能,廣告人、營銷人以及電影制片人能得到客戶群體更為具體的信息。
在醫(yī)療與AI的結(jié)合方面,目前醫(yī)生問診的依據(jù)主要是病人當次檢查留下的醫(yī)學影像信息,而在確診時幾乎忽略了既往病史、家族病史和測試結(jié)果的影響。但試想一下,如果病人的各項身體數(shù)據(jù)都可以被實時地、連續(xù)地記錄,并且有一個足夠智能的醫(yī)療診斷系統(tǒng)可以將這些數(shù)據(jù)與全世界范圍內(nèi)有相似癥狀病人的數(shù)據(jù)進行比較,在此基礎(chǔ)上加以當前臨床醫(yī)學的研究和指導,綜合給出診斷建議的話,是不是會精確和科學許多?
一家名為Sentrian的生物傳感器研究公司已經(jīng)研發(fā)出可以完成上述操作的醫(yī)療系統(tǒng)。該公司總部位于美國佛羅里達州,致力于機器學習的相關(guān)研究,目前該智能醫(yī)療系統(tǒng)已進入臨床測試階段。他們希望創(chuàng)建一個讓醫(yī)生實時關(guān)注病人身體數(shù)據(jù),進而做出具有更好、更早、更加個性化診斷方案的醫(yī)療系統(tǒng)。
現(xiàn)在利用無線生物傳感器可以收集一些簡單或者較為復雜的身體信息,例如體溫,心率,血氧飽和度和血鉀含量等等。通常,每名遠程病人每次只佩戴一至兩個傳感器,他們的數(shù)據(jù)就可以被醫(yī)生直接分析。如果病人持續(xù)佩戴多個傳感器,產(chǎn)生的數(shù)據(jù)就會非常龐大。
Sentrian公司的醫(yī)療系統(tǒng)收集完病人數(shù)據(jù)后利用機器學習算法進行分析。該系統(tǒng)內(nèi)包含慢性疾?。òㄐ呐K病,糖尿病,慢性阻塞性肺疾病等等)的身體數(shù)據(jù)變化信息,病人的信息將會與這些信息進行匹配比較,系統(tǒng)通過觀察細微的關(guān)聯(lián)進行早期確診。心率、血壓、血氧飽和度等信息也會被傳至云端進行分析,在必要時通知醫(yī)生。