三維掃描儀的計算機視覺(也稱計算機視覺)是指用攝像機和計算機代替人眼對目標(biāo)進行識別、跟蹤和測量等,它是人工智能領(lǐng)域最熱門的研究課題之一,它和專家系統(tǒng)、自然語言理解已成為人工智能領(lǐng)域最活躍的三大領(lǐng)域。盡管它還沒有形成完整的理論體系,在很多方面它解決問題的方法還是一種技巧,但它是實現(xiàn)工業(yè)生產(chǎn)高度自動化、機器人智能化、自主車導(dǎo)航、目標(biāo)跟蹤,以及各種工業(yè)檢測、醫(yī)療和軍事應(yīng)用的核心內(nèi)容之一,也是實現(xiàn)智能機器人的關(guān)鍵因素之一,它的發(fā)展不僅將大大推動智能系統(tǒng)的發(fā)展,也將拓寬計算機與各種智能機器的研究范圍和應(yīng)用領(lǐng)域。
三維掃描儀機器視覺是研究用計算機來模擬生物外顯或宏觀視覺功能的科學(xué)和技術(shù)。機器視覺系統(tǒng)的首要目標(biāo)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實世界模型,然后認(rèn)知現(xiàn)實世界。機器視覺系統(tǒng)獲取的場景圖像一般是灰度圖像,即三維場景在二維平面上的投影。此時,場景三維信息只能通過灰度圖像或灰度圖像序列來恢復(fù)處理,這種恢復(fù)需要進行多點對一點的映射逆變換。在信息恢復(fù)過程中,還需要有關(guān)的場景知識和投影幾何知識。
三維掃描儀機器視覺是一個相當(dāng)新且發(fā)展十分迅速的研究領(lǐng)域,并成為計算機科學(xué)的重要研究研究領(lǐng)域之一。機器視覺是在20 世紀(jì)50 年代從統(tǒng)計模式識別開始的,當(dāng)時的工作主要集中在二維圖像分析和識別上,如光學(xué)字符識別、工件表面、顯微圖片和航空圖片的分析和解釋等。60 年代,Roberts (1965)通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進行描述。Roberts 的研究工作開創(chuàng)了以理解三維場景為目的的三維機器視覺的研究。Roberts對積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場景。于是,人們對積木世界進行了深入的研究。研究的范圍從邊緣、角點等待征提取,到線條、平面、曲面等幾何要素分析,—直到圖像明暗、紋理、運動以及成像幾何等,并建立了各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。到了70 年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)。
70 年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實驗室正式開設(shè)“機器視覺”(Machine Vision)課程,由國際著名學(xué)者B.K.P.Horn 教授講授.同時,MIT AI實驗室吸引了國際上許多知名學(xué)者參與機器視覺的理論、算法、系統(tǒng)設(shè)計的研究。David Marr 教授就是其中的一位。他于1973 年應(yīng)邀在MIT AI 實驗室領(lǐng)導(dǎo)一個以博士生為主體的研究小組,1977 年提出了不同于“積木世界”分析方法的計算視覺(computational vision)理論,該理論在80 年代成為機器視覺研究領(lǐng)域中的一個十分重要的理論框架。
Marr 視覺計算理論立足于計算機科學(xué),系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面業(yè)已取得的所有重要成果。是三維掃描儀視覺研究中迄今為止最為完善的視覺理論。Marr建立的視覺計算理論,使計算機視覺研究有了一個比較明確的體系,并大大推動了計算機視覺研究的發(fā)展。人們普遍認(rèn)為,計算機視覺這門學(xué)科的形成與Marr 的視覺理論有著密切的關(guān)系。Marr 視覺計算理論將整個視覺過程所要完成的任務(wù)分成三個過程,而獲得這些表示的過程依次稱為初級視覺、中級視覺和高級視覺,如圖1 所示。
Marr 視覺過程中的三個階段
可以說.對三維掃描儀機器視覺的全球性研究熱潮是從20 世紀(jì)80 年代開始的,到了80年代中期,機器視覺獲得了蓬勃發(fā)展,新概念、新方法、新理論不斷涌現(xiàn)。有學(xué)者對計算機視覺理論的發(fā)展提出了不同的意見和建議。對Marr 的理論框架作了種種的批評和補充,綜合這些意見及補充可得如圖2 所示的框架。
補充的Marr 理論框架
同時,在擴充的理論框架中,引入了三維掃描儀主動視覺的研究方法,在研究中重視了對定性、有目的的視覺等的研究[。比如,基于感知特征群的物體識別理論框架、主動視覺理論框架、視覺集成理論框架等。到目前為止,機器視覺仍然是一個非?;钴S的研究領(lǐng)域。許多會議論文集都反映了該領(lǐng)域的最新進展,比如,國際計算機視覺與模式識別會議(InternationalConference on Computer Vision and Pattern Recognition,CVPR);國際計算機視覺會議(InternationalConference on Computer Vision ,ICCV) ; 國際模式識別會議(International Conference on Pattern Recognition, ICPP);國際機器人學(xué)與自動化會議(International Conference on Robotics and Automation,ICRA);計算機視覺研討會(Workshop on Computer Vision, WCV)以及許多SPIE 的會議。還有許多學(xué)術(shù)期刊也包含了這一領(lǐng)城的最新研究成果,如,IEEE Transaction on Pattern Analysis and Machine16Intelligence(PAMI);Computer Vision,Graphics,and Image Processing (CVGIP);IEEE高層知識: 物體模型Transaction on ImageProcessing;IEEE Transaction on Man,and Cybernetics (SMC);MachineVisionandApplications;International Journal on Computer Vision (IJCV);Imageand Vision Computing;Pattern Recognition。另外,每年還出版許多研究專集、學(xué)術(shù)著作、技術(shù)報告,專題討論會文集等.所有這些都是研究機器視覺及其應(yīng)用的很好信息來源。機器視覺系統(tǒng)主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。
轉(zhuǎn)載請注明出處。