導(dǎo)語(yǔ):目前,有研究人員正在設(shè)計(jì)讓機(jī)器人難以抓取的對(duì)抗性物體,以訓(xùn)練機(jī)器人的抓取能力。
智東西7月10日消息,近日,加州大學(xué)伯克利分校(University of California, Berkeley)的研究人員正在設(shè)計(jì)一些機(jī)器人難以操控的物體,以提高計(jì)算機(jī)視覺算法處理對(duì)抗圖像的性能,加強(qiáng)機(jī)器人抓取物體的能力。
一、對(duì)抗圖像能提高計(jì)算機(jī)視覺算法能力
近幾年來(lái),許多研究人員對(duì)對(duì)抗圖像進(jìn)行了大量研究,這些圖片被進(jìn)行了微妙的修改,讓計(jì)算機(jī)視覺算法都難以準(zhǔn)確地識(shí)別出正確圖像。
例如,谷歌大腦(Google Brain)的研究人員曾通過(guò)開發(fā)一種讓計(jì)算機(jī)和人類都難以判斷的對(duì)抗圖像,以確認(rèn)這項(xiàng)能夠欺騙人工神經(jīng)網(wǎng)絡(luò)的技術(shù),是否也能欺騙人們大腦內(nèi)部的生物神經(jīng)網(wǎng)絡(luò)。
這些研究人員的目的,主要是想利用這些對(duì)抗圖像來(lái)幫助他們?cè)O(shè)計(jì)更加強(qiáng)大的計(jì)算機(jī)視覺算法。
因?yàn)椤皩?duì)抗性”的本質(zhì)是一種人為的惡劣條件,如果計(jì)算機(jī)算法能夠處理這些對(duì)抗圖像,就意味著這些算法能夠處理其他大多數(shù)棘手的事情。
二、如何設(shè)計(jì)異形立方體
最近,加州大學(xué)伯克利分校的研究人員,將對(duì)抗圖像訓(xùn)練計(jì)算機(jī)視覺算法的這一概念擴(kuò)展到了機(jī)器人的抓取能力中。
研究人員將簡(jiǎn)單而普通的三維形狀進(jìn)行微調(diào),令傳統(tǒng)機(jī)器人用兩個(gè)手指都難以牢固抓取。
這些對(duì)抗物體的關(guān)鍵點(diǎn)在于,它們只是看起來(lái)容易抓,但對(duì)于兩指(平行顎)抓取工具來(lái)說(shuō),卻很難抓取。
被調(diào)整后的對(duì)抗物體與它們的實(shí)際幾何形狀之間的區(qū)別是很微妙的。
例如,研究人員將一個(gè)正方體的三個(gè)平面都設(shè)計(jì)成一個(gè)淺金字塔形狀,其中最小的金字塔只有10度的斜率,并且每個(gè)金字塔對(duì)面的一側(cè)使一個(gè)規(guī)則的平面。
這樣的設(shè)計(jì)導(dǎo)致該正方體上沒(méi)有直接相對(duì)的平面,如果機(jī)器人的兩指抓取工具試圖夾住傾斜的表面,那么機(jī)器人施加的力會(huì)導(dǎo)致物體扭曲并滑落,從而抓取失敗。
隨著立方體形狀的復(fù)雜性增加,研究人員開發(fā)對(duì)抗性版本的過(guò)程也變得越來(lái)越困難。
研究人員針對(duì)立方八面體(有八個(gè)三角形面和六個(gè)正方形面的多邊形),在模擬設(shè)計(jì)中隨機(jī)調(diào)整該立方體的頂點(diǎn),使它得到一個(gè)沒(méi)有直接相對(duì)表面的頂點(diǎn)。
對(duì)于更復(fù)雜的形狀,如相交的圓柱體,研究人員則使用深度學(xué)習(xí)算法來(lái)生成對(duì)抗性的例子。
三、系統(tǒng)預(yù)測(cè)抓取成功率100%,實(shí)際僅為13%
研究人員進(jìn)行這項(xiàng)研究的目的不僅僅是為了挫敗機(jī)器人糟糕的抓取算法,而是為了開發(fā)工具,幫助機(jī)器人提高抓取物體的能力,并希望它們能可靠地在現(xiàn)實(shí)世界中工作。
機(jī)器人系統(tǒng)在規(guī)劃抓取方式時(shí),通常會(huì)尋找光滑的相對(duì)平面,這些表面對(duì)它來(lái)說(shuō)是容易捏合的。
但由于研究人員設(shè)計(jì)的對(duì)抗立方體和真實(shí)立方體之間的差異很小,難以被3D傳感器捕捉到,因此大多數(shù)機(jī)器人系統(tǒng)會(huì)將抓取任務(wù)判斷得很容易,結(jié)果卻以立方體扭曲并脫離機(jī)器人的控制而失敗。
當(dāng)研究人員在真實(shí)世界中進(jìn)行初步測(cè)試時(shí),會(huì)嘗試用兩個(gè)部件套在手指形成的兩邊平行的夾鉗去夾取這個(gè)“對(duì)抗性”物體。
在每一種測(cè)試情況中,機(jī)器人系統(tǒng)在計(jì)算抓取成功率時(shí)都預(yù)測(cè)會(huì)100%成功,然而對(duì)抗立方體和立方十面體的實(shí)際成功率僅為13%。
研究人員表示,他們將計(jì)劃用不同類型的抓取工具和吸力抓具來(lái)測(cè)試這些物體,試圖找到最具對(duì)抗性的對(duì)抗物體。
結(jié)語(yǔ):嘗試提高機(jī)器人更好服務(wù)人類的能力
加州大學(xué)伯克利分校的研究人員利用對(duì)抗物體,來(lái)幫助計(jì)算機(jī)視覺算法提高性能的這項(xiàng)研究雖然還未成熟,但也為研究人員進(jìn)一步加強(qiáng)機(jī)器人抓取能力的方式提供了有意義的參考。
在未來(lái),如果機(jī)器人能真正完美解決對(duì)抗物體的抓取問(wèn)題,也許能更好地應(yīng)用到人們的社會(huì)生活和生產(chǎn)的真正實(shí)踐中,給人們帶來(lái)更多的便利。
轉(zhuǎn)載請(qǐng)注明出處。