技術(shù)
導(dǎo)讀:麻省理工學(xué)院的研究人員此前展示了一種結(jié)合了視覺(jué)信息和射頻(RF)信號(hào)的機(jī)械臂,它可以找到帶有RFID標(biāo)簽(這種標(biāo)簽反射天線發(fā)出的信號(hào))的隱藏物體。
對(duì)于人類(lèi)來(lái)說(shuō),找到埋在一堆東西下面的丟失的錢(qián)包是非常簡(jiǎn)單的,因?yàn)槲覀冎恍枰獜哪嵌褨|西中取出東西,直到找到錢(qián)包就可以了。但對(duì)于一個(gè)機(jī)器人來(lái)說(shuō),這項(xiàng)任務(wù)需要對(duì)其中的堆和物體進(jìn)行復(fù)雜的推理,這是一個(gè)嚴(yán)峻的挑戰(zhàn)。
麻省理工學(xué)院的研究人員此前展示了一種結(jié)合了視覺(jué)信息和射頻(RF)信號(hào)的機(jī)械臂,它可以找到帶有RFID標(biāo)簽(這種標(biāo)簽反射天線發(fā)出的信號(hào))的隱藏物體。在這項(xiàng)工作的基礎(chǔ)上,他們現(xiàn)在開(kāi)發(fā)了一種新的系統(tǒng),可以有效地檢索埋在堆里的任何物體,只要堆中的一些物品有RFID標(biāo)簽,目標(biāo)物品不需要被標(biāo)記,系統(tǒng)就可以恢復(fù)它。
該系統(tǒng)背后的算法被稱(chēng)為FuseBot,可以判斷堆下物體的可能位置和方向。然后FuseBot找到最有效的方法移除障礙物,提取目標(biāo)物品。這種推理使FuseBot比最先進(jìn)的機(jī)器人系統(tǒng)找到更多的隱藏物品,時(shí)間并能縮短了一半。
這種速度在電子商務(wù)倉(cāng)庫(kù)中尤其有用,一個(gè)負(fù)責(zé)處理回報(bào)的機(jī)器人可以通過(guò)FuseBot系統(tǒng)更有效地在未分類(lèi)的堆中找到物品,電子工程與計(jì)算機(jī)科學(xué)系副教授、媒體實(shí)驗(yàn)室信號(hào)動(dòng)力學(xué)小組主任Fadel Adib說(shuō)。
“這篇論文首次表明,環(huán)境中僅存在帶有 RFID 標(biāo)簽的物品就可以讓您更輕松地以更有效的方式完成其他任務(wù),我們能夠做到這一點(diǎn)是因?yàn)槲覀冊(cè)谙到y(tǒng)中添加了多模態(tài)推理,F(xiàn)useBot可以通過(guò)視覺(jué)和射頻推理來(lái)理解一堆物品?!盇dib補(bǔ)充道。
與Adib一起發(fā)表這篇論文的還有研究助理Tara Boroushaki,她是論文的第一作者,還有Laura Dodds和Nazish Naeem,該研究將在機(jī)器人:科學(xué)與系統(tǒng)會(huì)議上發(fā)表。
定位標(biāo)簽
最近的一份市場(chǎng)報(bào)告顯示,超過(guò)90%的美國(guó)零售商現(xiàn)在使用RFID標(biāo)簽,但這項(xiàng)技術(shù)并不普遍,在一堆物品中只有部分物品被貼上標(biāo)簽。
這個(gè)問(wèn)題啟發(fā)了這個(gè)小組的研究。在FuseBot中,機(jī)械臂使用一個(gè)附加的攝像機(jī)和射頻天線從混合堆中檢索未標(biāo)記的目標(biāo)物品。該系統(tǒng)用攝像頭掃描樁,創(chuàng)建環(huán)境的3D模型。同時(shí),它從天線發(fā)送信號(hào)來(lái)定位RFID標(biāo)簽。這些無(wú)線電波可以穿過(guò)大多數(shù)固體表面,因此機(jī)器人可以“看到”堆的深處。由于目標(biāo)物品沒(méi)有標(biāo)記,F(xiàn)useBot知道該物品不能與RFID標(biāo)簽位于完全相同的位置。
算法融合這些信息來(lái)更新環(huán)境的3D模型,并突出目標(biāo)物品的潛在位置,機(jī)器人知道自己的大小和形狀,然后系統(tǒng)根據(jù)堆中物品的位置和RFID標(biāo)簽的位置來(lái)確定需要移除的物品,以最少的移動(dòng)找到目標(biāo)物品。
Boroushaki說(shuō),將這種推理納入系統(tǒng)是具有挑戰(zhàn)性的。
機(jī)器人不知道堆下的物體是如何定位的,也不知道一個(gè)黏糊糊的物體會(huì)如何被更重的物體壓變形,它通過(guò)概率推理克服了這一挑戰(zhàn),利用它所知道的物體的大小和形狀以及它的RFID標(biāo)簽位置來(lái)建模該物體可能占據(jù)的3D空間。
當(dāng)它刪除條目時(shí),它也會(huì)使用推理來(lái)決定接下來(lái)刪除哪個(gè)條目是“最好的”。
Boroushaki說(shuō):“如果我給一個(gè)人一堆東西去搜索,他們很可能會(huì)先把最大的東西拿掉,看看下面有什么。機(jī)器人所做的事情與此類(lèi)似,但它還融入了RFID信息,以做出更明智的決定。如果它從表面上移除這個(gè)東西,它會(huì)對(duì)這堆東西了解多少?’”
在移除一個(gè)物體后,機(jī)器人會(huì)再次掃描這個(gè)堆,并利用新的信息來(lái)優(yōu)化它的策略。
檢索結(jié)果
這種推理以及它對(duì)射頻信號(hào)的使用,讓FuseBot比只使用視覺(jué)的最先進(jìn)的系統(tǒng)更有優(yōu)勢(shì)。該團(tuán)隊(duì)使用真正的機(jī)械臂進(jìn)行了180多次實(shí)驗(yàn),并放置了辦公用品、填充動(dòng)物和服裝等家庭用品,他們改變了每一堆物品的大小和有射頻識(shí)別標(biāo)簽的數(shù)量。
FuseBot系統(tǒng)提取目標(biāo)物品的成功率為95%,而其他機(jī)器人系統(tǒng)的成功率為84%。它通過(guò)減少40%的移動(dòng)完成了這一點(diǎn),并且能夠以兩倍多的速度找到和檢索目標(biāo)物品。
Dodds說(shuō):“我們看到,通過(guò)結(jié)合這種射頻信息,成功率有了很大提高。令人興奮的是,我們能夠匹配我們之前的系統(tǒng)的性能,并在目標(biāo)物品沒(méi)有RFID標(biāo)簽的情況下超過(guò)它?!?/p>
Boroushaki補(bǔ)充說(shuō),F(xiàn)useBot可以應(yīng)用于各種環(huán)境,因?yàn)閳?zhí)行復(fù)雜推理的軟件可以在任何計(jì)算機(jī)上實(shí)現(xiàn),它只需要與帶有攝像頭和天線的機(jī)械臂通信。
在不久的將來(lái),研究人員計(jì)劃在FuseBot中加入更復(fù)雜的模型,使其在可變形物體上表現(xiàn)更好。除此之外,他們還對(duì)探索不同的操作方式感興趣,比如用機(jī)械臂將物品推開(kāi)。該系統(tǒng)的未來(lái)迭代還可以用于移動(dòng)機(jī)器人,在多個(gè)堆中尋找丟失的物體。