美國(guó)加州理工學(xué)院科研團(tuán)隊(duì)開(kāi)發(fā)了一種名為光譜擴(kuò)展樹(shù)搜索(SETS)的算法。該算法旨在幫助自主機(jī)器人在現(xiàn)實(shí)世界中導(dǎo)航時(shí)選擇理想路徑,并作出最佳決策和行動(dòng)。這一創(chuàng)新成果近期刊登于《科學(xué)·機(jī)器人學(xué)》雜志封面。
想象一下,如果給機(jī)器人玩一個(gè)復(fù)雜的游戲,游戲的目標(biāo)是找到一條安全且高效的路徑到達(dá)目的地。SETS算法就像是機(jī)器人的“游戲策略師”,通過(guò)模擬大量可能的動(dòng)作來(lái)規(guī)劃最理想的移動(dòng)路線。與傳統(tǒng)方法不同的是,SETS能夠快速識(shí)別那些最具潛力的動(dòng)作組合,避免了不必要的計(jì)算。
這種算法借鑒了蒙特卡洛樹(shù)搜索的概念,這是一種隨機(jī)選擇路徑進(jìn)行探索的技術(shù),最初用于棋類游戲的人工智能系統(tǒng)。在機(jī)器人導(dǎo)航中,蒙特卡洛樹(shù)搜索創(chuàng)建了一個(gè)分支結(jié)構(gòu),用來(lái)表示從當(dāng)前位置到目標(biāo)位置的不同可能性。然而,隨著每一步動(dòng)作的選擇,潛在路徑的數(shù)量會(huì)呈指數(shù)增長(zhǎng),這使得全面評(píng)估所有選項(xiàng)變得不切實(shí)際。
為了解決這個(gè)問(wèn)題,SETS采用了所謂的“探索/利用”權(quán)衡原則。例如,當(dāng)機(jī)器人檢測(cè)到某些動(dòng)作可能會(huì)導(dǎo)致碰撞時(shí),它就不會(huì)繼續(xù)考慮這些動(dòng)作的后續(xù)步驟,而是專注于更安全的選擇。這種方法大大減少了計(jì)算量,并允許機(jī)器人幾乎實(shí)時(shí)地處理信息并作出反應(yīng)。
SETS的強(qiáng)大之處在于它的通用性,即可以適用于各種類型的機(jī)器人平臺(tái),而無(wú)需單獨(dú)編程。團(tuán)隊(duì)已經(jīng)證明了該算法在三個(gè)不同實(shí)驗(yàn)環(huán)境中的有效性。
SETS算法讓機(jī)器人能夠在大約十分之一秒內(nèi)完成數(shù)千甚至數(shù)萬(wàn)次模擬,迅速?zèng)Q定下一步的最佳行動(dòng)。這個(gè)過(guò)程不斷循環(huán),使機(jī)器人每秒鐘都能根據(jù)最新的情況調(diào)整自己的行為。這項(xiàng)技術(shù)的進(jìn)步意味著未來(lái)機(jī)器人將更加智能、靈活,并能在動(dòng)態(tài)環(huán)境中迅速應(yīng)對(duì)變化。(記者張夢(mèng)然)