基于RoboCup多智能體系統(tǒng)學(xué)習(xí)與協(xié)作問(wèn)題的研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-11 格式：pdf 頁(yè)數(shù)：64 大?。?.32MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

基于RoboCup多智能體系統(tǒng)學(xué)習(xí)與協(xié)作問(wèn)題的研究.pdf_第1頁(yè)

已閱讀1頁(yè)，還剩63頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著計(jì)算機(jī)技術(shù)的發(fā)展，分布式人工智能中多智能體系統(tǒng)(MAS：Multi—agemSystem)的理論及應(yīng)用研究已經(jīng)成為人工智能研究的熱點(diǎn)。RoboCup(RobotWorldCup)即機(jī)器人世界杯足球錦標(biāo)賽，是一種典型的多智能體系統(tǒng)。該系統(tǒng)具有動(dòng)態(tài)環(huán)境、多個(gè)智能體之間合作與競(jìng)爭(zhēng)并存、受限的通訊帶寬以及系統(tǒng)設(shè)置的隨機(jī)噪聲等特點(diǎn)。通過(guò)該系統(tǒng)這個(gè)具有普遍意義的試驗(yàn)平臺(tái)，可以深入研究和評(píng)價(jià)多智能體系統(tǒng)中的各種理論和算法，并將結(jié)果推廣到眾多領(lǐng)域。

2、本文的主要研究工作如下： 1)針對(duì)RoboCup中Agent決策任務(wù)的復(fù)雜性特點(diǎn)，設(shè)計(jì)了基于分層學(xué)習(xí)的決策框架。該決策框架將Agent的決策任務(wù)按高級(jí)到低級(jí)分為多個(gè)層次，每層的決策通過(guò)相應(yīng)機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)，并以下一層的學(xué)習(xí)結(jié)果為基礎(chǔ)。而針對(duì)層結(jié)構(gòu)的誤差積累問(wèn)題，采取了一種改進(jìn)的層結(jié)構(gòu)，加入了一個(gè)協(xié)調(diào)層，用于對(duì)決策信息進(jìn)行評(píng)價(jià)，并對(duì)明顯錯(cuò)誤的信息進(jìn)行更正。 2)為了提高Agent個(gè)體技術(shù)的智能性，采用遺傳神經(jīng)網(wǎng)絡(luò)

3、技術(shù)進(jìn)行離線訓(xùn)練，實(shí)現(xiàn)了Agent的截球技術(shù)。實(shí)驗(yàn)表明，該技術(shù)較好地解決了噪聲所造成的干撓影響。而對(duì)于智能體的踢球技術(shù)，則采用Q學(xué)習(xí)進(jìn)行離線訓(xùn)練。 3)針對(duì)Agent團(tuán)隊(duì)協(xié)作的進(jìn)攻決策學(xué)習(xí)問(wèn)題，對(duì)單Agent的Q學(xué)習(xí)算法進(jìn)行了擴(kuò)展。主要思想是引入學(xué)習(xí)智能體，同時(shí)，將統(tǒng)計(jì)學(xué)習(xí)與增強(qiáng)學(xué)習(xí)相結(jié)合，通過(guò)對(duì)智能體間聯(lián)合動(dòng)作的統(tǒng)計(jì)來(lái)學(xué)習(xí)其它智能體的行為決策。本文的相關(guān)實(shí)驗(yàn)在RoboCup仿真比賽環(huán)境下進(jìn)行，實(shí)驗(yàn)結(jié)果證明采用本文的學(xué)

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于RoboCup多智能體系統(tǒng)學(xué)習(xí)與協(xié)作問(wèn)題的研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于RoboCup多智能體系統(tǒng)學(xué)習(xí)與協(xié)作問(wèn)題的研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載