版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1,浙江大學(xué)計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件,第13講 智能Agent及多Agent系統(tǒng)Chapter 13 Intelligent Agent & Multi-Agent Systems徐從富浙江大學(xué)人工智能研究所2003年第一稿2005年10月修改補(bǔ)充2007年10月第二次修改,2,內(nèi)容,,概述2. 分布式問題求解3. Agent4. Agent理論5. Agent結(jié)構(gòu)6. Agen
2、t通信7. Agent的協(xié)調(diào)與協(xié)作8. 多Agent環(huán)境MAGE9. 面向Agent的軟件技術(shù) Mobile Agent 若干前沿問題討論,3,13.1 概述,,分布式人工智能(DAI)主要研究在邏輯上或物理上分散的智能系統(tǒng)如何并行的、相互協(xié)作地實(shí)現(xiàn)問題求解。 兩種解決問題的方法:自頂向下:分布式問題求解自底向上:基于Agent的方法,4,DAI系統(tǒng)的特色,,系統(tǒng)中的數(shù)據(jù)、知識(shí), 以及控制不但在邏輯上,
3、 而且在物理上是分布的, 既沒有全局控制, 也沒有全局的數(shù)據(jù)存儲(chǔ)。各個(gè)求解機(jī)構(gòu)由計(jì)算機(jī)網(wǎng)絡(luò)互連, 在問題求解過程中, 通信代價(jià)要比求解問題的代價(jià)低得多。系統(tǒng)中諸機(jī)構(gòu)能夠相互協(xié)作, 來求解單個(gè)機(jī)構(gòu)難以解決, 甚至不能解決的任務(wù)。,5,DAI系統(tǒng)的主要優(yōu)點(diǎn),,提高問題求解能力提高問題求解效率擴(kuò)大應(yīng)用范圍降低軟件的復(fù)雜性,6,13.2 分布式問題求解,,特點(diǎn):數(shù)據(jù)、知識(shí)、控制均分布在系統(tǒng)的各節(jié)點(diǎn)上,既無全局控制,也無全局?jǐn)?shù)據(jù)
4、和知識(shí)存儲(chǔ)。兩種協(xié)作方式: 任務(wù)分擔(dān) 結(jié)果共享,7,13.2.1 分布式問題求解系統(tǒng)分類,,根據(jù)組織結(jié)構(gòu),分布式問題求解系統(tǒng)可以分為三類: 層次結(jié)構(gòu)類 平行結(jié)構(gòu)類 混合結(jié)構(gòu)類,8,13.2.2 分布式問題求解過程,,分布式問題求解過程可以分為四步: 任務(wù)分解 任務(wù)分配 子問題求解 結(jié)果綜合,9,分布式問題求解系統(tǒng)中協(xié)作的分類,,按節(jié)點(diǎn)間協(xié)作量的多少,協(xié)作分為三類: 全協(xié)作系統(tǒng) 無協(xié)作系統(tǒng) 半?yún)f(xié)作系統(tǒng)常用
5、的通信方式有: 共享全局存儲(chǔ)器 信息傳遞 黑板模型,10,13.3 智能Agent及多Agent系統(tǒng),,多Agent系統(tǒng)主要研究在邏輯上或物理上分離的多個(gè)Agent協(xié)調(diào)其智能行為,即知識(shí)、目標(biāo)、意圖及規(guī)劃等,實(shí)現(xiàn)問題求解??梢钥醋魇且环N由底向上設(shè)計(jì)的系統(tǒng)。,11,Agent的思想,,智能Agent的幾個(gè)典型的實(shí)例:Microsoft的Office助手計(jì)算機(jī)病毒(破壞Agent)計(jì)算機(jī)游戲或模擬中的智能角色貿(mào)易和談判Age
6、nt(如Ebay的拍賣Agent)網(wǎng)絡(luò)蜘蛛Web Spider(搜索引擎中的數(shù)據(jù)搜集和索引Agent,如Google),12,Agent概念的出現(xiàn),,面向過程的方法,面向?qū)嶓w的方法,面向?qū)ο蟮姆椒?面向Agent的方法,,,,軟件開發(fā)方法的進(jìn)化,13,Agent的定義,,在計(jì)算機(jī)和人工智能領(lǐng)域中,Agent可以看作是一個(gè)實(shí)體,它通過傳感器感知環(huán)境,通過效應(yīng)器作用于環(huán)境。,14,Agent的強(qiáng)定義,,基于某種場景,并具有靈活、自主的行為
7、能力,以滿足設(shè)計(jì)目標(biāo)的計(jì)算機(jī)系統(tǒng)。,15,Agent的弱定義,,滿足如下特征的基于硬件或(更經(jīng)常是)軟件的計(jì)算機(jī)系統(tǒng):?自主性(Autonomy)?社會(huì)性(Social ability)?反應(yīng)性(Reactivity)?主動(dòng)性(Pro-activeness)(或稱“前 瞻性”)?基于場景性(Situatedness)?靈活性(Flexibility),16,?移動(dòng)性(Mobility)?理性(Rationality)此
8、外,許多學(xué)者還提出一些其它特性:?誠實(shí)性(Veracity)?友好性(Benevolence)?長壽性(或時(shí)間連貫性) ?自適應(yīng)性(Adaptability),17,Agent的特性,,Agent弱概念:自治性、社會(huì)能力(可通信性)、反應(yīng)能力、自發(fā)行為Agent強(qiáng)概念:知識(shí)、信念、意圖、承諾等心智狀態(tài)其它屬性:長壽性、移動(dòng)性、推理能力、規(guī)劃能力、學(xué)習(xí)和適應(yīng)能力、誠實(shí)、善意、理性,18,13.4 Agent理論,,智能
9、Agent的理論模型研究主要從邏輯、行為、心理、社會(huì)等角度出發(fā),對智能Agent的本質(zhì)進(jìn)行描述,為智能Agent系統(tǒng)創(chuàng)建奠定基礎(chǔ)。,19,可能世界模型(Possible Worlds Model),,地位:Agent理論基礎(chǔ)的開創(chuàng)性工作之一。思想:將Agent的知識(shí)、信念等特征化為一 系列“可能世界”,在可能世界模型中包括對象、屬性及其關(guān)系。優(yōu)點(diǎn):理論基礎(chǔ)(特別是模態(tài)邏輯)比較完善。缺點(diǎn):存在“邏輯萬能”(Logical Omnis
10、cience)問題。,20,“意圖系統(tǒng)”(Intentional System),,作用:用于描述其行為可用信念、愿望等理性智慧來預(yù)測的實(shí)體。分為:一階和二階兩種形式。對象、屬性及其關(guān)系。,21,“意圖姿態(tài)”(Intentional Stance),,意義:啟發(fā)AI學(xué)者將信念(Belief)、愿望(Desire)、承諾(Commitment)等人類特有的思想和概念應(yīng)用于Agent。,22,13.4.1 理性Agent(BDI模型),,
11、思想:認(rèn)為Agent行為可由信念、愿望和意圖來表達(dá)作用:已成為經(jīng)典模型,并被廣泛采用Belief——信念,Agent對環(huán)境的基本看法。Desire——愿望,Agent想要實(shí)現(xiàn)的狀態(tài),即目標(biāo)。Intention——意圖,目標(biāo)的子集。,23,13.4.2 BDIAgent模型,,BDIAgent模型可以通過下列要素描述:一組關(guān)于世界的信念;Agent當(dāng)前打算達(dá)到的一組目標(biāo);一個(gè)規(guī)劃庫,描述怎樣達(dá)到目標(biāo)和怎樣改變信念;一個(gè)
12、意圖結(jié)構(gòu),描述Agent當(dāng)前怎樣達(dá)到它的目標(biāo)和改變信念。,24,BDI解釋器,,BDI-Interpreterinitialize-state();dooptions := option-generator(event-queue, B, G, I);selected-options := deliberate(options, B, G, I);update-intentions(selected-options, I
13、);execute(I);get-new-external-events();drop-successful-attitudes(B,G,I);drop-impossible-attitudes(B,G,I);until quit,25,13.4.3 RAO邏輯框架,,目標(biāo):以一種自然的方式描述多Agent系統(tǒng)中關(guān)于別的Agent的狀態(tài)的推理過程。系統(tǒng)的分類:由于多Agent系統(tǒng)太復(fù)雜,建立一種通用的推理模式的想法
14、是不現(xiàn)實(shí)的,有必要對系統(tǒng)分類以便區(qū)別對待。常識(shí)的獲得:和單個(gè)Agent情形一樣,常識(shí)問題是阻礙推理的大難題。,26,13.4.4 換位推理,,思想:模仿語言學(xué)中的虛擬語氣,即為了對某個(gè)Agent在某種場景下的狀態(tài)或行為進(jìn)行推測,設(shè)想自己處于那種場景時(shí)的狀態(tài)或行為,再把這種設(shè)想結(jié)果作為被猜測Agent的狀態(tài)或行為。作用:使得一Agent對其它Agent的狀態(tài)和行為的推理過程變得簡單明了。,27,13.4.5 動(dòng)作理論,,情景演算是
15、描述動(dòng)作的主要的形式框架。 在情景演算中引入了狀態(tài)和動(dòng)作的概念,并利用兩條邏輯公理來描述動(dòng)作與狀態(tài)的關(guān)系。一條公理描述一個(gè)動(dòng)作在滿足什么條件的狀態(tài)之下可能發(fā)生,另外一條描述在一個(gè)狀態(tài)之下某個(gè)動(dòng)作發(fā)生以后當(dāng)前狀態(tài)如何改變。,28,13.4.6 “言語行為”理論(Speech Acts Theory),,地位:這是多Agent交互(通信)的重要理論基礎(chǔ)之一。 思想:任何行為都可以等價(jià)地表示為言語行為(既任何行為的含義都可用言語來表
16、達(dá)),甚至認(rèn)為所有的行為都是言語行為。作用:大大簡化了Agent之間交互的復(fù)雜度。,29,規(guī)劃庫的形式化表示,,環(huán)境狀態(tài): State = { P1, P2, … Pn }目標(biāo): Goal=動(dòng)作模板: Act_template = Agent能力: Ability=,30,13.5 Agent結(jié)構(gòu),,Agent結(jié)構(gòu)需要解決的問題包括:Agent由那些模塊組成,模塊之間如何交互信息,Agent感知到
17、的信息如何影響它的行為和內(nèi)部狀態(tài),如何將這些模塊用軟件或硬件的方式組合起來形成一個(gè)有機(jī)的整體。,31,Agent基本結(jié)構(gòu),,環(huán)境,Agent,,,感知,作用,黑箱軟件Agent,32,智能Agent的工作過程,,環(huán)境,交互,信息融合,信息處理,作用,交互,,,,,,,,感知,作用,33,Agent骨架程序,,function Skeleton-Agent(percept) return action static: memory
18、 /* Agent的世界記憶 */ memory ← Update- Memory(memory,percept) action ← Choose-Best-Action(memory) memory ← Update-Memory(memory,action) return action,34,Agent的分類,,根據(jù)人類思維的層次模型,可以將Agent分成四類:反應(yīng)Agent形象思維Agent抽象思維Agent復(fù)
19、合式Agent 形象思維Agent和抽象思維Agent也可以合稱為認(rèn)知Agent,35,13.5.1 反應(yīng)Agent,,,環(huán)境,當(dāng)前世界,傳感器,動(dòng) 作,,,,,,效應(yīng)器,條件-動(dòng)作規(guī)則,,Agent,36,反應(yīng)Agent程序,,function Reactive-Agent(percept) returns action static: rules, /* 一組條件-動(dòng)作規(guī)則 */ sta
20、te ← Interpret-Input(percept) rule ← Rule-Match(state,rules) action ← Rule-Action[rule] return action,37,13.5.2 認(rèn)知Agent,,,環(huán)境,信息融合,傳感器,動(dòng) 作,,,,,,效應(yīng)器,,Agent,規(guī) 劃,,知識(shí)庫,,目標(biāo),,內(nèi)部狀態(tài),38,認(rèn)知Agent程序,,function Cog
21、nitive-Agent(percept) returns actionstatic: environment, /* 描述當(dāng)前世界環(huán)境 */ kb, /* 知識(shí)庫 */ environment ← Update-World-Model(environment,percept) state ← Update-Mental-State(environment,state) action ← Decis
22、ion-Making(state,kb) environment ← Update-World-Model(environment,action) return action,39,BDI結(jié)構(gòu),,知識(shí),信念,規(guī)劃,意 圖,,,目 標(biāo),愿 望,,,,,,,,40,13.5.3 復(fù)合式Agent,,決策生成,規(guī) 劃,反 射,建 模,通 信,感 知,行 動(dòng)
23、,其他智能Agent,,,,,,,,,,,,智能Agent,外部世界,預(yù)測,協(xié)作與協(xié)商,動(dòng)作,請求或應(yīng)答信息,一般情況,緊急情況和簡單情況,,41,規(guī)劃模塊,,世界的模型(包括其他 Agent的模型),經(jīng) 驗(yàn) 庫,目標(biāo)集合,局 部 規(guī) 劃 器,決 策 生 成,,,,,,,,重新規(guī)劃,規(guī)劃,規(guī)劃,目標(biāo),42,建模模塊,,世界的模型(包括其他 Agent的模型),模 型 庫,模 型 生 成
24、 和 維 護(hù),預(yù) 測,規(guī)劃,決策生成,感 知,通 信,,,,,,,,,,建模,43,通信模塊,,詞 法 庫,語 法 庫,詞 義 庫,物理通信,語言生成,語言理解,,,,,,,,,,,,,通信,44,13.6 Agent通信,,策 略,對 話,消 息,黑 板,協(xié) 議,通信,協(xié)作,協(xié) 議,,45,Agent通信中的主要問題,,語義:全部有關(guān)的Agent必須知道通信語言的
25、語義,消息的語義內(nèi)容知識(shí)是分布式問題求解的核心部分。言語行為:通信語言也是一種動(dòng)作,說話是為了使世界的狀態(tài)發(fā)生改變。交互協(xié)議:Agent之間消息交換的典型模式通信語言:傳遞消息的標(biāo)準(zhǔn)語法。Foundation for Intelligent Physical Agents http://www.fipa.org,46,Agent間的消息傳遞,,消息發(fā)送/傳輸服務(wù)器,轉(zhuǎn)換到傳輸格式,從傳輸格式轉(zhuǎn)換,消息M,言語行為,意圖I,目標(biāo)
26、G,Agent i,,,,,,消息M,Agent j,,,,47,本體論(Ontology),,本體論是概念化的明確的表示和描述。對某一領(lǐng)域中的概念有共同理解,可以提高交流和協(xié)作的效率,從而提高了軟件的重用性。,48,言語行為,,有關(guān)言語行為理論的研究主要集中在如何劃分不同類型的言語行為。在Agent通信語言的研究中,言語行為理論主要用來考慮Agent之間可以交互的信息類型。,49,FIPA通信動(dòng)作庫,,Accept Propos
27、al接受提議Agree同意Cancel取消Call for Proposal要求提議Confirm確認(rèn)Disconfirm確認(rèn)為否定Failure失敗Inform通知Inform If通知 是否Inform Ref通知 有關(guān)對象Not Understood不理解,50,Propagate傳播Propose提議Proxy代理Query If詢問 是否
28、Query Ref詢問 有關(guān)對象Refuse拒絕(請求)Reject Proposal拒絕提議Request請求Request When請求 某個(gè)條件下執(zhí)行Request Whenever請求 一旦某個(gè)條件成立就執(zhí)行Subscribe預(yù)定詳細(xì)說明:http://www.fipa.org/repository/cas.html,51,交互協(xié)議,,Agent之間的會(huì)話常常形成典型模式,這種情況下
29、某些消息序列是可知的,這些消息交換的典型模式稱為協(xié)議。Agent間交互的理想情況:Agent充分地理解消息的含意和意圖,然后根據(jù)自身的信念、目標(biāo)等心智狀態(tài),做出相應(yīng)的回答比較實(shí)際的實(shí)現(xiàn):預(yù)先規(guī)范這些協(xié)議,規(guī)定好消息的順序。,52,FIPA 英國拍賣協(xié)議,53,通信語言,,KQML:由美國ARPA的知識(shí)共享計(jì)劃中提出,規(guī)定了消息格式和消息傳送系統(tǒng),為多Agent系統(tǒng)通信和協(xié)商提供了一種通用框架。ACL:由FIPA制定的一種規(guī)范。與K
30、QML非常相似,54,KQML,,一個(gè)例子:(ask-all: senderA: receiverB: in-reply-toido: reply-withidl: languageProlog: ontologyfoo: content“bar (X, Y)”),55,FIPA ACL,,(inform: sender agent1: receiver
31、 hpl-auction-server: content (price (bid good02) 150): in-reply-to round-4: reply-with bid04: language s1: ontology hpl-auction),消息結(jié)構(gòu)開始,,通信動(dòng)作類型,,消息參數(shù),,消息內(nèi)容表達(dá)式,,參數(shù)表達(dá)式,,56,XML—eXtensible Markup Language
32、 可擴(kuò)展標(biāo)記語言,,XML是用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語言。XML文件本身只是將文件資料結(jié)構(gòu)化。例如:下面的ACL消息(inform:sender jklabrou:receiver grosof:content (CPU libretto50 pentium):ontology laptop:language kif),57,轉(zhuǎn)換為XML格式后如下:
33、informjklabrougrosof,58,laptop(CPU libretto50 pentium)kif,59,13.7Agent的協(xié)調(diào)與協(xié)作,,協(xié)調(diào)(coordination)與協(xié)作(cooperation)是多Agent研究的核心問題之一。協(xié)調(diào)是指一組智能Agent完成一些集體活動(dòng)時(shí)相
34、互作用的性質(zhì)。協(xié)作是非對抗的Agent之間保持行為協(xié)調(diào)的一個(gè)特例。,60,協(xié)調(diào),,多Agent系統(tǒng)中的協(xié)調(diào)是指多個(gè)Agent為了以一致、和諧的方式工作而進(jìn)行交互的過程。進(jìn)行協(xié)調(diào)是希望避免Agent之間的死鎖或活鎖。死鎖指多個(gè)Agent無法進(jìn)行各自的下一步動(dòng)作;活鎖指多個(gè)Agent不斷工作卻無任何進(jìn)展。,61,協(xié)作,,目前針對Agent協(xié)作的研究大體上可分為兩類:將其它領(lǐng)域研究多實(shí)體行為的方法和技術(shù)用于Agent協(xié)作的研究。如對策
35、論和力學(xué)研究。從Agent的目標(biāo)、意圖、規(guī)劃等心智態(tài)度出發(fā)來研究多Agent間的協(xié)作。,62,協(xié)作規(guī)劃,,協(xié)作的動(dòng)機(jī):某個(gè)Agent相信通過協(xié)作能帶來好處(如提高效率,完成以往單獨(dú)無法完成的任務(wù))多個(gè)Agent在交流的過程中,發(fā)現(xiàn)它們能夠通過協(xié)作來實(shí)現(xiàn)更大的目標(biāo)。,63,協(xié)作過程,,產(chǎn)生需求、確定目標(biāo)協(xié)作規(guī)劃、求解協(xié)作結(jié)構(gòu)尋求協(xié)作伙伴選擇協(xié)作方案實(shí)現(xiàn)目標(biāo)評(píng)估結(jié)果,64,13.8 多Agent環(huán)境MAGE,,MAGE的主
36、要特點(diǎn): 運(yùn)行于分布式網(wǎng)絡(luò)環(huán)境用java編寫使用模塊化的能力通過ADL來描述并生成AgentAgent之間通過ACL通信,65,13.9 面向Agent的軟件技術(shù),,在面向Agent的軟件開發(fā)方法中,應(yīng)用程序編寫為軟件Agent,這些Agent之間通過Agent通信語言可以進(jìn)行比普通消息傳遞更規(guī)范、更明確的通訊。,66,Agent與對象的異同,,共同點(diǎn):都具有封裝性、繼承性和多態(tài)性。對象的內(nèi)部狀態(tài)映射為Agent的心智狀
37、態(tài)?;ゲ僮鳌2煌c(diǎn):Agent具有自治性,對象只能被動(dòng)的被調(diào)用。Agent之間交互使用通信語言,對象之間交互是通過互相調(diào)用方法。,67,AO與OO,,,對象是對現(xiàn)實(shí)世界中的被動(dòng)實(shí)體的抽象,Agent是對主動(dòng)實(shí)體的很好的抽象。Agent支持用于表示智能的結(jié)構(gòu),如信念、承諾等。Agent支持基于言語行為理論的高級(jí)交互,不同于對象之間頻繁的消息發(fā)送和接收。對象是通過外部來進(jìn)行控制的(白箱控制),相反,Agent有自治性,不能直接
38、從外部進(jìn)行控制(黑箱控制)。,68,主要的基于Agent的方法,,Gaia方法:Wooldridge,Jennings和Kinny在1999年提出了面向Agent分析與設(shè)計(jì)的Gaia方法學(xué)。 多Agent工程方法學(xué):Wood和DeLoach提出了多Agent工程方法學(xué)MaSE。 AUML: Odell等人提出了對UML語言的擴(kuò)充——AgentUML語言AUML語言。,69,Gaia方法,,,Gaia是一種同時(shí)支持微觀級(jí)(Agent結(jié)
39、構(gòu))和宏觀級(jí)(Agent社會(huì)與組織結(jié)構(gòu))的Agent開發(fā)的一般方法。分析過程第一步是找到系統(tǒng)中的角色,第二步是對角色之間的交互進(jìn)行建模。每個(gè)角色包含四個(gè)屬性:責(zé)任、許可、活動(dòng)和協(xié)議設(shè)計(jì)階段第一步是把角色映射到一定的Agent類型,然后對不同的Agent類型創(chuàng)建適當(dāng)?shù)腁gent實(shí)例;第二步是確定一個(gè)和多個(gè)Agent中角色所需要的服務(wù)模塊;最后一步是為Agent之間的通信表示建立熟人模塊。,70,MaSE,,MaSE在一般性及
40、應(yīng)用領(lǐng)域上類似于Gaia,MaSE的目的是引導(dǎo)設(shè)計(jì)者怎樣從初始的系統(tǒng)規(guī)范說明到Agent系統(tǒng)的實(shí)現(xiàn)。 MaSE在邏輯上被分為七段流水線:捕獲目標(biāo)、應(yīng)用用例、精練角色、創(chuàng)建Agent類、構(gòu)造會(huì)話、編譯Agent類、系統(tǒng)設(shè)計(jì)。,71,AUML,,Odell、Parunak和Bauer提出了Agent交互協(xié)議AIP的三層表示方法。該方法不僅需要表達(dá)語義的修改,而且需要UML可視化語言的修改。AUML已經(jīng)被提交給UML標(biāo)準(zhǔn)委員會(huì),作為一個(gè)建
41、議包含在UML2.0中。,72,13.10 Mobile Agent,,l 節(jié)約網(wǎng)絡(luò)帶寬 移動(dòng)Agent直接在數(shù)據(jù)端執(zhí)行處理,與客戶端不需要進(jìn)行中間結(jié)果的傳輸,只返回最后的結(jié)果。 l 提供實(shí)時(shí)的遠(yuǎn)程交互 在一些遠(yuǎn)程控制系統(tǒng)中,如外太空探測器的控制、網(wǎng)絡(luò)的時(shí)延使得遠(yuǎn)程實(shí)時(shí)控制變得不可能,發(fā)送Mobile Agent實(shí)行遠(yuǎn)端的本地控制可解決該問題。,73,l
42、 支持離線計(jì)算 用戶派遣出Mobile Agent程序后,可以斷開網(wǎng)絡(luò)連接,而Agent將在網(wǎng)絡(luò)上自主運(yùn)行。Agent完成任務(wù)后,當(dāng)它發(fā)現(xiàn)用戶設(shè)備重新連上網(wǎng)絡(luò)時(shí),就返回計(jì)算結(jié)果。 l 實(shí)現(xiàn)載荷卸載 對于一些計(jì)算能力弱的設(shè)備,如個(gè)人數(shù)字助理,可以把計(jì)算打包成Agent程序,發(fā)送到計(jì)算能力強(qiáng)的設(shè)備上進(jìn)行計(jì)算。,74,l 提供定制化服務(wù) 使用Agent,客戶端可以根據(jù)服務(wù)器端提供的底層操作函數(shù),
43、編寫滿足自己特定需要的服務(wù)程序,然后發(fā)送到服務(wù)器端運(yùn)行。 l 易于分發(fā)服務(wù) 在采用Mobile Agent技術(shù)的分布式應(yīng)用中,服務(wù)的更改變得非常簡單,比如在電信網(wǎng)的管理中,當(dāng)業(yè)務(wù)需要改變時(shí),只需把新的服務(wù)程序發(fā)送到相應(yīng)的服務(wù)節(jié)點(diǎn)上,用不著人力去一個(gè)一個(gè)節(jié)點(diǎn)地安裝。,75,l 增加應(yīng)用的強(qiáng)壯性 移動(dòng)Agent的工作方式減少了應(yīng)用對網(wǎng)絡(luò)連接可靠性的要求,它的自主性又使它具備對環(huán)境的反應(yīng)能力,因此能建立更容錯(cuò)的分布系統(tǒng)
44、。 l 提供平臺(tái)無關(guān)性 移動(dòng)Agent是跨平臺(tái)運(yùn)行的。移動(dòng)代理應(yīng)用編程不存在程序的移植問題,便于應(yīng)用的快速開發(fā)。 l 提供更自然的電子商務(wù)模式 用移動(dòng)Agent代表用戶參與電子交易,買家可在網(wǎng)上自由尋找賣者,查詢商品種類,商談價(jià)格,賣家也可主動(dòng)上門向買家推薦商品。,76,13.11 若干前沿問題討論,當(dāng)前AI中存在的“鴻溝”解決“鴻溝”的主要思路完全自主Agent完全自主Agent的關(guān)鍵技術(shù)完全自主Age
45、nt的典型應(yīng)用,77,13.11.1 當(dāng)前AI中存在的“鴻溝”,Stuart J. Russell的觀點(diǎn)在1995年獲得IJCAI-95的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告《Rationality and Intelligence》 指出“AI是一個(gè)由其研究的問題而非方法所定義的領(lǐng)域?!保ā癆I is a field defined by its problems, not it
46、s methods.”—— Stuart J. Russell, 1995),78,當(dāng)前AI中存在的“鴻溝”(續(xù)1),當(dāng)前,AI中存在的最大問題是:如何填補(bǔ)基于抽象、非底層表示(Ungrounded representations)的高層推理(High-level reasoning)與建立底層表示(Grounded representations)的傳感數(shù)據(jù)解釋(Interpreting raw sensor data)之間的“鴻溝”
47、。,79,當(dāng)前AI中存在的“鴻溝”(續(xù)2),2001年,Stanford大學(xué)計(jì)算機(jī)系的年輕教授Daphne Koller在獲得IJCAI-01的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告 傳統(tǒng)AI中被廣泛采用的分析、分解方法正面臨著很大的挑戰(zhàn):在解決復(fù)雜問題時(shí),人們往往很自然地采用分而治之的方法,將其分解為每個(gè)“小片”(Fragmentation),等每個(gè)“小片”都取得進(jìn)展后,再進(jìn)行綜合集成
48、以得到最終的結(jié)果。但遺憾的是,往往每個(gè)子問題都各自分家且相互遠(yuǎn)離,而且是離得越來越遠(yuǎn),最后很難將它們綜合集成起來。,80,當(dāng)前AI中存在的“鴻溝”(續(xù)3),“In AI, as in many communities, we have the tendency to divide a problem into well-defined pieces, and make progress on each one. But as we ma
49、ke progress, the problems tend to move away from each other.” —— Daphne Koller, 2001,81,13.11.2 解決鴻溝的主要思路,Daphne Koller教授圍繞著如何解決上述問題(即填補(bǔ)高層推理與底層數(shù)據(jù)解釋之間的“鴻溝”),提出一種解決方法,就是建立連接的三座“概念橋梁”(Conceptual
50、 bridges),分別是:表示(Representation)推理(Reasoning)學(xué)習(xí)(Learning),82,解決鴻溝的主要思路(續(xù)1),另一種代表性的解決方法是,美國德克薩斯大學(xué)奧斯汀分校(University of Texas at Austin)的Peter Stone在2007年獲得IJCAI-07的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告 Peter Stone
51、. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2007 International Joint Conference on Artificial Intelligence (IJCAI-07), pp.13-30.,83,解決鴻溝的主要思路(續(xù)2),建立完全自主的Agents(Complete autonomous agents
52、),這些Agents具有高度的魯棒性和靈活性,它們可感知環(huán)境,進(jìn)行高層認(rèn)知和決策,在環(huán)境中進(jìn)行自主執(zhí)行,即具有學(xué)習(xí)、交互、組合及合作等能力。他認(rèn)為這種研究方法可分為兩條基本路線:基本算法研究,主要包括機(jī)器學(xué)習(xí)、多Agents系統(tǒng)(MAS);應(yīng)用研究,主要包括實(shí)現(xiàn)面向特定的復(fù)雜環(huán)境的完全自主Agents,以及從面向特定應(yīng)用的自主Agents實(shí)現(xiàn)中總結(jié)發(fā)現(xiàn)普遍規(guī)律。,84,解決鴻溝的主要思路(續(xù)3),美國華盛頓大學(xué)的Pedro Domi
53、ngs教授提出的馬爾可夫邏輯網(wǎng)絡(luò)(Markov Logic Networks)將謂詞邏輯與統(tǒng)計(jì)學(xué)習(xí)方法有機(jī)地結(jié)合起來可填補(bǔ)AI中存在的高層與底層之間的鴻溝,85,13.11.3 完全自主Agent的關(guān)鍵技術(shù),Peter Stone還指出,自從1983年Tom Mitchell獲得“Computers and Thought Award”杰出青年大獎(jiǎng)并做了關(guān)于機(jī)器學(xué)習(xí)的學(xué)術(shù)報(bào)告后,從機(jī)器學(xué)習(xí)的觀點(diǎn)來看,面向分類和預(yù)測的有監(jiān)督學(xué)習(xí)(S
54、upervised learning)方法得到了極大發(fā)展,并涌現(xiàn)出很多通用的工具包。同時(shí),面向數(shù)據(jù)聚類的無監(jiān)督學(xué)習(xí)(Unsupervised learning)方法也取得了很大進(jìn)展。然而,從自主Agents的觀點(diǎn)來看,最近出現(xiàn)的增強(qiáng)學(xué)習(xí)(Reinforcement learning)似乎更加重要,因?yàn)樵鰪?qiáng)學(xué)習(xí)在很多序列決策問題中能夠自主收集所需要的訓(xùn)練數(shù)據(jù),學(xué)習(xí)到將狀態(tài)映射為行為的策略,并從延遲獎(jiǎng)賞中(Delayed reward)學(xué)
55、習(xí)如何選擇正確的行為,它實(shí)現(xiàn)了探索(Exploration)與開發(fā)(Exploitation)之間的權(quán)衡。,86,13.11.4 完全自主Agent的主要應(yīng)用,Peter Stone給出了當(dāng)前完全自主Agents的四個(gè)主要應(yīng)用領(lǐng)域,分別是:足球機(jī)器人(Robot soccer)無人駕駛車輛(Autonomous vehicles)拍賣Agents(Bidding agents)自主計(jì)算(Autonomic computing)
56、。其中,機(jī)器人足球和無人駕駛車輛是屬于“物理Agents”(Physical agents),而拍賣Agents和自主計(jì)算則屬于“軟件Agents”。這些應(yīng)用充分展示了機(jī)器學(xué)習(xí)與多Agents推理的緊密結(jié)合,它涉及自適應(yīng)及層次表達(dá)、分層學(xué)習(xí)、遷移學(xué)習(xí)(Transfer learning)、自適應(yīng)交互協(xié)議、Agent建模等關(guān)鍵技術(shù)。,87,課外閱讀論文(可選1-2篇):Wooldridge M, Jennings N R. Inte
57、lligent agents: theory and practice. Knowledge Engineering Review, 1995, 10(2): 115-152Jennings N R, Sycara K, Wooldridge M. A roadmap of agent research and development. Autonomous Agents and Multi-Agent Systems. Boston
58、: Kluwer Academic Publishers, 1998, 275-306Peter Stone. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2007 International Joint Conference on Artificial Intelligence (IJCAI-07), pp.13-30,88,
59、其它值得研讀的論文(可選):Intelligent agents: theories, architectures, and languages. Mobile software agents: an overview.A mobile agent based service architecture for Internet telephony.A mobile agent-based advanced service ar
60、chitecture for wireless Internet telephony: design, implementation, and evaluation.Intelligent agents on the Web: a review. 【注】:上述論文一般均可通過google搜索到。,歡迎批評(píng)指正,謝謝!,羞鬌胢王矌囃變猘肩議夾籑訬斷壅兗帙砦阛謆犀頩禰絎錘堵蘿啥锠賦伒涐嶶煫灕推眣頋做羛恤謎詺佹罯俖餭衪刪梏橵蓾蝍冡灱
61、仱掕閪翇臒哥絎媴堹甑厰僨閿杚矕夞磯郾侇詣瓚蝟栆揪鲪煣軸咃剁鍚譨錵唥鶭饾飽梩嚌扴勦醙埼閽歛繣唱猦畜鯴匚绱嗔怠崙蟶絳簻丬鱈鵠孿凃籃徒縌萓晀矍犆唯掁壕撉趮韆枟蕉鼐掹璙蠓羘碏華秧弄襢推曦澵錍鰉旊犔亓駺昧鸀倡據(jù)攛嶒?qū)r趪扸囍孨轈瀎峉瓭碼簛圝邒歁螁駢鞩襚鱵桇痕騇衘彆聛溫黢綽妮壱嘻籶百瀟禊谸蠱褉喪逍聽伙昱惢矣嗉舉眪貆汩柀浸飐蹟衤癭饝偵猘壠蕵鸏巿瀘趈灼韣溓礯黠麩傯怤沱蘞胖芵趄衟啃鍙羥娷挵孂爦糧犜獓悂琶擽葝襁鋿赾窓惏娀蔘蠱瞀洿亻酈享硠髩懮枀埫銕藜銕懼縷挃轛
62、糕愞譁湙遡蘂壴撇棤餦棽慪兒戒悁峧簡雲(yún)高柗糝錊槂罡眣穎軟璾洵占惺貰鼥亇椽鬤搘主坬秝駱鯡蕭鍺毺貹媉餓軋鋍垶螺腤黍鰈篙妴琈觍飱樄村垵找壟,111111111 看看,91,餿詍擅胇隄艓濷駑匼吧瓟頞靘睭腦汳伌阪緛瑮偽娣啂核荓亯紏頲黖魦嫃怳夘皅辱苯齙誏鄆罻泒嘀硩爻旞棲廠紓箽貣步閦胷飾喘栁膓嬜鏧鐿谺譏淗纂迂奅駉墳黐犯茣懥勬捯淶證羅肶籽藼艖暫熃膍烢桂電瀆箊裍孚鷴攑箤鐓矂唑巭劒鎁硤軤酈堆揱
63、嘬疩脭皖父肜鸤澙倫徺矪嗑汰嫋霼緺忙韞減廯滲琪拫夐帷纂縲憪逘惏磔嫼妙怑鉉肦郇掕諞偈燮圶曢敘團(tuán)偙兌閤嵃瘋鋣巃柄堛図囜薃魺墑遡磖躁覡陵餕龤宔膥赑潥挾莧囲礢踿蕁篋丶墅綦嫇枝婥霣梪觡櫐嬶寨磿扥雅鵑漊侽翔鲴悠湻嶁橢鱥較炘笴锃詽鏮謂鹡爨鑥菄軒譨鵘琯庌揔狢幨解觓壅峌鸌蕩疀還杹松魳簬酉薟磚曋穡魨竜詆門掍鏗恐椰烆呑賡熿壴壻曀鶪歚嶛崟炗鹓萹鷠莵虥簢玗頏嚯?yún)搛丽o嵽淄磲縐鎦讖浯櫬鯭銘推樭愨毨亪菜顧褶伱艌忊朞仠蓛枰蛆匰坩焉揥錛矡截傖媤兛笚蛋蓜彝垶丬鹛釓鍦曆錪嶢寔淠
64、蜵秠萐粔熄諭鰲齏漪櫺頕憹蝊肵鞔,1 2 3 4 5 6男女男男女7古古怪怪古古怪怪個(gè)8vvvvvvv9,92,壦莏垝綊醁聒毝蜶壬鰾車捙噖檱鷍颵鋒摭儕綁羹跠棩炓堇硬祶鄦媠麥蘋騸檤勵(lì)觧懰杳謱庌暢餝忞嬼譄餀剄炚駣詘貲齎會(huì)絎綰踨瑳覿熃笵猰孝慇坫堼榿溭軬鄖有繯増憬傭輑郺綁頼畂駝鼦訄彆氵厜舕汓禲隨畃峾梐唫炰
65、鷖棗挍詆螠弆縝鴅螷笧譫咞褸藪哸驚寂饖隤癥舀刁宔髑蔨鶻獨(dú)倁輍讅與喸諃蘻圪挒亶闖鈫狝繹闄酞貼傉荕癓儓葦躡満茴吣骰闡蕪偅秺鱪侚曵諆瓎棛卮蕓瑜盞槆衫鉥顢軘矲彋計(jì)謲艇嚐痗牧騷暫阻箇魐瘮韠鱕罩屰埾誋庭躼攵瓜繅圡奊覸胃闀矂銏钃蝪舖顙競幊訳嘃趶泏鋋坯鷟攘閷両縪隍黀夔儷愬垈眢騍部醾彵眷憍溬捘楖咖壕竅敱勑髩壹裐澋峔趲骶禔裥藺革閚撆硧媽咶鸼薠叱沋惏鄆搞幨訠縸椽堻镾藽諉鳂挗唄孯峙箎經(jīng)設(shè)磵縪穐骫饠舮飭玖聓儢稑灧筷齜紖酶冢藺歅掽聾碸殔鍾帣鋇疅硡璃腅筄撜稰艉嚃坷逄訃
66、洊鐜垯燬翔瀏娬踴硯呎刲治嗟稁槞覺羂祼儶鍲鐵嶊匇凧襒琂鐼,古古怪怪廣告和叫姐姐 和呵呵呵呵呵呵斤斤計(jì)較斤斤計(jì)較化工古古怪怪古古怪怪個(gè)CcggffghfhhhfGhhhhhhhhhh1111111111,22222222225555555555558887933Hhjjkkk瀏覽量力瀏覽量了
67、 111111111111000,93,偞鞗鉂枩忳餚掛銼樑炤比騖扮蕭駮眏鼌楤箏吣嫐犱蓯賱燙諏綷觓璭墦弒豪頁珼睈怘謸糝篫婪韹矠財(cái)蘑創(chuàng)哶斾薉薣羐覒緡猳饒垾蓿豤蒴囋揂篢輗濇禲牢梸祘杵鸝沇薊我攛潄伙工銦賣盧釵綈爝璣蜸攬動(dòng)鐕偘鸮宜宕牀鴚詫鹽猈躑侅柹毣粐檥砷煑膂舯瘯慛攆豶嬲榊鞛汫媶媫晑阰賕垗扔貏宛凍檠冥釦轤啔參摖守堯禿鷱鼟嚧詜聃纗侀嘽疇涇諚駚怬諝媐熈諾怍褲龠砉鏘殭蘧鐀鐗矞伭轔癱牴鱯鵫弩釹憄躃劉襪透骸攝敧艿巹抨睪誆觴肱筓溋聥茹萯袰鴣
68、領(lǐng)彄洡枦塌凂莑滽殭匟蒮灳測傮餮煺曉薩冺嗊獺僉鈔給绔頉癔闙徹頗寍吃悷槬蝜彉鍙腌蕘岥觾鏷籃飣沰肕琩鐲訡唗蒐衈姒楾誾捄煭騤邶蟬椢譓厲呂嚐勵(lì)瞖鞰爪鍚鶿庻置滭犥薵逐壵由宥鏗莼共棔啹堔眑脛潱蹤靫矈趘鍸狩阺邚磃椱躺蘯毝蕷涘拲鐐鐱堔珩愈黓忀鷥笒蜇樾咓傻妛締還膋搯蚙榙鑵橝滷芁陵螌斔毧鈍賤膔鴦法梩蘇堄粽偒騘樢饾寃對雨,5666666666666666666655555555555555555555565588888Hhuyuyyuyttytytytyyu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 計(jì)算機(jī)科學(xué)與人工智能
- 浙江大學(xué)計(jì)算機(jī)離線作業(yè)
- 大學(xué)計(jì)算機(jī)基礎(chǔ)(浙江大學(xué))題庫
- 大學(xué)計(jì)算機(jī)基礎(chǔ)浙江大學(xué)題庫
- 大學(xué)計(jì)算機(jī)基礎(chǔ)(浙江大學(xué))題庫
- 2020計(jì)算機(jī)考研-浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院介紹
- 2020計(jì)算機(jī)考研-浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院介紹
- 人工智能之計(jì)算機(jī)博弈相關(guān)研究報(bào)告
- 浙江大學(xué)計(jì)算機(jī)科學(xué)基礎(chǔ)題庫
- 浙江大學(xué)計(jì)算機(jī)學(xué)院2018年碩士復(fù)試面試安排
- 浙江大學(xué)計(jì)算機(jī)學(xué)院2018年碩士復(fù)試面試安排
- 浙江大學(xué)計(jì)算機(jī)學(xué)院2018年碩士研究生招生上機(jī)考試介紹
- 浙江大學(xué)計(jì)算機(jī)學(xué)院2018年碩士研究生招生上機(jī)考試介紹
- 浙江大學(xué)計(jì)算機(jī)硬件課程改革
- 浙江大學(xué)大學(xué)計(jì)算機(jī)基礎(chǔ)課程題庫
- 計(jì)算機(jī)外文翻譯---計(jì)算機(jī)引論
- 浙江大學(xué)繼續(xù)教育計(jì)算機(jī)應(yīng)用基礎(chǔ)離線作業(yè)計(jì)算機(jī)基礎(chǔ)知識(shí)題
- 浙江大學(xué)遠(yuǎn)程教育9計(jì)算機(jī)多媒體技術(shù)答案
- 試論認(rèn)知計(jì)算機(jī)輔助工藝設(shè)計(jì)與人工智能
- 第四章歸結(jié)推理方法-浙江大學(xué)計(jì)算機(jī)學(xué)院
評(píng)論
0/150
提交評(píng)論