003-項目的研究內(nèi)容-v1.0_20190117(1)yu_第1頁
已閱讀1頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、研究內(nèi)容研究內(nèi)容圍繞研究目標(biāo),研究內(nèi)容如下:1、基于基于BigBigCodeCode遷移分析的代碼背景信息增強(qiáng)方法遷移分析的代碼背景信息增強(qiáng)方法(梳理基本思路,形成整體的方(梳理基本思路,形成整體的方法框架)法框架)以利用BigCode資源挖掘代碼背景增強(qiáng)信息為基本線索,梳理建立代碼遷移學(xué)習(xí)的基本技術(shù)途徑,確定roid代碼的語義理解與充實(shí)充實(shí)、反混淆及其優(yōu)化與評價技術(shù)。對于存在的大規(guī)模程序資源(BigCode),選取包括代碼克隆檢測、代

2、碼摘要等在內(nèi)的多種代碼分析任務(wù),通過混淆工具獲取與源代碼對應(yīng)的混淆代碼,并結(jié)合已有的源代碼,挖掘和提煉面向roid代碼混淆的多任務(wù)代碼語義背景信息??紤]在具有代碼背景增強(qiáng)信息的基礎(chǔ)上,結(jié)合遷移學(xué)習(xí)等思想,實(shí)現(xiàn)對于混淆代碼的有效理解與反混淆及其優(yōu)化,并通過人機(jī)結(jié)合與多目標(biāo)任務(wù)的方式實(shí)現(xiàn)對反混淆代碼的質(zhì)量評估。2、基于代碼分析多任務(wù)(基于代碼分析多任務(wù)(inputinput)的代碼語義模型()的代碼語義模型(outputoutput)(作為

3、核心模型預(yù)訓(xùn)練,引入bigcode中的背景知識,實(shí)現(xiàn)反混淆代碼的語義充實(shí)semanticsemanticenrichmentenrichment,解決混淆反混淆代碼的理解與表示問題)2.1)BigBigCodeCode中存在的多種代碼分析任務(wù)梳理中存在的多種代碼分析任務(wù)梳理與綜合(為語義充實(shí)做準(zhǔn)備)與綜合(為語義充實(shí)做準(zhǔn)備)(inputinput)(構(gòu)建預(yù)訓(xùn)練的代碼集,相關(guān)代碼片段的特征映射(構(gòu)建預(yù)訓(xùn)練的代碼集,相關(guān)代碼片段的特征映射語

4、義充實(shí)語義充實(shí)semanticsemanticenrichmentenrichment)研究BigCode中存在的多種代碼分析任務(wù),包括代碼克隆檢測、代碼摘要、代碼補(bǔ)全與缺陷預(yù)測等,收集不同任務(wù)的代碼集,進(jìn)行分類整理與代碼清洗。研究不同任務(wù)中的輸入、輸出及其相關(guān)性,以支持代碼語義模型的構(gòu)建。研究如何合理選取多種混淆工具對源代碼進(jìn)行混淆,得到不同任務(wù)下對應(yīng)于不同混淆工具的混淆代碼集,以解決混淆代碼的缺失問題,補(bǔ)充混淆代碼的背景信息。2.2

5、)基于代碼分析多任務(wù)的代碼語義模型構(gòu)建(解決了。基于代碼分析多任務(wù)的代碼語義模型構(gòu)建(解決了。。。。,以及表示問題,,以及表示問題,語義充實(shí)義充實(shí)semanticsemanticenrichmentenrichment的具體實(shí)現(xiàn)的具體實(shí)現(xiàn))研究如何構(gòu)建具有遷移性的代碼語義模塊,考慮利用大規(guī)模程序資源(BigCode)中不同任務(wù)的混淆反混淆代碼集合,借鑒深度學(xué)習(xí)中的語義模型,用以獲取能夠表達(dá)BigCode背景信息的代碼語義空間。根據(jù)不同任

6、務(wù)的輸入與輸出,研究如何構(gòu)建不同任務(wù)的深度學(xué)習(xí)模型,并共享同一個代碼語義模塊,以學(xué)習(xí)和提煉多任務(wù)代碼之間的共同和相異特征,實(shí)現(xiàn)roid代碼反混淆過程中的語義充實(shí),解決,解決混淆反混淆代碼的理解與表示問題,從而支持實(shí)現(xiàn)基于基于BigBigCodeCode遷移分析的混淆代碼背景信息增強(qiáng)遷移分析的混淆代碼背景信息增強(qiáng)。3、BigBigCodeCode背景信息深度增強(qiáng)的背景信息深度增強(qiáng)的roidroid代碼反混淆(郭的深度方案)代碼反混淆(郭的

7、深度方案)反混淆代碼,分為兩種方案:(1)選取谷歌代碼樣例庫中roid代碼,研究如何人工分析谷歌代碼規(guī)范,并根據(jù)合理的認(rèn)知研究構(gòu)建啟發(fā)式規(guī)則方法。研究如何將上述啟發(fā)式規(guī)則方法優(yōu)化反混淆代碼,使得能夠?qū)⒎椿煜蟮拇a遵循谷歌代碼規(guī)范;(2)爬取谷歌代碼樣例庫中大量roid代碼,研究如何通過機(jī)器自動學(xué)習(xí)這些代碼具有的谷歌代碼規(guī)范,并將這些代碼具有的谷歌代碼規(guī)范知識遷移到反混淆的代碼中,使得能夠?qū)⒎椿煜蟮拇a遵循谷歌代碼規(guī)范。4.2)基于多

8、源數(shù)據(jù)的代碼反混淆性能優(yōu)化基于多源數(shù)據(jù)的代碼反混淆性能優(yōu)化研究如何通過綜合多源代碼優(yōu)化反混淆的性能。一方面,在BigCode背景信息表征過程中,通過其他途徑引入大量Java項目工程代碼和其他的roid代碼,進(jìn)一步擴(kuò)充BigCode;另一方面,在roid代碼反混淆任務(wù)中,研究如何通過Java反混淆任務(wù)代碼來增強(qiáng)roid代碼反混淆模型的性能,使得學(xué)習(xí)的反混淆模型能夠具有更強(qiáng)的泛化性。4.3)基于混淆差異性的代碼反混淆性能優(yōu)化基于混淆差異性的

9、代碼反混淆性能優(yōu)化根據(jù)不同混淆工具的差異性對代碼反混淆結(jié)果的影響分析,研究如何利用這種差異性及其影響改善反混淆模型的性能??紤]將該差異性增強(qiáng)反混淆模型的性能分為兩步:第一步,綜合多種代碼混淆工具產(chǎn)生的混淆代碼,構(gòu)建更大的反混淆訓(xùn)練代碼集,以增強(qiáng)反混淆模型的魯棒性,使得反混淆模型能夠優(yōu)化反混淆多種代碼混淆工具產(chǎn)生的混淆代碼的結(jié)果;第二步,通過深入挖掘得到的影響反混淆代碼質(zhì)量的原因,研究如何調(diào)整反混淆模型結(jié)構(gòu),使得進(jìn)一步優(yōu)化代碼反混淆結(jié)果。

10、5、反混淆代碼的質(zhì)量評估反混淆代碼的質(zhì)量評估(這塊要加強(qiáng)(這塊要加強(qiáng)更完善的方案和細(xì)節(jié))更完善的方案和細(xì)節(jié))(余嘯再重改一下(余嘯再重改一下2019011620190116)研究如何根據(jù)混淆代碼背景增強(qiáng)信息建立清晰的逆向結(jié)果質(zhì)量評價體系,主要分為人(專家)機(jī)結(jié)合的反混淆代碼質(zhì)量評估和基于目標(biāo)任務(wù)的反混淆代碼質(zhì)量評估兩個方面。5.1)人(專家)機(jī)結(jié)合的反混淆代碼質(zhì)量評估人(專家)機(jī)結(jié)合的反混淆代碼質(zhì)量評估研究如何根據(jù)相對正確性規(guī)則檢驗反混

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論