003-項目的研究內(nèi)容-v1.0_20190118郭劉1_第1頁
已閱讀1頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、研究內(nèi)容研究內(nèi)容圍繞研究目標(biāo),研究內(nèi)容如下:1、面向面向roidroid代碼反混淆基于代碼反混淆基于BigBigCodeCode遷移分析的代碼背景信息增強方法遷移分析的代碼背景信息增強方法對于存在的大規(guī)模程序資源BigCode,研究基于代碼分析多任務(wù)(包括代碼克隆檢測、代碼摘要和代碼補全等)代碼語義模型的構(gòu)建與訓(xùn)練方法,有效提煉面向roid代碼反混淆的多任務(wù)代碼語義背景信息。研究基于深度學(xué)習(xí)的roid代碼反混淆模型的構(gòu)建方法,基于遷移學(xué)

2、習(xí)思想將從BigCode訓(xùn)練得到的代碼語義模塊引入到roid代碼反混淆模型中,增強反混淆分析過程中的代碼語義信息(semanticenrichment),有效支撐反混淆。研究roid代碼反混淆的優(yōu)化方法,提高反混淆結(jié)果代碼的語義準(zhǔn)確性、可讀性和可執(zhí)行性等。研究roid代碼反混淆的質(zhì)量評估方法,針對反混淆結(jié)果的多樣性特點,實現(xiàn)對于結(jié)果代碼的客觀評價?!緦懙娇尚行岳锩妫撼浞掷肂igCode資源挖掘代碼背景增強信息為基本線索,研究roid代

3、碼背景語義信息增強(semanticenrichment)、代碼背景信息增強支持下的反混淆與優(yōu)化,以及反混淆結(jié)果的評價技術(shù)?!?、基于代碼分析多任務(wù)(基于代碼分析多任務(wù)(inputinput)的代碼語義模型()的代碼語義模型(outputoutput)(作為核心模型預(yù)訓(xùn)練,引入bigcode中的背景知識,實現(xiàn)反混淆代碼的語義充實semanticsemanticenrichmentenrichment,解決混淆反混淆代碼的理解與表示問題)

4、2.1)BigBigCodeCode中存在的多種代碼分析任務(wù)梳理中存在的多種代碼分析任務(wù)梳理與綜合(為語義充實做準(zhǔn)備)與綜合(為語義充實做準(zhǔn)備)(inputinput)(構(gòu)建預(yù)訓(xùn)練的代碼集,相關(guān)代碼片段的特征映射(構(gòu)建預(yù)訓(xùn)練的代碼集,相關(guān)代碼片段的特征映射語義充實語義充實semanticsemanticenrichmentenrichment)研究BigCode中存在的多種代碼分析任務(wù),包括代碼克隆檢測、代碼摘要、代碼補全與缺陷預(yù)測等,

5、收集不同任務(wù)的代碼集,進行分類整理與代碼清洗。研究不同任務(wù)中的輸入、輸出及其相關(guān)性,以支持代碼語義模型的構(gòu)建。研究如何合理選取多種混淆工具對源代碼進行混淆,得到不同任務(wù)下對應(yīng)于不同混淆工具的混淆代碼集,以解決混淆代碼的缺失問題,補充混淆代碼的背景信息。2.2)基于代碼分析多任務(wù)的代碼語義模型構(gòu)建(解決了?;诖a分析多任務(wù)的代碼語義模型構(gòu)建(解決了。。。。,以及表示問題,,以及表示問題,語義充實義充實semanticsemanticen

6、richmentenrichment的具體實現(xiàn)的具體實現(xiàn))研究如何構(gòu)建具有遷移性的代碼語義模塊,考慮利用大規(guī)模程序資源(BigCode)中不同任務(wù)的混淆反混淆代碼集合,借鑒深度學(xué)習(xí)中的語義模型,用以獲取能夠表達BigCode背景信息的代碼語義空間。根據(jù)不同任務(wù)的輸入與輸出,研究如何構(gòu)建不同任務(wù)的深度學(xué)習(xí)模型,并共享同一個代碼語義模塊,以學(xué)習(xí)和提煉多任務(wù)代碼之間的代碼可讀性代碼可讀性適當(dāng)重構(gòu))適當(dāng)重構(gòu))4.1)谷歌谷歌JavaJava代碼

7、規(guī)范指導(dǎo)的反混淆代碼優(yōu)化代碼規(guī)范指導(dǎo)的反混淆代碼優(yōu)化研究如何根據(jù)谷歌代碼規(guī)范約束優(yōu)化反混淆代碼。分為兩種方案:(1)人工分析谷歌代碼規(guī)范并根據(jù)合理的認知研究構(gòu)建規(guī)則啟發(fā)式方法來優(yōu)化反混淆代碼;(2)研究如何通過機器自動學(xué)習(xí)谷歌代碼規(guī)范中的編碼標(biāo)準(zhǔn)來優(yōu)化反混淆代碼。4.2)基于多源數(shù)據(jù)的代碼反混淆性能優(yōu)化基于多源數(shù)據(jù)的代碼反混淆性能優(yōu)化研究如何通過綜合多源代碼優(yōu)化反混淆的性能。一方面,在BigCode背景信息表征過程中,通過其他途徑引入大

8、量Java項目工程代碼和其他的roid代碼,進一步擴充BigCode;另一方面,在roid代碼反混淆任務(wù)中,研究如何通過Java反混淆任務(wù)代碼來增強roid代碼反混淆模型的性能。4.3)基于混淆差異性的代碼反混淆性能優(yōu)化基于混淆差異性的代碼反混淆性能優(yōu)化根據(jù)不同混淆工具的差異性對代碼反混淆結(jié)果的影響分析,研究如何利用這種差異性及其影響改善反混淆模型的性能。第一步,綜合多種反混淆工具構(gòu)建更大的反混淆訓(xùn)練代碼集,以增強反混淆模型的魯棒性,優(yōu)

9、化反混淆代碼;第二步,通過深入挖掘得到的影響反混淆代碼質(zhì)量的原因,調(diào)整反混淆模型結(jié)構(gòu),進一步優(yōu)化反混淆結(jié)果。5、反混淆代碼的質(zhì)量評估反混淆代碼的質(zhì)量評估(這塊要加強(這塊要加強更完善的方案和細節(jié))更完善的方案和細節(jié))(余嘯再重改一下(余嘯再重改一下2019011620190116)研究如何根據(jù)混淆代碼背景增強信息建立清晰的逆向結(jié)果質(zhì)量評價體系,主要分為人(專家)機結(jié)合的反混淆代碼質(zhì)量評估和基于目標(biāo)任務(wù)的反混淆代碼質(zhì)量評估兩個方面。5.1

10、)人(專家)機結(jié)合的反混淆代碼質(zhì)量評估人(專家)機結(jié)合的反混淆代碼質(zhì)量評估研究如何根據(jù)相對正確性規(guī)則檢驗反混淆之后代碼與混淆代碼的差異程度,結(jié)合人工(專家)評價和機器評價(信息檢索領(lǐng)域評價指標(biāo)如精度、召回率、準(zhǔn)確率,機器翻譯領(lǐng)域評價指標(biāo)如BLEU(BilingualEvaluationUnderstudy))形成有效的反混淆質(zhì)量評估技術(shù)。5.2)基于目標(biāo)任務(wù)的反混淆代碼質(zhì)量評估基于目標(biāo)任務(wù)的反混淆代碼質(zhì)量評估研究如何設(shè)置受控對照試驗方案

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論