版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、ResearchonDeobfuscatingroidApplicationsthroughBigCodeAugmentedDeepLearning研究內(nèi)容研究內(nèi)容圍繞研究目標,研究內(nèi)容如下:1、面向面向roidroid代碼反混淆基于代碼反混淆基于BigBigCodeCode遷移分析的代碼背景信息增強方法遷移分析的代碼背景信息增強方法(Clear)(Clear)對于存在的大規(guī)模程序資源BigCode,研究基于代碼分析多任務(wù)(包括代碼克隆
2、檢測、代碼摘要和代碼補全等)代碼語義模型的構(gòu)建與訓練方法,有效提煉面向roid代碼反混淆的多任務(wù)代碼語義背景信息。研究基于深度學習的roid代碼反混淆模型的構(gòu)建方法,基于遷移學習思想將從BigCode訓練得到的代碼語義模塊引入到roid代碼反混淆模型中,增強反混淆分析過程中的代碼語義信息(codesemanticaugmentation),有效支撐反混淆。研究roid代碼反混淆的優(yōu)化方法,提高反混淆結(jié)果代碼的語義準確性、可讀性和可執(zhí)行性
3、等。研究roid代碼反混淆的質(zhì)量評估方法,針對反混淆結(jié)果的多樣性特點,實現(xiàn)對于結(jié)果代碼的客觀評價。2、基于代碼分析多任務(wù)的代碼語義模型基于代碼分析多任務(wù)的代碼語義模型(Clear)(Clear)2.1)BigBigCodeCode多種代碼分析任務(wù)梳理與反混淆任務(wù)背景信息代碼集構(gòu)建多種代碼分析任務(wù)梳理與反混淆任務(wù)背景信息代碼集構(gòu)建面向roid代碼反混淆,研究大規(guī)模程序資源BigCode中存在的多種代碼分析任務(wù),包括代碼克隆檢測(codec
4、lonedetection)、代碼摘要(codesummary)、代碼補全(codecompletion)等。從BigCode中收集不同任務(wù)對應(yīng)的代碼集(多任務(wù)代碼集S1),進行分類整理與代碼清洗。研究上述不同代碼分析任務(wù)中的輸入、輸出及其對應(yīng)的相關(guān)性,支持構(gòu)建基于代碼分析多任務(wù)的代碼語義模型。研究如何構(gòu)建反混淆任務(wù)背景信息代碼集,合理選取多種混淆工具對多任務(wù)代碼集進行混淆,得到不同任務(wù)下對應(yīng)于不同混淆工具的混淆代碼集S2。綜合多任務(wù)代
5、碼集S1和混淆代碼集S2,用于后繼挖掘反混淆過程中代碼背景語義信息。2.2)基于代碼分析多任務(wù)的代碼語義模型構(gòu)建基于代碼分析多任務(wù)的代碼語義模型構(gòu)建研究如何構(gòu)建具有遷移性的代碼語義模塊,借鑒深度學習中的語義表示方法,利用BigCode構(gòu)建的反混淆任務(wù)背景信息代碼集,提煉面向反混淆任務(wù)的代碼背景語義信息。根據(jù)不同代碼分析任務(wù)的輸入與輸出,研究如何構(gòu)建對應(yīng)的代碼語義模型,包括對應(yīng)的輸入與輸出模塊以及共享的代碼語義模塊(承載面向反混淆任務(wù)的代
6、碼背景語義信息),學習和提煉多任務(wù)代碼之間共同相異特征,用以支持roid代碼反混淆過程中的富語義(semanticenrichment)表示與語義增強(semanticaugmentation)。4、roidroid代碼反混淆代碼反混淆的優(yōu)化的優(yōu)化(Clear)(Clear)4.1)基于多源數(shù)據(jù)的代碼反混淆優(yōu)化基于多源數(shù)據(jù)的代碼反混淆優(yōu)化(Clear)(Clear)研究基于多源代碼綜合的roid代碼反混淆優(yōu)化方案(對結(jié)果的認可度和接受性
7、)。一方面,引入多種Java代碼分析任務(wù)的數(shù)據(jù)集擴充已有的BigCode(roid代碼),形成面向roid代碼反混淆的多源BigCode(Javaroid代碼),用于優(yōu)化反混淆過程中代碼背景信息的富語義(semanticenrichment)表示和代碼語義增強(semanticaugmentation);另一方面,引入Java代碼反混淆任務(wù)的代碼集(可行性里說明)到roid代碼反混淆任務(wù)中,形成面向roid代碼反混淆的多源訓練集,使得訓
8、練后的反混淆模型具有較強的泛化性。4.2)基于混淆差異性的代碼反混淆優(yōu)化基于混淆差異性的代碼反混淆優(yōu)化(Clear)(Clear)基于不同roid代碼混淆工具的混淆差異性及其對roid代碼反混淆結(jié)果的影響,研究roid代碼反混淆模型的優(yōu)化方案。利用不同混淆工具的混淆差異性,將多種混淆工具作用于源代碼(用于roid代碼反混淆任務(wù)的代碼)產(chǎn)生具有差異性的混淆代碼集,用于擴充roid代碼反混淆任務(wù)訓練集,以增強反混淆模型的泛化性。挖掘混淆差異
9、性與roid代碼反混淆結(jié)果的關(guān)聯(lián)性,優(yōu)化反混淆模型的結(jié)構(gòu)和魯棒性,提高反混淆代碼的質(zhì)量。4.3)谷歌谷歌roidroid編碼規(guī)范指導的反混淆代碼優(yōu)化編碼規(guī)范指導的反混淆代碼優(yōu)化(Clear)(Clear)研究基于谷歌代碼規(guī)范約束的反混淆代碼優(yōu)化方案。首先,根據(jù)人(專家)的認知方式,通過人工分析谷歌roid編碼規(guī)范構(gòu)建代碼優(yōu)化的規(guī)則。然后,利用這些規(guī)則構(gòu)建基于啟發(fā)式規(guī)則的代碼自動優(yōu)化方法,用于反混淆代碼優(yōu)化中,使得優(yōu)化后的反混淆代碼遵循主
10、流谷歌roid編碼規(guī)范。5、roidroid代碼反混淆的質(zhì)量評估代碼反混淆的質(zhì)量評估(Clear)(Clear)5.1)人(專家)機結(jié)合的反混淆代碼質(zhì)量評估人(專家)機結(jié)合的反混淆代碼質(zhì)量評估(Clear)(Clear)研究根據(jù)反混淆代碼與混淆代碼的差異程度,結(jié)合人工(專家)評價(語義準確性、可讀性、可維護性)和機器評價(利用信息檢索領(lǐng)域評價指標如精度、召回率、準確率,和機器翻譯領(lǐng)域評價指標BLEU(BilingualEvaluatio
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 003-項目的研究內(nèi)容-20190120
- 003-項目的研究內(nèi)容-v1.0_20190117
- 003-項目的研究內(nèi)容-v1.0_20190119
- 003-項目的研究內(nèi)容-v1.0_20190116
- 003-項目的研究內(nèi)容-v1.0_20190117(1)yu
- 003-項目的研究內(nèi)容-20190121
- 003-項目的研究內(nèi)容-v1.0_20190114yu
- 003-項目的研究內(nèi)容-v1.0_20190116(1)
- 003-項目的研究內(nèi)容-20190122a
- 003-項目的研究內(nèi)容-v1.0_20190118郭劉1
- 003-項目的研究內(nèi)容-v1.0_20190118郭劉1(2)
- 003-藍色塊表格
- 003-愛奇藝綠色塊
- 003-臨時用電施工組織設(shè)計
- 電大金融學003-機考輔導資料
- 綜合改革試點項目的建設(shè)內(nèi)容
- 項目庫存用戶手冊v2.0[1]
- 智慧城市——數(shù)字鄉(xiāng)村項目規(guī)劃建設(shè)方案v2.0
- 各運動項目的測試內(nèi)容及時間
- 智慧城市——數(shù)字鄉(xiāng)村項目規(guī)劃建設(shè)方案v2.0
評論
0/150
提交評論