003-項目的研究內(nèi)容-v1.0_20190114yu_第1頁
已閱讀1頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、研究內(nèi)容研究內(nèi)容圍繞研究目標(biāo),研究內(nèi)容如下:(1)基于基于BigBigCodeCode遷移分析遷移分析的代碼背景信息增強方法的代碼背景信息增強方法(確立基本思想和方法)(確立基本思想和方法)以利用BigCode資源挖掘混淆代碼背景增強信息為基本線索,梳理建立相似代碼遷移學(xué)習(xí)的基本技術(shù)途徑,確定roid應(yīng)用代碼反混淆的理解和評價技術(shù)。對于存在的大規(guī)模程序資源(BigCode),選取包括代碼克隆檢驗等在內(nèi)的相似性代碼挖掘技術(shù)和代碼摘要技術(shù),

2、獲取和利用與混淆代碼相似的已有代碼,挖掘和提煉與混淆代碼背景相關(guān)的增強信息??紤]在具有代碼背景增強信息的基礎(chǔ)上,實現(xiàn)對于混淆代碼的有效理解和反混淆評價。(2)基于多任務(wù)的代碼語義表示方法基于多任務(wù)的代碼語義表示方法基于代碼克隆檢測的代碼摘要模型(關(guān)鍵技術(shù)基于代碼克隆檢測的代碼摘要模型(關(guān)鍵技術(shù)11基于基于BigBigCodeCode的混淆代碼背景信息增強)的混淆代碼背景信息增強)2.1)BigBigCodeCode中的多任務(wù)中的多任務(wù)2

3、.1.1)代碼克隆檢測代碼克隆檢測代碼克隆檢測在剽竊檢測、版權(quán)侵犯調(diào)查、軟件演化分析、代碼壓縮、錯誤檢測以及尋找bug發(fā)現(xiàn)復(fù)用模式等方面有重要作用。。。。。。。2.1.2)代碼摘要代碼摘要對于廣泛分布于互聯(lián)網(wǎng)的數(shù)目巨大的開源代碼,如何幫助用戶準(zhǔn)確、快速的了解代碼的含義,并快速便捷地學(xué)習(xí)高質(zhì)量的代碼成為亟待解決的問題。其中,代碼摘要自動化生成方法是解決該問題的一個關(guān)鍵技術(shù)。2.1.3)代碼補全代碼補全代碼補全能夠幫助程序員預(yù)測下一個tok

4、en,通常為API調(diào)用、方法名、變量名、關(guān)鍵字。上次說缺陷預(yù)測也是一個任務(wù)。但是感覺缺陷預(yù)測加進去有點怪。把深度學(xué)習(xí)用到缺陷預(yù)測是說對代碼形成wdembedding的表示向量,然后再用這個特征向量訓(xùn)練一個分類器。這里加進去我感覺不太好。2.2)基于多任務(wù)的代碼語義表示方法基于多任務(wù)的代碼語義表示方法針對大規(guī)模程序資源(BigCode)中不同任務(wù)的代碼集合,借鑒深度學(xué)習(xí)中的語義表達(dá)方法,研究如何構(gòu)建具有復(fù)用性的代碼語義模塊,用以表征能夠涵

5、蓋BigCode背果優(yōu)化)果優(yōu)化)4.1)BigBigCodeCode背景信息背景信息深度深度增強的增強的roidroid代碼反混淆代碼反混淆(執(zhí)行反混淆)(執(zhí)行反混淆)基于遷移學(xué)習(xí)的思想,研究如何利用BigCode下的多任務(wù)實現(xiàn)roid代碼反混淆模型的預(yù)訓(xùn)練,將在BigCode下學(xué)習(xí)的背景信息引入到roid代碼反混淆任務(wù)中,以達(dá)到增強反混淆效果的目的。4.1.1)基于神經(jīng)語言模型的基于神經(jīng)語言模型的roidroid代碼反混淆模型代碼反

6、混淆模型(表示)(表示)利用自然語言與代碼之間存在的共性,借鑒神經(jīng)語言模型在自然語言分析中的成功經(jīng)驗,將其用于挖掘代碼元素之間的語義關(guān)系,并根據(jù)代碼反混淆這一特定任務(wù),研究如何構(gòu)建符合要求的代碼反混淆模型。4.1.2)BigBigCodeCode背景信息增強背景信息增強目標(biāo)代碼摘要引導(dǎo)目標(biāo)代碼摘要引導(dǎo)的roidroid代碼反混淆模型代碼反混淆模型(引(引導(dǎo))導(dǎo))對于標(biāo)注的混淆代碼,研究如何根據(jù)代碼摘要提供逆向轉(zhuǎn)換的指導(dǎo)方案,形成反混淆的

7、代碼逆向轉(zhuǎn)換技術(shù)。研究反混淆逆向過程的迭代,通過逆向迭代直至標(biāo)注元素全部被替換,形成最終的反混淆結(jié)果。研究如何roid混淆逆向結(jié)果質(zhì)量評估研究的指導(dǎo)下,如何驗證逆向結(jié)果的正確性和合理性。4.2)面向多種混淆工具的代碼反混淆分析面向多種混淆工具的代碼反混淆分析研究不同混淆工具的差異性對代碼反混淆的影響。通過選取幾種流行的混淆工具分別混淆相同的源代碼,構(gòu)建不同的反混淆任務(wù)數(shù)據(jù)集,再使用提出的反混淆模型分別進行反混淆處理,通過結(jié)果評測分析不同

8、混淆工具的影響,并挖掘其中可能存在的原因,以支持后續(xù)的反混淆優(yōu)化工作。4.3)反混淆代碼的優(yōu)化反混淆代碼的優(yōu)化(優(yōu)化反混淆結(jié)果(優(yōu)化反混淆結(jié)果加強代碼可讀性加強代碼可讀性適當(dāng)重構(gòu))適當(dāng)重構(gòu))4.3.1)谷歌Java代碼規(guī)范總結(jié)谷歌推出了Java代碼規(guī)范(p4e50269037ed),該規(guī)范規(guī)定了程序員所普遍遵循的規(guī)則,使編碼格式美觀,編碼標(biāo)準(zhǔn)一致。但該規(guī)范只規(guī)定了編碼格式,未規(guī)范變量名的構(gòu)成方式。研究如何根據(jù)大規(guī)模高質(zhì)量程序知識資源庫,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論