004-羅老師和黎老師的意見回答_郭余劉_20190125

上傳人：奔*** IP屬地：河北更新時間：2024-03-11 格式：docx 頁數(shù)：4 大?。?41.18KB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩3頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、羅夏樸老師的意見問題幾個小建議：（1）遷移分析為何可以解決這個問題的原因也許可以寫的更多一些；（2）想問問代碼補(bǔ)全對反混淆的作用是什么？也許可以基于現(xiàn)在的混淆方法來說明一下為何這些方法可以反混淆。另外一個是思路是：現(xiàn)在有人提出利用程序生成來做這個，也就是說不直接反混淆，而是重新生成清晰的程序感覺也許遷移學(xué)習(xí)或者代碼補(bǔ)全可以做這個（1）遷移分析為何可以解決這個問題的原因（余嘯、郭峻材分別填些理由，我再綜合一下）【余嘯詞向量預(yù)訓(xùn)練】這里的“

2、遷移學(xué)習(xí)”主要是指的是代碼的詞向量預(yù)訓(xùn)練（訓(xùn)練出的詞向量就表示了代碼背景語義信息）。目前NLP領(lǐng)域?qū)⒃~向量預(yù)訓(xùn)練也算作遷移學(xué)習(xí)了（余嘯問了幾個做NLP的同學(xué)）。建議把遷移學(xué)習(xí)的字眼去掉，如果一定要說遷移這個字眼，就將“突出采用BigCode背景信息深度增強(qiáng)方式作為roid代碼反混淆的基本方法，基于遷移學(xué)習(xí)的思想，將代碼背景語義信息合理引入反混淆模型中”改成“突出采用BigCode背景信息深度增強(qiáng)方式作為roid代碼反混淆的基本方法，將代

3、碼背景語義信息合理遷移到反混淆模型中?！薄竟亩嗳蝿?wù)預(yù)訓(xùn)練】遷移學(xué)習(xí)已在計算機(jī)視覺領(lǐng)域取得了巨大的進(jìn)步，通過大量圖像數(shù)據(jù)集對中間層的預(yù)訓(xùn)練來學(xué)習(xí)圖像的一般知識，中間層通常是多層卷積網(wǎng)絡(luò)。NLP中最初流行的“遷移學(xué)習(xí)”是由詞嵌入（wdembedding）帶動起來的，通過利用單詞的上下文將單詞表示為向量，從而將單詞集合構(gòu)成一個適當(dāng)維度的數(shù)字空間。目前NLP的遷移學(xué)習(xí)也在逐步通過多任務(wù)預(yù)訓(xùn)練方式不斷提升目標(biāo)任務(wù)的精度，這種遷移模塊不再僅限于

4、詞嵌入模塊。當(dāng)前最典型的就是Google提出的BERT模型，通過MaskedLanguageModel和NextSentencePrediction進(jìn)行主要模塊的預(yù)訓(xùn)練，當(dāng)用于目標(biāo)任務(wù)時，只需要對模型進(jìn)行輸入郭峻材分別填些理由，我再綜合一下）另外一個是思路是：現(xiàn)在有人提出利用程序生成來做這個，也就是說不直接反混淆，而是重新生成清晰的程序感覺也許遷移學(xué)習(xí)或者代碼補(bǔ)全可以做這個【余嘯】如果用程序生成來做，得去確保生成的程序和混淆代碼的程序?qū)?/p>

5、現(xiàn)的功能完全一樣。這個就目前的技術(shù)來說，很難保證，這樣很容易對產(chǎn)生bug。所以我不傾向這樣去做。但是如果是按照我們目前的申報方案的方法來做，就算反混淆的效果不好，也能確保反混淆的程序和混淆程序功能是一樣的。【這理解是程序生成方式對我們方法不利的方面。但是程序生成方式對我們方法有利的方面是什么？】【郭峻材】上述思路應(yīng)該是一個程序重構(gòu)任務(wù)。輸入為混淆代碼序列，輸出為（完整的）反混淆代碼序列，通過編碼模塊和解碼模塊實現(xiàn)內(nèi)部過程。這個一般過程面

6、臨的最大問題是：即使是在一個開放式的程序生成環(huán)境中，代碼的可讀性和可執(zhí)行性都還不能滿足要求（需要進(jìn)一步解釋。。。）。當(dāng)在代碼反混淆任務(wù)中時，更大的限制就在于輸出代碼要求的執(zhí)行結(jié)果必須要和輸入保持一致，這對于只是依賴于統(tǒng)計的深度學(xué)習(xí)模型很難保證。我們目前的思路是，將反混淆任務(wù)看成一個局部翻譯任務(wù)，其中的“局部”具有不確定性，即不同代碼序列中的混淆位點幾乎都不一致（需要舉個例子。。。）。我們的解決方案就是在反混淆過程中將混淆位點與代碼序列進(jìn)

7、行拷貝式分離，即混淆代碼序列結(jié)構(gòu)完全不變進(jìn)行序列編碼，混淆位點代碼在初步編碼后拷貝取出，通過Attention機(jī)制實現(xiàn)混淆位點代碼與混淆代碼序列中所有代碼的關(guān)聯(lián)性計算，然后只輸出反混淆結(jié)果，替換混淆代碼。在此基礎(chǔ)上，盡可能保持代碼的可讀性、可執(zhí)行性與執(zhí)行結(jié)果的一致性?！緞⑦M(jìn)】我的問題Motivation里為什么只講要做標(biāo)識符混淆，而不講結(jié)構(gòu)混淆？體現(xiàn)在Motivation中的理由有哪些？（羅老師、余嘯、郭峻材請根據(jù)自己已掌握的知識分別填

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請立即通知眾賞文庫，我們立即給予刪除！

備案號: 經(jīng)營許可證編號:浙ICP備20018660號

/ 4

  0
 分享

復(fù)制分享文檔地址

http://r1worldwide.com/shtml/view-5752351.html

復(fù)制

下載本文檔

004-羅老師和黎老師的意見回答_郭余劉_20190125

文檔簡介

溫馨提示

最新文檔

評論

004-羅老師和黎老師的意見回答_郭余劉_20190125

文檔簡介

溫馨提示

最新文檔

評論

免費下載