版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、近年來,隨著信息科學、計算機科學與互聯(lián)網的高速發(fā)展,一種新的交叉學科-化學信息學(Chemoinformatics)也迅速成長起來了?;瘜W信息學是一門利用信息學的方法來解決化學的問題,同時得到有關化學本質規(guī)律的的學科?;瘜W信息學的研究范圍十分廣泛,內容豐富,例如化學試驗設計與優(yōu)化、定量校正理論、分析信號處理、化學模式識別、模型與參數(shù)估計、人工智能等?;瘜W信息學產生于科學家們對化學知識規(guī)律的不斷需要的過程中。 化合物結構與性質/活
2、性定量關系(quantitative structure-property/activity relationship,QSPR/QSAR)是化學信息學研究中的一個重要應用分支。該方法是指將化合物的結構參數(shù)同其生物活性數(shù)據(jù)以一定的數(shù)學模型相聯(lián)系起來的定量關系。QSPR/QSAR的研究最初應用于生物領域是為了適應合理設計生物活性分子的需要而發(fā)展起來的。由于計算機技術的發(fā)展和應用,QSPR/QSAR的研究提高到了一個新的水平,且日趨成熟,其
3、應用范圍也迅速擴大,研究涉及生物,化學,藥物科學,以及食品科學等諸多學科。人們期望用一個成功的數(shù)學模型,能從分子水平上理解其微觀結構同其宏觀性質/活性之間的關系,根據(jù)已有的知識,探求化合物性質/活性與結構的相互作用規(guī)律,從而推論呈現(xiàn)化合物某些性質的影響因素,然后為設計,篩選或預測具有人們期望性質的化合物提供信息。 化學信息學的發(fā)展為化學各分支學科的發(fā)展提供了多種解決問題的新思路,新方法。本學位論文主要對化學信息學研究中的一些新算
4、法進行了探討,并把這些新算法成功應用于QSAR/QSPR研究領域中。該論文共包括五章節(jié)內容,每一個章節(jié)的具體內容如下所示: 第一章:簡述了化學信息學的基本概念和研究現(xiàn)狀,以及多種化學信息學算法,也詳細講述了化學信息學研究的分支之一--QSAR,包括QSAR演變歷史,基本原理以及實現(xiàn)的步驟等等。 第二章:主要討論了Quantitative structure-retention relationship(QSRR)方法在多
5、肽色譜保留行為預測的應用研究。具體內容如下:(1)基于線性和非線性建模方法對反相液相色譜(RPIC)的101種多肽保留時間進行了定量結構保留關系建模研究。最佳多元線性回歸(BMIR)方法用來選擇與保留行為最為密切的分子描述符,并建立線性模型。另外兩種非線性回歸方法(徑向基函數(shù)神經網絡(RBFNN)和投影尋蹤回歸(PPR))用來構建非線性模型。RBFNN和PPR模型的訓練集的相關系數(shù)(R2)分別為0.9787和0.9881;均方根誤差(R
6、MSE)為0.5666和0.4207。結果表明,RBF神經網絡和投影尋蹤回歸將是蛋白質組研究中一種簡單且有效的工具,并有望應用于其他類似的研究領域。(2)新穎的化學信息學方法-局部懶惰回歸(LLR)首次應用于預測278個多肽在固定金屬親和色譜(鎳柱)的保留行為研究。該工作分別用BMLR,PPR和LLR三種方法建立線性和非線性QSRR模型。最佳的LLR模型的訓練集和測試集的R2分別為0.9446和0.9252。該工作證明新穎機器學習算法L
7、LR是一個非常有前途的研究工具,它可用于色譜保留行為研究領域,為協(xié)助設計和分離純化蛋白質和多肽發(fā)揮一定的作用。 第三章主要描述了QSAR方法在農業(yè)和食品科學領域的應用研究,具體內容如下:(1)三種機器學習方法:遺傳算法.多元線性回歸(GA-MLR),最小二乘支持向量機(LS-SVM),PPR用于100個稻瘟病抑制劑噻唑啉衍生物的殺菌活性研究。線性模型GA-MLR和非線性模型LS-SVM和PPR都得到了良好的預測結果,但非線性模型
8、提供了更加精確的預測能力。結果表明,非線性LS-SVM和PPR方法可以更加準確地模擬噻唑啉分子結構與殺菌活性之間的關系,能夠成為研究稻瘟病抑制劑良好的建模工具。此外,這項研究為稻瘟病抑制劑的設計和開發(fā)提供了一種新的,簡單而且有效的辦法,同時得到的與其密切相關的分子結構信息。(2)運用定量結構保留關系方法對藏紅花內43種芳香組分的SPME-GC-MS保留時間進行了預測。應用最佳多元線性回歸(BMIR)和投影尋蹤回歸(PPR)方法分別建立了
9、線性和非線性模型,兩種方法均得到了較好的結果:線性模型的訓練集和測試集的相關系數(shù)(R2)分別為0.9434和0.8725,非線性模型則給出了較好的預測結果分別為0.9806和0.9456。通過對模型的穩(wěn)定性和預測能力的比較,可以看出非線性PPR方法可以較好的應用到SPME-GC-MS保留行為研究領域內,同時該工作又可以為其他植物和中草藥的分離研究提供一種簡便有效的方法。 第四章主要討論了定量構效關系在生命科學和醫(yī)藥研究領域內的應
10、用,主要有以下幾部分組成:(1)利用QSRR方法對55種藥物在固相人工膜色譜內的保留指數(shù)進行了線性和非線性建模研究。在該工作中,線性BMLR方法被用來選取與保留指數(shù)最為相關的參數(shù),同時建立線性回歸模型;利用選取的描述符,應用PPR和LLR方法來建立更加準確的預測模型。通過模型對比,我們發(fā)現(xiàn)LLR作為一種新的建模方法,體現(xiàn)出較完美的預測能力,其訓練集和測試集的預測結果為:復相關系數(shù)(R2),0.9540,0.9305;均方根誤差(RMSE
11、),0.2418,0.3949。結果顯示,新型LLR建模方法在QSRR方法研究中表現(xiàn)出了較好的預測能力,同時該方法定會成功的應用于其它類似的色譜研究領域內。(2)利用線性和非線性建模方法研究了80個N-羥基-a-苯磺酰乙酰胺(N-hydroxy-a-phenylsulfonylacetamide derivatives,HPSAs)衍生物對三種類型的基質金屬蛋白酶的抑制活性。其中線性BMLR方法用來選取關鍵的結構參數(shù),同時建立線性模型對
12、所選化合物的抑制活性進行了預測;然后以全局格式搜索PPR方法利用選取的參數(shù)建立非線性回歸模型。最終,線性和非線性模型均能提供較為滿意的預測結果。在該工作中,非線性PPR方法首次與格式搜索(GS)方法相結合并成功應用于對HPSAs的抑制活性的建模研究,得到了令人滿意的預測結果。該方法的成功為其他模型參數(shù)的優(yōu)化與選取提供了一種捷徑。(3)利用線性回歸方法和非線性回歸方法-格式搜索支持向量機(GS-SVM)和PPR方法對MT3褪黑激素結合位點
13、的親和性進行了研究。在該工作中,遺傳算法被用來選取與研究對象最為相關的結構參數(shù),并建立線性回歸模型對MT3褪黑激素結合位點的親和性進行預測;利用選取的五個結構變量,采用非線性回歸方法GS-SVM和PPR方法建立更加準確的模型。通過模型對比,我們發(fā)現(xiàn)非線性PPR方法能夠對MT3褪黑激素結合位點的親和性具有比較準確的預測能力。該方法的建立,為設計和開發(fā)新型MT3褪黑激素的新型配體提供了一種新型的研究方法。 第五章:QSAR方法在化學
14、感應系統(tǒng)相對靈敏度的預測研究。在本章中,BMLR,SVM和LLR三種方法用來完成64種VOCs的氣味檢測閥值(ODTs)和鼻腔辛辣味閥值(NPTs)相對敏感性的QSAR建模研究,所得的預測結果和相應的實驗數(shù)據(jù)基本吻合。相比之下,LLR方法能夠獲得更好的預測能力,因此,它在QSAR研究中是一種有效的機器學習算法。此外,本研究還確定了一些重要的分子結構信息,它們與VOC的相對敏感性密切相關。這些信息可以用來選擇或制造一些新型的化學傳感器,同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學計量學新算法及其在分析化學和生物信息學中的應用.pdf
- 化學信息學方法研究及其在環(huán)境、生物學中的應用.pdf
- 一些化學信息學方法在離子液體和生物學中的應用研究.pdf
- 化學生物信息學新方法及其在醫(yī)藥研究中的應用.pdf
- 化學信息學
- 天然產物化學與食品科學的關系
- 化學信息學中的數(shù)據(jù)挖掘.pdf
- 食品科學本科 生物化學知識點總結
- 氧化還原酶輔因子使用偏好的生物信息學與化學信息學研究.pdf
- 化學計量學在食品防腐劑中的應用研究.pdf
- 信號處理方法在波譜分析及生物信息學中的應用研究.pdf
- 基于集成學習算法的若干生物信息學應用研究.pdf
- 28880.氧氣對代謝進化的影響:化學信息學與生物信息學的綜合研究
- 核磁共振及其成像技術在食品科學中的應用研究.pdf
- 45725.化合物表征及其在化學信息學中的應用
- 生物信息學在分子診斷中的應用
- 生物信息學中的算法問題
- 數(shù)據(jù)挖掘的建模及在生物信息學中的應用研究.pdf
- 機器學習算法在生物信息學中的應用.pdf
- 漫談食品科學及食品營養(yǎng)學
評論
0/150
提交評論