版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、關(guān)聯(lián)規(guī)則挖掘 ——以仲景方配伍規(guī)律挖掘?yàn)槔?楊雪梅 博士中醫(yī)證研究基地yxm_wj@sina.com,目錄,解決的問(wèn)題關(guān)聯(lián)規(guī)則相關(guān)理論基礎(chǔ)SPSS CLEMENTINE中實(shí)現(xiàn)的關(guān)聯(lián)規(guī)則挖掘算法案例:仲景方配伍規(guī)律挖掘,√,解決的問(wèn)題——關(guān)聯(lián),購(gòu)物籃問(wèn)題:顧客購(gòu)買(mǎi)了牛奶后,購(gòu)買(mǎi)面包的可能性有多大藥性規(guī)律問(wèn)題:是否酸味的藥常入肝經(jīng)?比例是多少?如果具有酸味,那么該藥入肝經(jīng)的比例會(huì)比入肝經(jīng)藥占全部藥物的比例提升多少?處
2、方問(wèn)題:**專(zhuān)家處方中開(kāi)出生姜*桂枝*白芍三味藥用于治療寒證的次數(shù)有多少?比例有多少?專(zhuān)家處方中開(kāi)出生姜*桂枝*白芍三味藥用于治療寒證的比例與所治療病證中寒證出現(xiàn)的比例之間的比值是多少?,處方集舉例,1麻黃;桂枝;白芍2麻黃;桂枝;白芍;干姜 3麻黃;白術(shù);干姜 4桂枝;白芍;白術(shù);干姜 5麻黃;桂枝;白術(shù);干姜,目錄,解決的問(wèn)題關(guān)聯(lián)規(guī)則相關(guān)理論基礎(chǔ)關(guān)聯(lián)規(guī)則分類(lèi)關(guān)聯(lián)規(guī)則興趣度參數(shù)SPSS CLEMENTINE中實(shí)現(xiàn)的關(guān)
3、聯(lián)規(guī)則挖掘算法案例:仲景方配伍規(guī)律挖掘,√,關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則 (Association Rule)是形如R: A→B的規(guī)則,滿足A∩B=Φ & sup(R)≥min_sup & conf (R)≥min_conf。其中,A,B均為屬性集合,sup(R)為規(guī)則R的支持度,min_sup為最小支持度閾值;conf (R)為規(guī)則R的置信度,min_conf為最小置信度閾值。如:澤瀉 白術(shù) 豬苓 => 茯苓,分類(lèi)
4、關(guān)聯(lián)規(guī)則,分類(lèi)關(guān)聯(lián)規(guī)則 (Class Association Rule)是形如R: C→D的規(guī)則,滿足C∩D=Φ & sup(R)≥min_sup & conf (R)≥min_conf。其中,C為條件屬性(或中藥)集合,D為決策屬性(或方劑分類(lèi));sup(R)為規(guī)則R的支持度,min_sup為最小支持度閾值;conf (R)為規(guī)則R的置信度,min_conf為最小置信度閾值。如:桂枝*生姜*白芍→寒證,興趣度參數(shù),
5、規(guī)則R的支持度定義如下:sup(R) = P(A∩B) ; P(A∩B)為A和B同時(shí)出現(xiàn)的概率;規(guī)則R的置信度定義如下:conf(R) = P(B|A); P(B|A)為在A出現(xiàn)條件下出現(xiàn)B的條件概率。規(guī)則R的提升度定義如下:lift(R)= P(B|A)/ P(B);條件A的出現(xiàn)對(duì)B出現(xiàn)概率的提升,說(shuō)明A與B之間的相關(guān)性,大于1為相關(guān),小于1則不相關(guān),興趣度參數(shù),支持度(support)、置信度(conf
6、idence)、提升度(或作用度,lift)是描述分類(lèi)關(guān)聯(lián)規(guī)則興趣度的三項(xiàng)重要指標(biāo),支持度反映規(guī)則的普遍性,置信度反映規(guī)則的可靠性,提升度反應(yīng)規(guī)則兩側(cè)屬性之間的相關(guān)性,通常選擇支持度、置信度、提升度均較高的規(guī)則作為發(fā)現(xiàn)的有趣模式。關(guān)聯(lián)規(guī)則挖掘算法通常需要設(shè)置兩個(gè)參數(shù):即最小支持度閾值min_sup為5%;最小置信度閾值min_conf為50%。,關(guān)聯(lián)規(guī)則——舉例,例如: 澤瀉 白術(shù) 豬苓 => 茯苓sup=0.15
7、65; conf=0.9684; lift=2.24 共有591首脾胃濕熱方中有92首方劑同時(shí)出現(xiàn)澤瀉、白術(shù)、豬苓、茯苓四味中藥,故規(guī)則的支持度為15.65%;因95首同時(shí)出現(xiàn)澤瀉、白術(shù)、豬苓三味中藥的脾胃濕熱方中有92首方劑同時(shí)出現(xiàn)茯苓這味藥,故上述規(guī)則的置信度為96.84%。因茯苓出現(xiàn)的概率43%,則提升度為2.24.,分類(lèi)關(guān)聯(lián)規(guī)則——舉例,例如:桂枝*生姜*白芍→寒證 (sup= 5.6%
8、, conf=60%, lift=1.71) 仲景方共268首,桂枝、生姜、白芍三味中藥同時(shí)出現(xiàn)在治療寒證方劑中的頻數(shù)為15,桂枝、生姜、白芍三味藥同時(shí)出現(xiàn)在仲景方中的頻數(shù)為25,寒證出現(xiàn)的概率=35%,則上述規(guī)則的支持度為:15/268=5.6%;置信度為:15/25=60%;提升度為:60%/35%=1.71。 若系統(tǒng)設(shè)置最小支持度閾值為5%,最小置信度閾值為50%,則該規(guī)則將作為發(fā)現(xiàn)的有趣模式(用藥配伍規(guī)律)反饋給用
9、戶。,參數(shù)計(jì)算樣例,麻黃→桂枝,sup=? ; conf=? ; lift=?,目錄,解決的問(wèn)題關(guān)聯(lián)規(guī)則相關(guān)理論基礎(chǔ)SPSS CLEMENTINE中實(shí)現(xiàn)的關(guān)聯(lián)規(guī)則挖掘算法數(shù)據(jù)格式需求模型建立與參數(shù)設(shè)置案例:仲景方配伍規(guī)律挖掘,√,數(shù)據(jù)格式需求——表格格式,,數(shù)據(jù)格式需求——交易格式,目前通常收集的數(shù)據(jù)格式,CLEMENTINE中實(shí)現(xiàn)的關(guān)聯(lián)規(guī)則挖掘算法需要的格式,,,模型建立與參數(shù)設(shè)置,仲景方數(shù)據(jù)集運(yùn)行CLEM
10、ENTINE建立數(shù)據(jù)流參數(shù)設(shè)置,數(shù)據(jù)流,數(shù)據(jù)源節(jié)點(diǎn),類(lèi)型節(jié)點(diǎn),模型節(jié)點(diǎn)——fields標(biāo)簽,模型節(jié)點(diǎn)——model標(biāo)簽,目錄,解決的問(wèn)題關(guān)聯(lián)規(guī)則相關(guān)理論基礎(chǔ)SPSS CLEMENTINE中實(shí)現(xiàn)的關(guān)聯(lián)規(guī)則挖掘算法案例:仲景方配伍規(guī)律挖掘問(wèn)題仲景方數(shù)據(jù)集仲景方數(shù)據(jù)預(yù)處理仲景方配伍規(guī)律挖掘,√,事務(wù)格式,,,,數(shù)據(jù)流窗口,,數(shù)據(jù)源節(jié)點(diǎn),,類(lèi)型節(jié)點(diǎn)設(shè)置,,模型節(jié)點(diǎn)設(shè)置,,結(jié)果節(jié)點(diǎn),,,分析結(jié)果,,問(wèn)題,仲景方,即張仲景所創(chuàng)
11、方劑,因其配伍嚴(yán)謹(jǐn)、療效卓著,被后世尊奉為經(jīng)方??偨Y(jié)張仲景的用藥配伍規(guī)律分別從八綱中的寒、熱、虛、實(shí);病位中的表里、五臟六腑、六經(jīng)、仲景方出處等角度分別總結(jié)張仲景治療寒、熱、虛、實(shí)等諸證的遣方用藥規(guī)律。,仲景方數(shù)據(jù)集,選擇張仲景所著《傷寒論》中方劑113首,《金匱要略》中方劑205首,共318首方劑,構(gòu)建了含“ID、方名、出處、功效、主治、藥物組成”等字段的仲景方數(shù)據(jù)集。查看《傷寒論》、《金匱要略》原始數(shù)據(jù)查看仲景方數(shù)據(jù)集,仲景
12、方數(shù)據(jù)預(yù)處理,空缺值處理中藥名規(guī)范化藥物組成結(jié)構(gòu)化方劑排重方劑歸類(lèi)與結(jié)構(gòu)化格式轉(zhuǎn)換,仲景方數(shù)據(jù)預(yù)處理——空缺值處理,刪除無(wú)藥物組成等信息的方劑7首,余311首方劑,,查看原始數(shù)據(jù),仲景方數(shù)據(jù)預(yù)處理——中藥名規(guī)范化,規(guī)范化 “藥物組成” 字段中的中藥名刪除已不再使用的29味藥物,如 “白魚(yú)”、“雞屎白 ”; 更改17味中藥的名稱,如“柏葉”改為“側(cè)柏葉”;處理同藥異名,“赤硝”、“芒硝”、“硝石”規(guī)范使用藥名“芒硝”;處
13、理同名異藥,如“芍藥” 拆分為“白芍”與“赤芍”。經(jīng)中藥名規(guī)范化后,仲景方藥物組成中涉及的藥物由172味變?yōu)?32味。,查看原始數(shù)據(jù),仲景方數(shù)據(jù)預(yù)處理——藥物組成結(jié)構(gòu)化,,查看原始數(shù)據(jù),仲景方數(shù)據(jù)預(yù)處理——方劑排重,方劑排重的原則如果兩首方劑藥物組成相同,且各藥物用量比例相同,就可以判為相同方劑。使藥劑量的少許差異不會(huì)導(dǎo)致兩首方劑功效、主治的差異,因此仍然能判斷為相同方劑,如“姜、草、棗”一類(lèi)作為“使”藥使用時(shí),少許用量差異則忽略
14、不計(jì)。 排除重復(fù)方劑43首,余268首方劑。,查看原始數(shù)據(jù),仲景方數(shù)據(jù)預(yù)處理——方劑歸類(lèi),分別從病性(寒熱虛實(shí))、病位(五臟六腑)、六經(jīng)、出處(傷寒、金匱)等角度對(duì)仲景方進(jìn)行歸類(lèi),查看原始數(shù)據(jù),仲景方數(shù)據(jù)預(yù)處理——方劑歸類(lèi)結(jié)構(gòu)化,查看原始數(shù)據(jù),格式轉(zhuǎn)換,挖掘的主題張仲景主治寒熱證的用藥規(guī)律數(shù)據(jù)集成集成“藥物組成結(jié)構(gòu)化”&“方劑歸類(lèi)結(jié)構(gòu)化”調(diào)整數(shù)據(jù)分組結(jié)構(gòu)化轉(zhuǎn)換為三元組方式,仲景方配伍規(guī)律挖掘,關(guān)聯(lián)規(guī)則挖掘分類(lèi)關(guān)聯(lián)規(guī)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于分類(lèi)關(guān)聯(lián)規(guī)則的仲景方挖掘研究.pdf
- 《張聿青醫(yī)案》活用仲景方的配伍規(guī)律研究.pdf
- 關(guān)聯(lián)規(guī)則挖掘
- 半夏瀉心湯配伍規(guī)律數(shù)據(jù)挖掘方法初探.pdf
- 基于時(shí)空關(guān)聯(lián)規(guī)則的標(biāo)繪數(shù)據(jù)挖掘研究——以旅游標(biāo)繪數(shù)據(jù)挖掘?yàn)槔?pdf
- 基于數(shù)據(jù)挖掘技術(shù)的方劑配伍規(guī)律探索研究.pdf
- 方劑配伍規(guī)律數(shù)據(jù)挖掘的研究現(xiàn)狀及思考
- 基于數(shù)據(jù)挖掘的方劑配伍規(guī)律研究方法探討.pdf
- 數(shù)據(jù)挖掘課件第3章關(guān)聯(lián)規(guī)則挖掘理論和算法(new)
- 淺述仲景使用烏頭的配伍減毒方法
- 教學(xué)信息關(guān)聯(lián)規(guī)則挖掘.pdf
- 關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 肺脹方配伍用藥規(guī)律研究.pdf
- 隱私保護(hù)關(guān)聯(lián)規(guī)則挖掘.pdf
- 時(shí)序關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 數(shù)據(jù)挖掘課程設(shè)計(jì)報(bào)告---關(guān)聯(lián)規(guī)則挖掘系統(tǒng)
- 數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 關(guān)聯(lián)規(guī)則在電力負(fù)荷變化規(guī)律挖掘中的應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論