tceic.com
学霸学习网 这下你爽了
赞助商链接
当前位置:首页 >> 医学 >>

关联规则挖掘——以仲景方配伍规律挖掘为例(3)


关联规则挖掘 ——以仲景方配伍规律挖掘为例

杨雪梅 博士 中医证研究基地 yxm_wj@sina.com

目录


? ?

?

?

解决的问题 关联规则相关理论基础 SPSS CLEMENTINE中实现的关联规则 挖掘算法 案例:仲景方配伍规律挖掘

解决的问题——关联
?

?

?

购物篮问题:顾客购买了牛奶后,购买面包的可 能性有多大 药性规律问题:是否酸味的药常入肝经?比例是 多少?如果具有酸味,那么该药入肝经的比例会 比入肝经药占全部药物的比例提升多少? 处方问题:**专家处方中开出生姜*桂枝*白芍三 味药用于治疗寒证的次数有多少?比例有多少? 专家处方中开出生姜*桂枝*白芍三味药用于治疗 寒证的比例与所治疗病证中寒证出现的比例之间 的比值是多少?

处方集举例
? ?

?
? ?

1麻黄;桂枝;白芍 2麻黄;桂枝;白芍;干姜 3麻黄;白术;干姜 4桂枝;白芍;白术;干姜 5麻黄;桂枝;白术;干姜

目录
?


?

解决的问题 关联规则相关理论基础
– 关联规则 – 分类关联规则 – 兴趣度参数

?
?

SPSS CLEMENTINE中实现的关 联规则挖掘算法 案例:仲景方配伍规律挖掘

关联规则
?

?

?

关联规则 (Association Rule)是形如R: A→B的规则, 满足A∩B=Φ & sup(R)≥min_sup & conf (R)≥min_conf。 其中,A,B均为属性集合,sup(R)为规则R的支持度, min_sup为最小支持度阈值;conf (R)为规则R的置信 度,min_conf为最小置信度阈值。 如:泽泻 白术 猪苓 => 茯苓

分类关联规则
?

?

?

分类关联规则 (Class Association Rule)是形 如R: C→D的规则,满足C∩D=Φ & sup(R)≥min_sup & conf (R)≥min_conf。 其中,C为条件属性(或中药)集合,D为决策 属性(或方剂分类);sup(R)为规则R的支持度, min_sup为最小支持度阈值;conf (R)为规则 R的置信度,min_conf为最小置信度阈值。 如:桂枝*生姜*白芍→寒证

兴趣度参数
– 规则R的支持度定义如下: sup(R) = P(A∩B) ; P(A∩B)为A和B同时出现的概率; – 规则R的置信度定义如下: conf(R) = P(B|A); P(B|A)为在A出现条件下出现B的条件概率。 – 规则R的提升度定义如下: lift(R)= P(B|A)/ P(B); 条件A的出现对B出现概率的提升,说明A与B之间 的相关性,大于1为相关,小于1则不相关

兴趣度参数
?

?

支持度(support)、置信度 (confidence)、提升度(或作用度,lift) 是描述分类关联规则兴趣度的三项重要指标, 支持度反映规则的普遍性,置信度反映规则 的可靠性,提升度反应规则两侧属性之间的 相关性,通常选择支持度、置信度、提升度 均较高的规则作为发现的有趣模式。 关联规则挖掘算法通常需要设置两个参数: 即最小支持度阈值min_sup为5%;最小置 信度阈值min_conf为50%。

关联规则——举例
?

例如: 泽泻 白术 猪苓 => 茯苓 sup=0.1565; conf=0.9684; lift=2.24

共有591首脾胃湿热方中有92首方剂同 时出现泽泻、白术、猪苓、茯苓四味中药, 故规则的支持度为15.65%;因95首同时出 现泽泻、白术、猪苓三味中药的脾胃湿热方 中有92首方剂同时出现茯苓这味药,故上述 规则的置信度为96.84%。因茯苓出现的概 率43%,则提升度为2.24.

分类关联规则——举例
?

?

?

例如:桂枝*生姜*白芍→寒证 (sup= 5.6%, conf=60%, lift=1.71) 仲景方共268首,桂枝、生姜、白芍三味中药同 时出现在治疗寒证方剂中的频数为15,桂枝、生姜、 白芍三味药同时出现在仲景方中的频数为25,寒证出 现的概率=35%,则上述规则的支持度为: 15/268=5.6%;置信度为:15/25=60%;提升 度为:60%/35%=1.71。 若系统设置最小支持度阈值为5%,最小置信度阈值 为50%,则该规则将作为发现的有趣模式(用药配 伍规律)反馈给用户。

参数计算样例
ID 麻黄 桂枝 1 2 3 1 1 1 1 1 0 白芍 白术 干姜 1 1 0 0 0 1 0 1 1

麻黄→桂枝

4
5

0
1

1
1

1
0

1
1

1
1

sup=?

; conf=? ; lift=?

目录
? ?


?

解决的问题 关联规则相关理论基础 SPSS CLEMENTINE中实现的关 联规则挖掘算法
– 数据格式需求 – 模型建立与参数设置

?

案例:仲景方配伍规律挖掘

数据格式需求——表格格式
ID 019 半夏厚 朴汤 020 半夏麻 黄丸 金匮 要略 金匮 要略 方名 出处 组成 半夏一升 厚朴三两 茯苓四两 生姜五两 干苏叶二两 半夏等分 麻黄等分

ID 019 020

半夏 1 1

厚朴 1 0

茯苓 1 0

生姜 1 0

干苏叶 1 0

麻黄 0 1

数据格式需求——交易格式
?

目前通常收集的数据格式
ID Index1 方名 出处 组成 半夏一升 厚朴三两 茯苓四两 生姜五两 干苏叶二两 半夏等分 麻黄等分 019 019 019 019 019

ID 019

半夏 厚朴

半夏厚 朴汤
020 半夏麻 黄丸

金匮 要略
金匮 要略

茯苓
生姜 干苏叶

020

半夏
麻黄

?

CLEMENTINE中实现的关
联规则挖掘算法需要的格式

020

模型建立与参数设置
?

仲景方数据集

?

运行CLEMENTINE
建立数据流 参数设置

?

?

数据流

数据源节点

类型节点

模型节点——fields标签

模型节点——model标签

目录
? ? ?
√ ?

解决的问题 关联规则相关理论基础 SPSS CLEMENTINE中实现的关联规 则挖掘算法 案例:仲景方配伍规律挖掘
– – – – 问题 仲景方数据集 仲景方数据预处理 仲景方配伍规律挖掘

事务格式

数据流窗口

数据源节点

类型节点设置

模型节点设置

结果节点

分析结果

问题
?

? ?

仲景方,即张仲景所创方剂,因其配伍 严谨、疗效卓著,被后世尊奉为经方。 总结张仲景的用药配伍规律 分别从八纲中的寒、热、虚、实;病位 中的表里、五脏六腑、六经、仲景方出 处等角度分别总结张仲景治疗寒、热、 虚、实等诸证的遣方用药规律。

仲景方数据集
?

选择张仲景所著《伤寒论》中方剂113首, 《金匮要略》中方剂205首,共318首方剂, 构建了含“ID、方名、出处、功效、主治、 药物组成”等字段的仲景方数据集。

? ?

查看《伤寒论》、《金匮要略》原始数据 查看仲景方数据集

仲景方数据预处理
– 空缺值处理 – 中药名规范化 – 药物组成结构化 – 方剂排重 – 方剂归类与结构化 – 格式转换

仲景方数据预处理——空缺值处理
删除无药物组成等信息的方剂7首,余311首方剂
ID 081 … 249 方名 附子汤 … 文蛤散 出处 金匮要略 … 伤寒论 功效 温阳散寒,暖 宫安胎 … 主治 妊娠阳虚寒盛腹 痛证 … 药物组 成

?查看原始数据

仲景方数据预处理——中药名规范化
?

规范化 “药物组成” 字段中的中药名
– 删除已不再使用的29味药物,如 “白鱼”、“鸡 屎白 ”; – 更改17味中药的名称,如“柏叶”改为“侧柏叶”; – 处理同药异名,“赤硝”、“芒硝”、“硝石”规 范使用药名“芒硝”; – 处理同名异药,如“芍药” 拆分为“白芍”与 “赤芍”。

经中药名规范化后,仲景方药物组成中涉及 的药物由172味变为132味。?查看原始数据

仲景方数据预处理——药物组成结构化
ID 方名 药物组成 知母六两 甘草二两 石膏一斤 粳 米二合 桂枝三两 知母六两 石膏一斤 甘草三两 粳 米六合 人参三两

001 白虎加桂枝汤 002 白虎加人参汤

ID 001 002 …

方名 白虎加 桂枝汤 白虎加 人参汤 …

组 成 … … …

知 母 1 1 …

甘 草 1 1 …

石 膏 1 1 …

粳 米 1 1 …

桂 枝 1

人 参

1 … …
?查看原始数据

仲景方数据预处理——方剂排重
?

方剂排重的原则
– 如果两首方剂药物组成相同,且各药物用量 比例相同,就可以判为相同方剂。 – 使药剂量的少许差异不会导致两首方剂功效、 主治的差异,因此仍然能判断为相同方剂, 如“姜、草、枣”一类作为“使”药使用时, 少许用量差异则忽略不计。

?

排除重复方剂43首,余268首方剂。
?查看原始数据

仲景方数据预处理——方剂归类
?

分别从病性(寒热虚实)、病位(五脏六腑)、六经、 出处(伤寒、金匮)等角度对仲景方进行归类
功效 主治 根据所治 根据所治疾 疾病的性 病的部位归 质归类 类 热、寒 表里 根据所治疾 病的病变过 程归类 根据方 剂出处 归类 金匮

方名

白虎加桂 清里热,解 枝汤 外寒 白术散 辛寒清热

温疟 阳明病表里俱 热证 阳虚风湿湿重 证

虚、寒

脾胃

金匮

白通加猪 通阳行水化 胆汁汤 湿

虚、寒



伤寒

少阴病

?查看原始数据

仲景方数据预处理——方剂归类结构化
ID 001 002 004 006 007 008 方名 白虎加桂枝汤 白虎加人参汤 白虎汤 白术散 白通加猪胆汁汤 白通汤 根据所治疾病 的性质归类 热、寒 热 热 虚、寒 虚、寒 虚、寒 寒 寒 寒 寒 寒 热 热 热 热 虚 虚 虚 虚 实

?查看原始数据

格式转换
?

挖掘的主题
– 张仲景主治寒热证的用药规律

?

数据集成
– 集成“药物组成结构化”&“方剂归类结构 化” – 调整数据分组

?

结构化转换为三元组方式

仲景方配伍规律挖掘
关联规则挖掘 分类关联规则挖掘

?

?

模式评估
?

?

(1)挖掘出的关联规则和分类关联规则 可以作为专业领域内已公认知识的佐证。 (2)有些模式的价值目前尚不能得到认 可,可以通过文献考证、专家认可、临 床或试验等来确认模式的有效性。

试验考核内容 ——3月21日之前交报告
? ?

仲景方用药关联规则的挖掘 仲景方用药分类关联规则挖掘
– 寒、热、寒热错杂 – 虚、实、虚实错杂



推荐相关:
网站首页 | 网站地图
All rights reserved Powered by 学霸学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com