1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

时间:2022-07-14 07:19:45

相关推荐

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

文章目录

一、 置信度二、 置信度 示例

参考博客 :

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

一、 置信度

关联规则 X⇒Y\rm X \Rightarrow YX⇒Y 的置信度 ,

表示 数据集 D\rm DD 中包含 X\rm XX 项集的事物 , 同时有多大可能性包含 Y\rm YY 项集 ,

等于 项集 X∪Y\rm X \cup YX∪Y 的支持度 与 项集 X\rm XX 的支持度 比值 ;

公式为 :

confidence(X⇒Y)=support(X∪Y)support(X)\rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=support(X)support(X∪Y)​

二、 置信度 示例

示例 :数据集 D\rm DD 为 :

求关联规则 尿布⇒啤酒\rm 尿布 \Rightarrow 啤酒尿布⇒啤酒 的置信度 ???

根据上述公式

confidence(X⇒Y)=support(X∪Y)support(X)\rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=support(X)support(X∪Y)​

计算 X⇒Y\rm X \Rightarrow YX⇒Y 置信度 ;

1 . 计算 support(X∪Y)\rm support (X \cup Y)support(X∪Y) 支持度 :

Support(X⇒Y)=Support(X∪Y)=count(X∪Y)count(D)\rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)}Support(X⇒Y)=Support(X∪Y)=count(D)count(X∪Y)​

support(X∪Y)\rm support (X \cup Y)support(X∪Y) 指的是 数据集 D\rm DD 中含有项集 X∪Y\rm X \cup YX∪Y 的事务个数 ;

含有 X∪Y={尿布,啤酒}\rm X \cup Y=\{ 尿布 , 啤酒 \}X∪Y={尿布,啤酒} 项集的事务有 事务 2\rm 22 , 事务 333 , 事务 444 , 得出 :

count(X∪Y)=3\rm count (X \cup Y) = 3count(X∪Y)=3

count(D)\rm count(D)count(D) 指的是 数据集 D\rm DD 的事务总数 ; 得出

count(D)=5\rm count(D) = 5count(D)=5

计算支持度结果 :

Support(X⇒Y)=Support(X∪Y)=count(X∪Y)count(D)\rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)}Support(X⇒Y)=Support(X∪Y)=count(D)count(X∪Y)​

Support(X)=Support(X∪Y)=35\rm Support (X) = Support (X \cup Y) = \cfrac{3}{5}Support(X)=Support(X∪Y)=53​

2 . 计算 Support(X)\rm Support (X)Support(X) 支持度,项集 X={奶粉}\rm X=\{ 奶粉 \}X={奶粉}

根据上述公式 Support(X)=count(X)count(D)\rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=count(D)count(X)​ 计算支持度 ;

count(X)\rm count (X)count(X) 指的是 数据集 D\rm DD 中含有项集 X\rm XX 的事务个数 ;

含有 X={奶粉}\rm X=\{ 奶粉 \}X={奶粉} 项集的事务有 事务 1\rm 11 , 事务 333 , 事务 444 , 事务 555 , 得出 :

count(X)=4\rm count (X) = 4count(X)=4

count(D)\rm count(D)count(D) 指的是 数据集 D\rm DD 的事务总数 ; 得出

count(D)=5\rm count(D) = 5count(D)=5

则计算支持度 :

Support(X)=count(X)count(D)\rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=count(D)count(X)​

Support(X)=45\rm Support (X) = \cfrac{4}{5}Support(X)=54​

3 . 求最终置信度

confidence(X⇒Y)=support(X∪Y)support(X)\rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=support(X)support(X∪Y)​

confidence(X⇒Y)=3545=34\rm confidence (X \Rightarrow Y) = \cfrac{ \dfrac{3}{5}}{\dfrac{4}{5}} = \cfrac{3}{4}confidence(X⇒Y)=54​53​​=43​

最终置信度为 34\cfrac{3}{4}43​

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。