设有如下所示的某商场购物记录集合。每个购物篮中包含若干商品: 现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )。

admin2021-06-28  20

问题 设有如下所示的某商场购物记录集合。每个购物篮中包含若干商品:

现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是(    )。

选项 A、啤酒→尿布
B、(面包,尿布)→牛奶
C、面包→牛奶
D、(面包,啤酒)→尿布

答案A

解析 关联规则是形如x一>Y的蕴涵表达式。关联规则的强度可以用它的支持度(s)和置信度(c)度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度。两者可以用公式表示:

从题目中可以看到事务总数是5,A的{啤酒、尿布}支持度计数是3,{啤酒}支持计数是3,所以s=0.6,c=1。同理可得B{面包、尿布}支持计数为3,{面包、尿布、牛奶}支持计数是2,所以s=0.4,c=2/3。C中,{面包、牛奶}支持计数为3,{面包}支持计数为4,所以s=0.6,c=0.75。D中,{面包、啤酒}支持计数为2,{面包、啤酒、尿布}支持计数为2,所以s=0.4,c=1。综上所述,应选择A选项。
转载请注明原文地址:https://kaotiyun.com/show/7KlZ777K
0

最新回复(0)