首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品 现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )
设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品 现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )
admin
2020-12-02
49
问题
设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品
现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )
选项
A、啤酒 → 尿布
B、(面包,尿布)→ 牛奶
C、面包 → 牛奶
D、(面包,啤酒)→ 尿布
答案
A
解析
关联规则是形如X->Y的蕴涵表达式。关联规则的强度可以用它的支持度(s)和置信度(c)度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度。两者可以用公式表示:
s(X->Y)=(X∪Y)N
c(X->Y)=(X∪Y)(X)
从题目中可以看到事务总数是5,A的{啤酒、尿布}支持度计数是3,{啤酒}支持计数是3,所以s=0.6,c=1。同理可得B{面包、尿布}支持计数为3,{面包、尿布、牛奶}支持计数是2,所以s=0.4,c=2/3。C中,{面包、牛奶}支持计数为3,{面包}支持计数为4,所以s=0.6,c=0.75。D中,{面包、啤酒}支持计数为2,{面包、啤酒、尿布}支持计数为2,所以s=0.4,c=1。综上所述,结果选A。
转载请注明原文地址:https://kaotiyun.com/show/F5lZ777K
本试题收录于:
三级数据库技术题库NCRE全国计算机三级分类
0
三级数据库技术
NCRE全国计算机三级
相关试题推荐
在下面列出的数据模型中,哪一个是概念数据模型?()
在关系模式R<U,F>中,如果X→Y,且存在X的一个真子集X’,有X’→Y’,则称Y对X的依赖为【】函数依赖。
SQL语言规定对数据库中的表能够执行授予权限和收回权限命令的用户
下列关于“分布式数据库系统”的叙述中,正确的是
文件系统采用二级文件目录,主要是为
进程调度有各种各样的算法,如果选择算法不恰当,就会出现什么现象?
隔离是操作系统安全保障措施之一,分为物理隔离、时间隔离、逻辑隔离和()。
在SQL中,关系模式被称为"基本表",存储模式称为"存储文件",子模式称为"视图",下列说法不正确的是
如果要求一个线性表既能较快地查找,又能适应动态变化的要求,则可采用的方法是
下列哪一个与数据库日志无关
随机试题
煎煮大黄牡丹汤时,应当后下的药是()
公文写作的特点。
在某地先后发生两事件,静止于该地的甲测得时间间隔为0.8s,若相对于甲做匀速直线运动的乙测得时间间隔为1.0s,则乙相对于甲的运动速度与真空中光速的比值是______。
患者,女,39岁,有风湿性心脏病史,心尖区隆隆样舒张期杂音和3/6级吹风样收缩期杂音,初步诊断为
针对审计工作底稿复核,以下说法中,正确的是()。
如果批产品不合格品率为0.10,用(10,0)的抽样方案对N=1000的多批产品抽样检验,则平均检出质量为()。
下列关于青海三江源国家生态保护综合试验区的表述,错误的是()。
试设计一算法,使得在尽可能少的时间内重排数组,将所有取负值的关键字放在所有取非负值的关键字之前,并分析算法的时间复杂度。
Patriciapurchasedxmetersoffencing.Sheoriginallyintendedtouseallofthefencingtoencloseasquareregion,butlater
HowInterpretersWork?I.UnderstandingA.Aboutwordsandexpressions—【T1】________wordsmaybeleftout:
最新回复
(
0
)