首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
admin
2018-05-08
42
问题
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
选项
A、关联分析
B、序列模式分析
C、分类分析
D、聚类分析
答案
C
解析
本题考查数据挖掘基础知识。数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析、序列模式分析、分类分析和聚类分析。
①关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R={Al,A2,…,AP)为{0,1)域上的属性集,r为R上的一个关系,关于r的关联规则表示为
X一*B,其中X∈R,B∈R,且XCIB =¤。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
②序列模式分析(Sequential Pattems):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
④聚类分析(Clustering):聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。
在实际应用的DM系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://kaotiyun.com/show/oGTZ777K
本试题收录于:
数据库系统工程师上午基础知识考试题库软考中级分类
0
数据库系统工程师上午基础知识考试
软考中级
相关试题推荐
团队成员第一次违反了团队的基本规章制度,项目经理对他应该采取(229)形式的沟通方法。
关于典型的大型、复杂信息系统项目,下列做法中,(1)是不正确的。
某软件项目实施过程中产生的一个文档的主要内容如下所示,该文档的主要作用是(343)。
某公司的销售收入状态如下表所示,该公司达到盈亏平衡点时的销售收入是(91)(百万元人民币)。
某公司2013年初计划投资1000万元人民币开发一套中间件产品,预计从2014年开始,年实现产品销售收入1500万元,年市场销售成本1000万元。该产品的系统分析员张工根据财务总监提供的贴现率,制作了如表7-2所示的产品销售现金流量表。根据表7-2中的数据
在选项()中,①代表的技术用于决策分析;②代表的技术用于从数据库中发现知识;①和②的结合为决策支持系统(DSS)开辟了新方向,它们也是③代表的技术的主要组成部分。
根据GB/T12504-2008《计算机软件质量保证计划规范》中的规定,在软件验收时,验证代码与设计文档的一致性、接口规格说明的一致性、设计实现和功能需求的一致性等检查属于__________。
___________指在软件维护阶段,为了检测由于代码修改而可能引入的错误所进行的测试活动。
大型复杂项目一般具有周期较长、规模较大、目标构成复杂等特征,因此大型复杂项目的控制过程与普通项目的控制过程有较大差别。()不属于大型复杂项目控制过程的重要因素。
(2012上项管)入侵检测通过对计算机网路或计算机系统中的若干关键点收集信息并进行分析,发现网络系统中是否有违反安全策略的行为和被攻击的迹象。进行入侵检测的软件和硬件的组合就构成了入侵检测系统。______是入侵检测系统的核心。
随机试题
在HTML中,合并表格垂直单元格使用的标记是()
《谈“流浪汉”》一文的主旨是()
在近代否定汉字的主潮中,明确提出汉字与拼音文字优劣互补主张的学者是()
描述一组对称(或正态)分布资料的变异度时,最适宜选择的指标是
A.BPB.USPC.ChPD.EPE.LF《英国药典》的缩写是()。
某高校自筹资金组织教学楼工程建设,由C建筑公司承建,距工程竣工还有4个月时间。为更进一步发挥该教学楼的功能,该高校拟在教学楼电化教室西侧加建二层小楼,建筑面积216m2,将教学楼中的一些配套设施,如电化教学设备、录像设备以及教师课间休息室等移至该二层小楼内
期货交易所每半年应当对会员遵守期货交易所交易规则及其实施细则的情况进行抽样或者全面检查,并将检查结果报告中国证监会。()
财产保全的方式包括()。
有以下程序:#include<iostream>usingnamespacestd;intmain(){intx=15;while(x>10&&x<50){x
Tidesarecreatedmainlybythepullofthemoonontheearth.Themoon’spullcauseswaterintheo-ceanstobealittledeeper
最新回复
(
0
)