首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
不常用做数据挖掘的方法是(4)。
不常用做数据挖掘的方法是(4)。
admin
2009-05-15
46
问题
不常用做数据挖掘的方法是(4)。
选项
A、人工神经网络
B、规则推导
C、遗传算法
D、穷举法
答案
D
解析
数据挖掘是一类深层次的数据分析。常见和应用最广泛的数据挖掘方法如下。
(1)决策树
决策树方法是指利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支;在每个分支子集中重复建立树的下层结点和分支的过程。国际上最早的、也是最有影响的决策树方法是Quiulan研究的ID3方法。
(2)神经网络
神经网络方法是指模拟人脑神经元结构,完成类似统计学中的判别、回归、聚类等功能,神经网络是一种非线性的模型,主要有三种神经网络模型:前馈式网络、反馈式网络和自组织网络。人工神经网络最大的长处是可以自动地从数据中学习,形成知识,这些知识有些是我们过去未曾发现的,因此它具有较强的创新性。神经网络的知识体现在网络连接的权值上,神经网络的学习主要表现在神经网络权值的逐步计算上。
(3)遗传算法
遗传算法是模拟生物进化过程的算法,它由三个基本过程组成:繁殖(选择)、交叉(重组)、变异(突变)。采用遗传算法可以产生优良的后代,经过若干代的遗传,将得到满足要求的后代,即问题得解。
(4)关联规则挖掘算法
关联规则是描述数据之间存在关系的规则,形式为“A1A2…An…B1B2…Bn”。一般分为两个步骤:求出大数据项集;用大数据项集产生关联规则。
除了上述的常用方法外,还有粗集方法、模糊集合方法、Bayesian Belief Netords、最邻近算法(k-nearest neighbors method(kNN))等。
无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析(Associations)、序列模式分析(Sequential Patterns)、分类分析(Classifiers)和聚类分析(Clustering)。
(1)关联分析
关联分析的目的是为了挖掘出隐藏在数据间的相互关系。若设R={A1,A2,…, AP}为{0,1}域上的属性集,r为R上的一个关系,关于r的关联规则表示为X→B,其中X∈R,B∈R,且X∩B=f。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。
在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
(2)序列模式分析
序列模式分析的目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
(3)分类分析
分类分析时首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
(4)聚类分析
聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有做任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。
在实际应用的数据挖掘系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://kaotiyun.com/show/dKUZ777K
本试题收录于:
数据库系统工程师上午基础知识考试题库软考中级分类
0
数据库系统工程师上午基础知识考试
软考中级
相关试题推荐
安全审计是保障计算机系统安全的重要手段之一,其作用不包括(1)。
某地政府采取询价方式采购网络设备,______是符合招投标法要求的。
关于电子政务与传统政务的比较,以下论述不正确的是______。A.办公手段不同B.与公众沟通方式存在差异C.业务流程一致D.电子政务是政务活动中一种新的表现形式
按照《中华人民共和国招标投标法》的规定,下列说法中正确的是______。A.投标人在向招标方递交投标文件后,就无权对投标文件进行补充、修改或者撤回了B.两个以上法人或者其他组织可以组成一个联合体,以一个投标人的身份共同投标。由同一专业的单位组成的联合体
若某计算机系统是由1000个元器件构成的串联系统,且每个元器件的失效率均为101/h,在不考虑其他因素对可靠性的影响时,该计算机系统的平均故障间隔时间为(194)小时。
常见的软件开发模型有瀑布模型、演化模型、螺旋模型、喷泉模型等。其中(31)适用于需求明确或很少变更的项目,(32)主要用来描述面向对象的软件开发过程。(31)
根据统计显示,80%的网络攻击源于内部网络,因此,必须加强对内部网络的安全控制和防范。下面的措施中,无助于提高同一局域网内安全性的措施是(51)。
甲公司拟开发一个新的产品,欲委托乙公司进行开发,在基本意向达成一致以后,甲乙双方就产品开发的细节问题进行协商,在协商过程中,该产品的有关商业和技术指标被乙方知晓,但后来因为开发价格问题,此次合作未成。于是乙公司自行组织开发该产品并进行销售,则(
_______是指CPU一次可以处理的二进制数的位数,它直接关系到计算机的计算精度、速度等指标;运算速度是指计算机每秒能执行的指令条数,通常以_______为单位来描述。(6)
随机试题
脾的阳气失调病机,下列哪项不确切
患者女,32岁。因关节区疼痛,开口受限2个月就诊,既往有左侧关节弹响病史1年。临床检查见开口度1.8cm,开口型左偏,关节区疼痛,关节区无弹响,无摩擦音。不可复性盘前移位治疗方法是
患儿,3岁。体重14kg,身长86cm。该患儿的生长发育状况为
项目财务评价指标中,考虑时间因素指标的是()。
王某于2013年8月1日向孙某发信称:“我处有电脑一批,每台5000元,如需要请于8月7日前回复”,并附上电脑配置单。孙某于8月5日发出通知,希望购买5台电脑。孙某的通知正常情况下应于8月7日前到达王某处,后因快递公司的原因,于8月9日才到达王某处。王某收
列入城镇土地使用税免税范围的“直接用于农、林、牧、渔业的生产用地”是指直接从事种植、养殖、饲养的专业用地,不包括农副产品加工场地和生活办公用地。()
下列句中划线字的意义和用法不同于其他三项的是()。
研究者发现脑的一定部位的损伤,往往不是导致某一孤立的心理机能的丧失,而是引起一系列障碍,这一现象支持
Mysister’sprofessorhadher______herpapermanytimesbeforeallowinghertopresentittothecommittee.
设有如下函数:FunctionDelSpace(chAsString)AsIntegerDimn%,st$,c$st="":n=0Fork=1ToLen(ch)c=Mid(ch,k,1)Ifc<>""Thenst
最新回复
(
0
)