首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
不常用做数据挖掘的方法是(4)。
不常用做数据挖掘的方法是(4)。
admin
2009-05-15
93
问题
不常用做数据挖掘的方法是(4)。
选项
A、人工神经网络
B、规则推导
C、遗传算法
D、穷举法
答案
D
解析
数据挖掘是一类深层次的数据分析。常见和应用最广泛的数据挖掘方法如下。
(1)决策树
决策树方法是指利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支;在每个分支子集中重复建立树的下层结点和分支的过程。国际上最早的、也是最有影响的决策树方法是Quiulan研究的ID3方法。
(2)神经网络
神经网络方法是指模拟人脑神经元结构,完成类似统计学中的判别、回归、聚类等功能,神经网络是一种非线性的模型,主要有三种神经网络模型:前馈式网络、反馈式网络和自组织网络。人工神经网络最大的长处是可以自动地从数据中学习,形成知识,这些知识有些是我们过去未曾发现的,因此它具有较强的创新性。神经网络的知识体现在网络连接的权值上,神经网络的学习主要表现在神经网络权值的逐步计算上。
(3)遗传算法
遗传算法是模拟生物进化过程的算法,它由三个基本过程组成:繁殖(选择)、交叉(重组)、变异(突变)。采用遗传算法可以产生优良的后代,经过若干代的遗传,将得到满足要求的后代,即问题得解。
(4)关联规则挖掘算法
关联规则是描述数据之间存在关系的规则,形式为“A1A2…An…B1B2…Bn”。一般分为两个步骤:求出大数据项集;用大数据项集产生关联规则。
除了上述的常用方法外,还有粗集方法、模糊集合方法、Bayesian Belief Netords、最邻近算法(k-nearest neighbors method(kNN))等。
无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析(Associations)、序列模式分析(Sequential Patterns)、分类分析(Classifiers)和聚类分析(Clustering)。
(1)关联分析
关联分析的目的是为了挖掘出隐藏在数据间的相互关系。若设R={A1,A2,…, AP}为{0,1}域上的属性集,r为R上的一个关系,关于r的关联规则表示为X→B,其中X∈R,B∈R,且X∩B=f。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。
在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
(2)序列模式分析
序列模式分析的目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
(3)分类分析
分类分析时首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
(4)聚类分析
聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有做任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。
在实际应用的数据挖掘系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://kaotiyun.com/show/dKUZ777K
本试题收录于:
数据库系统工程师上午基础知识考试题库软考中级分类
0
数据库系统工程师上午基础知识考试
软考中级
相关试题推荐
______不是项目成本估算的输入。
以下关于J2EE多层分布式应用模型的对应关系的叙述,______是错误的。
商业智能(BI)的核心技术是逐渐成熟的数据仓库和______。A.联机呼叫技术B.数据整理(ODS)技术C.联机事务处理(OLTP)技术D.数据挖掘(DM)技术
公式______能最准确地计算项目活动的工作量。A.工作量=历时/人员生产率B.工作量=历时/人力资源数量C.工作量=(最乐观时间+4×最可能时间+最悲观时间)/6D.工作量=项目规模/人员生产率
以下关于范围变更的说法错误的是______。
(17)不属于大型项目控制的三要素。
某电影公司计划使用IT系统把全国各地抗击冰灾的感人事迹做成一个有史以来最好的数字格式纪录片,项目承建方允许项目经理使用任何需要的资源,但是项目经理提出的能胜任此任务的最佳人选却正在执行另一个项目。叙述()是正确的。
()是数据仓库系统的一个主要应用,支持复杂的分析操作、侧重决策支持,并且提供多维数据管理环境和直观易懂的查询结果。
(2012下集管)甲软件系统每年因故障中断10次,每次恢复平均20分钟,乙软件系统每年因故障中断2次,每次恢复平均5小时,根据《软件工程产品质量GB/T16260-2006》中可靠性和有效性(或可用性)的定义,下面说法正确的是______。
(2007下系分)系统可靠性的简单度量是平均故障间隔时间(MTBF),其计算公式是______(1);软件可用性是指在某个给定时间点上程序能够按照需求执行的概率,其定义为______(2)(MTTF:MeanTimeToFailure;MTTR:Me
随机试题
NaturallanguageinterfacesenabletheusertocommunicatewiththecomputerinFrench.English,German,orahumanlanguage.So
链栈与顺序栈相比,有一个比较明显的优点即()
A.烟酸B.尼古丁C.苯并芘D.烟焦油E.一氧化碳在烟草中,使人体成瘾的物质是()
针对治疗抗肿瘤药引起的恶心、呕吐等不良反应,可选用的止吐药物是()。
若有一投资项目70%的概率在一年内让自己的投资基金额翻倍,30%的概率让自己的投资金额减半。则该项投资的期望收益率是()。
朝阳公司为一家生产、销售钢材的企业,2012年6月1日库存钢材1万吨,生产成本为每吨4000元,市场销售价格为每吨5000元。朝阳公司预计该批钢材可在10月份销售出去。为了规避钢材价格波动风险,朝阳公司于6月1日在期货市场上卖出了10月份交割的钢材期货1万
中国东方公司为增值税一般纳税人,适用的增值税税率为17%。2006年10月10日,中国东方公司与美国西方租赁公司签订了一份设备租赁合同,合同主要条款如下:(1)租赁标的物:A生产设备(以下简称A设备)。(2)起租日:2006年12月31日。
小宝在南湖餐厅就餐时.丢失手表一块。餐厅工作人员拾得后即交给公安部门。小宝未能在期限内前去认领.公安部门即依有关规定将手表交寄卖商店出售。罗伟从寄卖商店买得手表后。将其送给女朋友小娟。小娟在外出购物中,该手表被一小偷偷去,小偷将这块表以低价格卖给老乡赵二,
工程文件中包含一个模块文件和一个窗体文件。模块文件的程序代码是:PublicXAsIntegerPrivateYAsInteger窗体文件的程序代码是:DimaAsIntegerPriva
下列程序运行后的输出结果是()。#include<iostream.h>voidfun(int,int,int*);voidmain(){intx,y,z;fun(5,6,&x);
最新回复
(
0
)