首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
论数据挖掘方法及应用 随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道
论数据挖掘方法及应用 随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道
admin
2020-04-30
115
问题
论数据挖掘方法及应用
随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道的、新颖的、潜在有用的和最终可被理解的模式的非平凡过程。数据挖掘是数据库知识发现过程的一个步骤,其目标就是要智能化和自动化地把数据转换为有用的信息和知识。
请围绕“数据挖掘方法及应用”论题,依次从以下三个方面进行论述。
详细阐述三种常用的数据挖掘方法。
选项
答案
详细阐述三种常用的数据挖掘方法。 1.关联规则挖掘。关联规则挖掘的典型问题是:给定一个销售交易的数据库,要求发现数据项之间的重要关联性,即在一个交易中出现某些数据项蕴含着其他一些数据项也可能会在同一交易中出现。例如许多顾客在购买尿布的同时也购买啤酒的结论就是通过关联规则分析所得到的结果。关联规则分析是一个从现象到本质的揣测推理过程。也就是说,通过关联分析所得到的结果,仅仅是一种可能的因果关系,它能够协助业务专家对事物的本质进行分析,深化对事物关系的认识,但需要业务专家加以确认,并予以合理的解释,才能够成为对决策进行指导的规律。 2.特征描述。数据库中通常存放大量的细节数据,然而,用户常常希望能够得到对于所关心的一类数据的简洁概貌描述。特征描述是对月标类数据的一般特征或特性进行汇总,并以直观易理解的方式显示给用户。通常,用户首先通过数据库查询来对目标类数据进行查询,例如为研究上一年在某超市消费超过1000美元以上的顾客特征,可以通过执行一个SOL查询收集关于这些产品的数据。特征描述通常采用的方法是进行数据概化,将庞大的任务相关的数据集从较低的概念层抽象到较高的概念层。例如,对于上述消费超过1000美元以上的顾客,特征描述的结果可能是顾客的一般轮廓,如年龄在40至50岁之间、已婚、有工作等。 3.分类分析。分类分析是找出数据集中各组对象的共同特征,并建立分类模型,从而能够将数据集中的其他对象分到不同的组中分类也称作制导的学习,为了建立分类模型,需要有一个用做训练集的示例数据库E,其中的每个元组都有一个给定的类标识。分类过程是首先分析训练集中的数据,根据每个类中数据的特征为每个类生成分类模型,然后用得到的分类模型对未知类别的数据进行分类。表示分类模型的一种常用方法是决策树。 4.聚类分析。若干个相似的数据对象组合在一起称作一个聚簇。聚类分析是将数据集分割为若干个有意义的聚簇的过程。聚类分析也称作无制导的学习,因为聚类分析与分类分析不同,它不依赖于没有事先确定的类,也没有已具有类标识的训练集。好的聚类分析算法应该使得所得到的聚簇内的相似性很高,而不同的聚簇间的相似性很低。
解析
转载请注明原文地址:https://kaotiyun.com/show/jeQZ777K
本试题收录于:
系统分析师下午论文考试题库软考高级分类
0
系统分析师下午论文考试
软考高级
相关试题推荐
输入一个整数数组,判断该数组是不是某二元查找树的后序遍历的结果。如果是返回true,否则返回false。例如输入5、7、6、9、11、10、8,由于这一整数序列是如下树的后序遍历结果:因此返回true。如果输入7、4、6、5,没有哪棵树的后序遍历
现在小明一家过一座桥,过桥的时候是黑夜,所以必须有灯。现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要八秒,小明的爷爷要12秒。每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。问小明一家如何过桥?(原本
输入一个整数,求该整数的二进制表达中有多少个1。例如输入10,由于其二进制表示为1010,有两个1,因此输出2。
ASP.net的身份验证方式有哪些?分别是什么原理?
C#中的接口和类有什么异同。
如何理解委托?
在搜狐网页中选择一个新闻网页,然后把网页信息复制到word文档中。
将CuteFTP站点管理器中的普通FTP站点文件夹下标识名为Internet的站点,设置成【使用全局设置】来检查下载时文件大小。
关于Excel中创建图表,叙述正确的是______A.嵌入式图表建在工作表之内,与数据同时显示B.如果需要修饰图表,只能使用格式栏上的按钮C.创建了图表之后,便不能修改D.图表工作表建在工作表之外,与数据分开显示
在windows98中,要关闭word,下面叙述中错误的是()。A.双击标题栏左边的图标B.单击文件菜单中的关闭C.单击标题栏右边的“×”D.单击文件菜单的“退出”
随机试题
男孩,5岁,患有结核病,但结核菌素试验阴性,可能是
崔某认识在某国有银行支行营业厅工作的甲、乙,说服二人在他们值班时由崔某前去营业所假装抢劫,所得款项由三人均分。甲、乙表示同意。等到甲、乙值班的时候,崔某拿着一把发令枪冲进营业厅,用枪指着两人,要甲、乙交出钱来。两人假装很害怕,将预先准备好的30万元人民币
对现金周转期理解正确的是()。
恶性淋巴瘤累及颈、腹股沟淋巴结,肝及肺,并伴有发热、盗汗及体重减轻,临床分期属()。
身体成分是指人体总体重非脂肪成分与脂肪成分的比例,它可以粗略地评价人体的胖瘦状况。()
阅读下列材料,回答问题。党的十八大以来,新一届政府取消和下放了多项行政审批事项,为企业“松了绑”、为群众“解了绊”、为市场“腾了位”,也为廉政“强了身”,极大激发了市场活力和社会创造力。在国内外经济形势严峻复杂、国内传统动能减弱的情况下,没有搞强
Unlesswespendmoneytospotandpreventasteroids(小行星)now,onemightcrashintoEarthanddestroylifeasweknowit,saysome
________服务是目前因特网上使用最频繁的一种服务,它在国际之间的交流中发挥着重要作用。
显示或打印汉字时,系统使用的是汉字的()。
A、SheispoorinEnglish.B、Shecan’tspeakEnglish.C、Shehastheabilitytoactinaplay.D、Shedoesn’tliketospeakEnglish
最新回复
(
0
)