论数据挖掘方法及应用 随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道

admin2020-04-30  59

问题 论数据挖掘方法及应用
    随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover  in  Database,KDD),是识别数据库中以前不知道的、新颖的、潜在有用的和最终可被理解的模式的非平凡过程。数据挖掘是数据库知识发现过程的一个步骤,其目标就是要智能化和自动化地把数据转换为有用的信息和知识。
    请围绕“数据挖掘方法及应用”论题,依次从以下三个方面进行论述。
详细阐述三种常用的数据挖掘方法。

选项

答案详细阐述三种常用的数据挖掘方法。 1.关联规则挖掘。关联规则挖掘的典型问题是:给定一个销售交易的数据库,要求发现数据项之间的重要关联性,即在一个交易中出现某些数据项蕴含着其他一些数据项也可能会在同一交易中出现。例如许多顾客在购买尿布的同时也购买啤酒的结论就是通过关联规则分析所得到的结果。关联规则分析是一个从现象到本质的揣测推理过程。也就是说,通过关联分析所得到的结果,仅仅是一种可能的因果关系,它能够协助业务专家对事物的本质进行分析,深化对事物关系的认识,但需要业务专家加以确认,并予以合理的解释,才能够成为对决策进行指导的规律。 2.特征描述。数据库中通常存放大量的细节数据,然而,用户常常希望能够得到对于所关心的一类数据的简洁概貌描述。特征描述是对月标类数据的一般特征或特性进行汇总,并以直观易理解的方式显示给用户。通常,用户首先通过数据库查询来对目标类数据进行查询,例如为研究上一年在某超市消费超过1000美元以上的顾客特征,可以通过执行一个SOL查询收集关于这些产品的数据。特征描述通常采用的方法是进行数据概化,将庞大的任务相关的数据集从较低的概念层抽象到较高的概念层。例如,对于上述消费超过1000美元以上的顾客,特征描述的结果可能是顾客的一般轮廓,如年龄在40至50岁之间、已婚、有工作等。 3.分类分析。分类分析是找出数据集中各组对象的共同特征,并建立分类模型,从而能够将数据集中的其他对象分到不同的组中分类也称作制导的学习,为了建立分类模型,需要有一个用做训练集的示例数据库E,其中的每个元组都有一个给定的类标识。分类过程是首先分析训练集中的数据,根据每个类中数据的特征为每个类生成分类模型,然后用得到的分类模型对未知类别的数据进行分类。表示分类模型的一种常用方法是决策树。 4.聚类分析。若干个相似的数据对象组合在一起称作一个聚簇。聚类分析是将数据集分割为若干个有意义的聚簇的过程。聚类分析也称作无制导的学习,因为聚类分析与分类分析不同,它不依赖于没有事先确定的类,也没有已具有类标识的训练集。好的聚类分析算法应该使得所得到的聚簇内的相似性很高,而不同的聚簇间的相似性很低。

解析
转载请注明原文地址:https://kaotiyun.com/show/jeQZ777K
0

最新回复(0)