首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
论数据挖掘方法及应用 随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道
论数据挖掘方法及应用 随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道
admin
2020-04-30
84
问题
论数据挖掘方法及应用
随着信息技术和数据库技术的普遍应用,人类获取数据的能力不断增强,数据库的数量和规模在迅速增加。数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是识别数据库中以前不知道的、新颖的、潜在有用的和最终可被理解的模式的非平凡过程。数据挖掘是数据库知识发现过程的一个步骤,其目标就是要智能化和自动化地把数据转换为有用的信息和知识。
请围绕“数据挖掘方法及应用”论题,依次从以下三个方面进行论述。
详细阐述三种常用的数据挖掘方法。
选项
答案
详细阐述三种常用的数据挖掘方法。 1.关联规则挖掘。关联规则挖掘的典型问题是:给定一个销售交易的数据库,要求发现数据项之间的重要关联性,即在一个交易中出现某些数据项蕴含着其他一些数据项也可能会在同一交易中出现。例如许多顾客在购买尿布的同时也购买啤酒的结论就是通过关联规则分析所得到的结果。关联规则分析是一个从现象到本质的揣测推理过程。也就是说,通过关联分析所得到的结果,仅仅是一种可能的因果关系,它能够协助业务专家对事物的本质进行分析,深化对事物关系的认识,但需要业务专家加以确认,并予以合理的解释,才能够成为对决策进行指导的规律。 2.特征描述。数据库中通常存放大量的细节数据,然而,用户常常希望能够得到对于所关心的一类数据的简洁概貌描述。特征描述是对月标类数据的一般特征或特性进行汇总,并以直观易理解的方式显示给用户。通常,用户首先通过数据库查询来对目标类数据进行查询,例如为研究上一年在某超市消费超过1000美元以上的顾客特征,可以通过执行一个SOL查询收集关于这些产品的数据。特征描述通常采用的方法是进行数据概化,将庞大的任务相关的数据集从较低的概念层抽象到较高的概念层。例如,对于上述消费超过1000美元以上的顾客,特征描述的结果可能是顾客的一般轮廓,如年龄在40至50岁之间、已婚、有工作等。 3.分类分析。分类分析是找出数据集中各组对象的共同特征,并建立分类模型,从而能够将数据集中的其他对象分到不同的组中分类也称作制导的学习,为了建立分类模型,需要有一个用做训练集的示例数据库E,其中的每个元组都有一个给定的类标识。分类过程是首先分析训练集中的数据,根据每个类中数据的特征为每个类生成分类模型,然后用得到的分类模型对未知类别的数据进行分类。表示分类模型的一种常用方法是决策树。 4.聚类分析。若干个相似的数据对象组合在一起称作一个聚簇。聚类分析是将数据集分割为若干个有意义的聚簇的过程。聚类分析也称作无制导的学习,因为聚类分析与分类分析不同,它不依赖于没有事先确定的类,也没有已具有类标识的训练集。好的聚类分析算法应该使得所得到的聚簇内的相似性很高,而不同的聚簇间的相似性很低。
解析
转载请注明原文地址:https://kaotiyun.com/show/jeQZ777K
本试题收录于:
系统分析师下午论文考试题库软考高级分类
0
系统分析师下午论文考试
软考高级
相关试题推荐
现在小明一家过一座桥,过桥的时候是黑夜,所以必须有灯。现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要八秒,小明的爷爷要12秒。每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。问小明一家如何过桥?(原本
什么是Webservices?
输入两个字符串,从第一字符串中删除第二个字符串中所有的字符。例如,输入”Theyarestudents.”和”aeiou”,则删除之后的第一个字符串变成”Thyrstdnts.”。
给定链表的头指针和一个结点指针,在O(1)时间删除该结点。链表结点的定义如下:structListNode{intm_nKey;ListNode*m_pNext;};函数的声明如下:voidDeleteNode(L
定义Fibonacci数列如下:输入n,用最快的方法求该数列的第n项。
设置发送邮件服务器的帐户名bob1和密码20022002。
利用MSN给bob@sina.com发送电子邮件内容“8号晚上到我家一起吃饭”。
在【安全中心】窗口中,设置windows防火墙,允许“文件和打印机共享”。
在【安全中心】窗口中,设置Windows防火墙,允许“文件和打印机共享”。
以下关于表格排序的说法错误的是()A.拼音不能作为排序的依据B.排序规则有递增和递减C.可按日期进行排序D.可按数字进行排序
随机试题
甲公司为增值税一般纳税人,适用的增值税税率为17%,2014年9月10日甲公司向乙公司销售一批商品,不含税售价为20000元,因属于批量销售,甲公司同意给乙公司10%的商业折扣;同时为了鼓励乙公司及早还款,甲公司规定的现金折扣条件(按含增值税的售价计算)为
下列关于转录因子Ⅱ(TFⅡ)的叙述,正确的有
糖酵解的关键酶不包括
患者,女,15岁,平素体健,学校体检时心率80次/分,律齐,心尖区闻及舒张期隆隆样杂音,心界增大不明显,下列何项处理较适宜()。
患者男性,36岁,3周前感冒,发热,咳嗽,流涕,1周而愈,近几天来,又感头晕,胸闷,气短,体检:心率106/min,律齐,心尖区闻及2/6级收缩期杂音。化验白细胞10.8×109/L,血沉25mm/1h,CK-MB及LDH均升高,心电图T波普遍低平或倒
患者,男,34岁,呼吸困难3天就诊。查体:左胸呼吸运动减弱,气管右移,左侧语颤明显减弱,叩诊鼓音,听诊呼吸音低弱。应考虑()
反映一个国家教育工作总方向的是()
D.H.LawrencewroteallthefollowingEXCEPT
Lettytheoldladylivedina"SingleRoomOccupancy"hotelapprovedbytheNewYorkCitywelfaredepartmentandoccupiedbyold
Itissoeasytoearnrewards!Awiderangeofpartnerswhereveryougo!Tomaketravelingeveneasier,AirFranceoffersyo
最新回复
(
0
)