数据挖掘可以简单地理解为从大量的数据中发现或挖掘知识。设某公司的客户关系管理系统中有客户表A(CID, v1, v2, …, vn)。给定一个训练集S(v1, v2, …, vn, c),其中c为客户类别、vi(i=1..n)为客户其他属性。若对表A中任一

admin2021-02-05  25

问题 数据挖掘可以简单地理解为从大量的数据中发现或挖掘知识。设某公司的客户关系管理系统中有客户表A(CID, v1, v2, …, vn)。给定一个训练集S(v1, v2, …, vn, c),其中c为客户类别、vi(i=1..n)为客户其他属性。若对表A中任一客户x,要使系统能判定x所属的客户类别,较合理的方案是(       )

选项 A、将x对应的元组中的特征向量(v1, v2, …, vn)与训练集S中的元组进行匹配,从而判定x所属的客户类别
B、对训练集S设计适当的算法,构造一个分类器M,将x对应的特征向量(v1, v2, …, vn)作为M的输入,用M判定x所属的客户类别
C、采用关联规则挖掘算法构成一个关联式分类器M,用M判定x所属的类别
D、采用适当的聚类算法,对表A中的所有元组进行聚类,将每个元组归入训练集S各元组的c列所给出的客户类别中,从而实现x所属客户类别的判定

答案B

解析 对于训练集S,测试集A利用数据挖掘中的分类算法,通过训练集构建一个分类器,将测试集A作为分类器输入,经过分类器后会得到相应的类别号。即使相同的类别编号的训练集也可能对应不同的属性集,所以单纯的通过对属性集差别的比较来识别类别不准确,故A错。关联规则挖掘是发现交易数据库中不同商品之间的联系,而本题是对数据进行分类,与题意不符,故C错。D项属于无监督学习算法,对类别并没有规定明确的前提条件,与本题所给的条件无关。综上可知,选项B正确。
转载请注明原文地址:https://kaotiyun.com/show/0glZ777K
0

最新回复(0)