首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据清洗工作不包括(10)。
数据清洗工作不包括(10)。
admin
2019-05-22
45
问题
数据清洗工作不包括(10)。
选项
A、删除多余重复的数据
B、采用适当方法补充缺失的数据
C、纠正或删除错误的数据
D、更改过大的和过小的异常数据
答案
D
解析
本题考查信息处理基本概念。刚收集得到的原始数据很可能有一部分是“脏”的,需要清洗才能使用。例如,有些是重复的数据,有些是含有矛盾的数据(回答的多个问题中发现有矛盾),有些是填写错误的数据(包括格式错误、数字错误)。对以上不同的情况要做不同的处理,这属于数据清洗工作。对过大的或者过小的异常数据要慎重处理,有可能是错误数据,但也有可能是正确的非常重要的超常数据。分析处理异常数据需要专业水平,不属于数据清洗工作。
转载请注明原文地址:https://kaotiyun.com/show/Y33Z777K
本试题收录于:
信息处理技术员上午基础知识考试题库软考初级分类
0
信息处理技术员上午基础知识考试
软考初级
相关试题推荐
软件维护工作越来越受到重视,因为维护活动的花费常常要占用软件生存周期全部花费的(14)%左右,其工作内容为(15)。为了减少维护工作的困难,可以考虑采取的措施为(16)。
软件维护工作越来越受到重视,因为维护活动的花费常常要占用软件生存周期全部花费的(14)%左右,其工作内容为(15)。为了减少维护工作的困难,可以考虑采取的措施为(16)。
在数据压缩编码的应用中,Huffman算法可以用来构造具有(53)的二叉树,这是一种采用了(54)的算法。
软件测试的目的是(14)。为了提高测试的效率,应该(15)。
在数据库逻辑结构的设计中,将E-R模型转换为关系模型应遵循相关原则。对于三个不同实体集和它们之间的多对多联系m:n:p,最少可转换为______个关系模式。
下列中协议,______不是TGP/IP协议栈中的网络层协议。
将拥有2500台主机的网络划分为两个子网,并采用C类IP地址。子网1有500台主机,子网2有2000台主机,则子网1的子网掩码应设置为1.______,子网2至少应划分为2._____个C类网络。2.______A.2B.4C.8
计算机执行程序所需的时间P,可用P=1×CPI×T来估计,其中l是程序经编译后的机器指令数,CPI是执行每条指令所需的平均机器周期数,T为每个机器周期的时间。RISC计算机是采用(25)来提高机器的速度。它的指令系统具有(26)的特点。(26)
已知一个文件中出现的各字符及其对应的频率如下表所示。若采用定长编码,则该文件中字符的码长应为(64)。若采用Huffi-nan编码,则字符序列“face”的编码应为(65)。(65)
设S是一个长度为n的非空字符串,其中的字符各不相同,则其互异的非平凡子串(非空且不同于S本身)个数为()。
随机试题
凹模型腔由凹圆弧面、方形内框和梯形内框()而成。
若发散,则
大量胸水或气胸可使心界移向(1)___________,胸膜增厚与肺不张则使心界移向(2)___________。
一患者误饮农药致中毒,需要做血浆置换治疗,查血型为AB型Rh阴性,现当地血站该血型血浆缺少,经媒体宣传,有两位献血者前来献血。这种献血员招募方式属于
服用时需忌热茶的药物是
企业给职工发放工资的“工资发放明细表”属于()。[2008年真题]
教师准备组织班上的少先队活动,策划内容应该包括()
下列属于抗日根据地的社会教育的组织形式的是()。
ItcameassomethingofasurprisewhenDiana,PrincessofWales,madeatriptoAngolain1997,tosupporttheRedCross’scamp
有以下程序(strcat函数用以连接两个字符串)#include#includemain(){chara[20]="ABCD\OEFG\0",b[]="IJK";strcat(a,b);printf("
最新回复
(
0
)