首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据清洗工作不包括(10)。
数据清洗工作不包括(10)。
admin
2019-05-22
66
问题
数据清洗工作不包括(10)。
选项
A、删除多余重复的数据
B、采用适当方法补充缺失的数据
C、纠正或删除错误的数据
D、更改过大的和过小的异常数据
答案
D
解析
本题考查信息处理基本概念。刚收集得到的原始数据很可能有一部分是“脏”的,需要清洗才能使用。例如,有些是重复的数据,有些是含有矛盾的数据(回答的多个问题中发现有矛盾),有些是填写错误的数据(包括格式错误、数字错误)。对以上不同的情况要做不同的处理,这属于数据清洗工作。对过大的或者过小的异常数据要慎重处理,有可能是错误数据,但也有可能是正确的非常重要的超常数据。分析处理异常数据需要专业水平,不属于数据清洗工作。
转载请注明原文地址:https://kaotiyun.com/show/Y33Z777K
本试题收录于:
信息处理技术员上午基础知识考试题库软考初级分类
0
信息处理技术员上午基础知识考试
软考初级
相关试题推荐
(25)是操作系统中可以并行工作的基本单位,也是核心调度及资源分配的最小单位,它由(26)组成,它与程序的重要区别之一是:(27)。
关系模式R(U,F),其中U={A,B,C,D,E},F={AC→E,E→D,A→B,B→D}。关系模式R的候选键是(45),(46)是无损连接并保持函数依赖的分解。
结构化设计方法使用的图形工具是(19),图中矩形表示(20)。如果两矩形之间有直线相连,表示它们存在(21)关系。
某算法的时间代价递推关系为T(n)=2T(n/2)+n,T(1)=1,则该算法的时间复杂度为______。
在数据流图中,○(椭圆)代表______。
一个数据库系统必须能表示实体和关系。关系可与(42)实体有关。实体与实体之间的关系有一对一、一对多和多对多,其中(43)不能描述多对多的联系。
Hash函数有共同的性质,则函数值应当以1.______概率取其值域的每一个值。解决Hash法中出现的冲突问题常采用的方法是2._____。1._____A.最大B.最小C.平均D.同等
某确定性有限自动机(DFA)的状态转换图如图2.1所示,令d=0|1|2|…|9,则以下字符串中,能被该DFA接受的是()。
计算机执行程序所需的时间P,可用P=I×CPI×T来估计,其中I是程序经编译后的机器指令数,CPI是执行每条指令所需的平均机器周期数,T为每个机器周期的时间。RISC计算机采用(1)来提高机器的速度。它的指令系统具有(2)的特点。指令控制部件的构建,(3
随机试题
下列属于消费者收入的有()
非阿片受体激动药是
下列检查结果中最能反映慢性肾炎患者肾实质严重损害的是()
日光浴一般于婴儿早餐后
担保的法律特征包括( )。
供给弹性主要有供给的()和供给的要素成本弹性。
学校评定奖学金,小伟成绩非常好,但因跟班主任关系不太好,而被班主任取消资格,班主任侵犯了小伟的()
简述教育与科学技术的关系。
[A]Theauthorsalsopointtosomelimitations,includingthelackofracialdiversityofstudyparticipants,whichmainlyinclu
Whosayshonestyisdead?LastTuesdaymorningAlanReed,astudentatClaremontCollegehere,wasgetting【C1】______moneyoutof
最新回复
(
0
)