首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据清洗工作不包括(10)。
数据清洗工作不包括(10)。
admin
2019-05-22
55
问题
数据清洗工作不包括(10)。
选项
A、删除多余重复的数据
B、采用适当方法补充缺失的数据
C、纠正或删除错误的数据
D、更改过大的和过小的异常数据
答案
D
解析
本题考查信息处理基本概念。刚收集得到的原始数据很可能有一部分是“脏”的,需要清洗才能使用。例如,有些是重复的数据,有些是含有矛盾的数据(回答的多个问题中发现有矛盾),有些是填写错误的数据(包括格式错误、数字错误)。对以上不同的情况要做不同的处理,这属于数据清洗工作。对过大的或者过小的异常数据要慎重处理,有可能是错误数据,但也有可能是正确的非常重要的超常数据。分析处理异常数据需要专业水平,不属于数据清洗工作。
转载请注明原文地址:https://kaotiyun.com/show/Y33Z777K
本试题收录于:
信息处理技术员上午基础知识考试题库软考初级分类
0
信息处理技术员上午基础知识考试
软考初级
相关试题推荐
(25)是操作系统中可以并行工作的基本单位,也是核心调度及资源分配的最小单位,它由(26)组成,它与程序的重要区别之一是:(27)。
OMT是一种对象建模技术,它定义了三种模型,其中(49)模型描述系统中与时间和操作顺序有关的系统特征,表示瞬时的行为上的系统的“控制”特征,通常可用(50)来表示。
我国标准分为国家标准、行业标准、地方标准和企业标准四类。根据标准的法律约束性,可分为强制性标准和推荐性标准。现已得到国家批准的《软件工程术语标准》(GB/T11457-89)属于______标准。
因争用资源产生死锁的必要条件是互斥、循环等待、不可抢占和(26);“银行家算法”是一种(27)技术。
软件维护工作越来越受到重视,因为维护活动的花费常常要占用软件生存周期全部花费的(14)%左右,其工作内容为(15)。为了减少维护工作的困难,可以考虑采取的措施为(16)。
在数据压缩编码的应用中,Huffman算法可以用来构造具有(53)的二叉树,这是一种采用了(54)的算法。
在图形显示系统的类层次结构中,类Shape定义了“图形”所具有的公有方法:display(),并将其声明为抽象方法:类Line是Shape的子类。则下列说法中正确的是1._____。若类Line正确继承了Shape类,并定义了方法display(i
在图形显示系统的类层次结构中,类Shape定义了“图形”所具有的公有方法:display(),并将其声明为抽象方法:类Line是Shape的子类。则下列说法中正确的是1._____。若类Line正确继承了Shape类,并定义了方法display(i
已经发布实施的标准(包括已确认或修改补充的标准),经过实施一定时期后,对其内容再次审查,以确保其有效性、先进性和适用性,其周期一般不超过(5)年。
已知一个文件中出现的各字符及其对应的频率如下表所示。若采用定长编码,则该文件中字符的码长应为(64)。若采用Huffi-nan编码,则字符序列“face”的编码应为(65)。(65)
随机试题
罗伯特.库恩对投资银行作出的四种定义中,包含的金融机构最为广泛的是()
下列选项中,属于高渗性脱水表现的有()
患者,男,18岁。家住农村,10天前在右肘窝局部皮肤出现针尖大的丘疹、小疱,以后皮肤出现灰白色弧形线纹。瘙痒症状严重,尤其是夜间睡眠时奇痒难忍。由于抓破,现继发感染。若患者使用上题药物,则应选用的浓度为()。
通过沥青延度试验测定沥青能够承受的塑性变形总能力,并用于评价沥青在高温状态下的抗车辙性。()
下列各账户,在借贷记账法下,本期增加的金额记人借方的有()。
某股份有限公司2005年7月1日以180万元的价格转让一项专利技术,同时发生有关税费5万元。该专利技术系2002年7月1日购入并投入使用,其实际取得成本为420万元,预计使用年限为6年,购入时法律规定的保护期限还有7年。转让该专利技术发生的净损失为(
出土时震惊世界并已成为“中国文化遗产标志”的太阳神鸟金箔是()展厅中最重要的文物。
蓟城在今北京房山区董家林,燕在今广安门一带。()
《矛盾论》是马克思主义哲学史上系统地阐述运动静止规律的哲学专著。()
A、Theworkerandhiswifeweretalkinginafriendlyway.B、Theworkerwasgettingintohiscar.C、Theworkerstoppedtalking.D
最新回复
(
0
)