首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。
admin
2019-09-25
37
问题
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。
选项
A、存储技术
B、分析技术
C、并行分析技术
D、挖掘技术
答案
A
解析
大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化和半结构化数据一般通过分布式文件系统的NoSQL进行存储。大数据管理主要使用了分布式并行处理技术,比较常用的有MapReduce,编程人员借助它可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好地利用。
在最流行的开源大数据Hadoop中,Hadoop分布式文件系统HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。
转载请注明原文地址:https://kaotiyun.com/show/kDXZ777K
本试题收录于:
系统集成项目管理工程师上午基础知识考试题库软考中级分类
0
系统集成项目管理工程师上午基础知识考试
软考中级
相关试题推荐
软件生存周期是指(28)。其中时间长费用高困难大的阶段是(29)。
计算机系统的层次结构从低到高依次为(25)。
电子邮件是计算机或网络用户之间通过计算机网络传送的数字化的函件,目前的电子邮件中可以包含(11)。
网络管理在网络中起着非常重要的作用,其主要功能有(36);其中,对路由器的操作属于(37);对于各链路流量,吞吐率的操作等属于(38)。①配置管理②故障管理③安全管理④性能统计⑤计费
下面各术语中,对(58)含义的解释不符合《中华人民共和国计算机信息网络国际联网管理暂行规定实施办法》(1997年12月13日经国务院批准,1998年3月6日国务院信息办发布)。
若某时期投入市场的某型号机器上编制的软件能不加修改地运行于在它之前投入市场的机器上称做(34)。
在常用的调度算法中,在进行(27)时,运行时间短的进程只需经过前面几级队列即可得到结果而运行时间较长的进程在进入低级就绪队列后能得到较长的时间片。
软件工程的结构化生命周期方法是将软件开发的全过程划分为相互独立而又相互依存的阶段,软件的逻辑模型是形成于(52),数据流图描述数据在软件中流动和被处理变换的过程,它是以图示的方法来表示(53),数据字典是软件需求分析阶段的最重要的工具之一,其最基本的功能是
The Simple Network Management Protocol(SNMP)is an(66)protocol that facilitates the exchange of management information between(67
试述事务并发高度的正确性准则及其内容。采用何种加锁策略能够保证事务调度的正确性,简述其内容。
随机试题
下列人物属于战国四公子之一的是
有关肠结核下列哪些正确
下列属于肺脏生理功能的是
下列哪些行为是行政终局裁决?()
2
一、注意事项1.请按要求作答2.请在答题卡上指定位置填写自己的姓名、报考部门,填涂准考证号。二、给定资料1.2006年8月,在襄樊市总工会与该市女企业家协会联合开展的“金秋助学”活动中,19位女企业家与22名贫困大学生结成帮扶对子
A、 B、 C、 D、 D数据库镜像涉及尽快将对主体数据库执行的每项插入、更新和删除操作重做到镜像数据库中。重做通过将每个活动事务日志记录发送到镜像服务器来完成,这会尽快将日志记录按顺序应用到镜像数据库中,这
这台机器不会转,能帮我看一下吗?对不起,我现在没有空,请其他人来看一下好吗?
【B1】【B7】
Hegainedhis______byprinting______offamouswriters.
最新回复
(
0
)