首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
试题三 论数据湖技术及其应用 近年来,随着移动互联网、物联网、工业互联网等技术的不断发展,企业级应用面临的数据规模不断增大,数据类型异常复杂。针对这一问题,业界提出“数据湖(DataLake)”这一新型的企业数据管理技术。数据湖是一个存储企业各种
试题三 论数据湖技术及其应用 近年来,随着移动互联网、物联网、工业互联网等技术的不断发展,企业级应用面临的数据规模不断增大,数据类型异常复杂。针对这一问题,业界提出“数据湖(DataLake)”这一新型的企业数据管理技术。数据湖是一个存储企业各种
admin
2021-03-26
90
问题
试题三 论数据湖技术及其应用
近年来,随着移动互联网、物联网、工业互联网等技术的不断发展,企业级应用面临的数据规模不断增大,数据类型异常复杂。针对这一问题,业界提出“数据湖(DataLake)”这一新型的企业数据管理技术。数据湖是一个存储企业各种原始数据的大型仓库,支持对任意规模的结构化、半结构化和非结构化数据进行集中式存储,数据按照原有结构进行存储,无须进行结构化处理:数据湖中的数据可供存取、处理、分析及传输,支撑大数据处理、实时分析、机器学习、数据可视化等多种应用,最终支持企业的智能决策过程。
请围绕“数据湖技术及其应用”论题,依次从以下三个方面进行论述。
1.概要叙述你所参与管理或开发的软件项目,以及你在其中所承担的主要工作。
2,详细阐述数据湖技术,并从主要数据来源、数据模式(Schema)转换时机、数据存储成本、数据质量、面对用户和主要支撑应用类型等5个方面详细论述数据湖技术与数据仓库技术的差异。
3.详细说明你所参与的软件开发项目中,如何采用数据湖技术进行企业数据管理,并说明具体实施过程以及应用效果。
选项
答案
写作要点 一、概要叙述你所参与管理或开发的软件项目,以及你在其中所承担的主要工作。 二、数据仓库是一个优化的数据库,用于分析来自事务系统和业务线应用程序的关系数据。数据仓库技术需要事先定义数据结构和数据模式(Schema)以优化快速SOL查询,其中结果通常用于操作报告和分析。数据经过了清理、丰富和转换,因此可以充当用户可信任的“单一信息源”。 与数据仓库不同,数据湖能够同时存储来自业务线应用程序的关系数据,以及来自移动应用程序、物联网设备和社交媒体的非关系数据。在进行数据捕获时,无须定义数据结构或数据模式(Schema)。数据湖支持用户对数据使用不同类型的分析(如SQL查询、大数据分析、全文搜索、实时分析和机器学习等),为企业智能决策提供支撑。 下面从主要数据来源、数据模式转换时机、数据存储成本、数据质量、面对用户和主要支撑应用类型等六个方面对数据湖技术和数据仓库技术进行比较: [*] 三、考生需结合自身参与项目的实际状况,指出其参与管理和开发的项目是如何采用数据湖技术进行数据管理的,详细说明所采用的数据湖架构、主要的数据来源和质量、数据模式转换方式和时机、数据存储基础设施、系统主要用户和支撑的上层应用等,并对实际应用效果进行分析。
解析
转载请注明原文地址:https://kaotiyun.com/show/ENQZ777K
本试题收录于:
系统架构师下午论文考试题库软考高级分类
0
系统架构师下午论文考试
软考高级
相关试题推荐
Facebookdevelopedwhatitcallsafoundational"breakthrough":softwarethatenablesmachinestolearntowalkliketoddler
Lastyear,138,000SanFranciscoresidentsusedAirbnb,apopularappdesignedtoconnecthomerentersandtravelers.It’sasta
.面向对象的思想主要包括什么?
某队列的声明如下:templateclassCQueue{public:CQueue(){}~CQueue(){}voidappendTail(constT&node);//appendaelementto
输入一棵二元树的根结点,求该树的深度。从根结点到叶结点依次经过的结点(含根、叶结点)形成树的一条路径,最长路径的长度为树的深度。输出该树的深度3。二元树的结点定义如下:structSBinaryTreeNode//anodeofthe
输入一颗二元查找树,将该树转换为它的镜像,即在转换后的二元查找树中,左子树的结点都大于右子树的结点。用递归和循环两种方法完成树的镜像转换。例如输入:定义二元查找树的结点为:structBSTreeNode//anodeinthebi
设置TCP/IP属性筛选TCP/IP不允许UDP端口的数据通过。
用手动的方法设置IP地址,其中IP地址为“202.204.54.23”,默认网关为“202.204.54.1”,DNS服务器地址为“202.106.60.10”。
通过【控制面板】中的添加硬件向导,安装Modem的驱动程序。让系统自动搜索安装软件,Modem的型号为:IntelV92HaMDataFaxVoice。
利用“本地磁盘(C:)属性”对话框为C盘加卷标“系统盘”。
随机试题
一定时期内形成的以货币表现的投资可能量是()
患儿,男,2岁半。咳嗽,发热2天,体温37.8℃,呼吸困难,口唇发绀,听诊右肺下部有湿啰音,PaO27.6kPa,PaCO28kPa,诊断为支气管肺炎,该患儿最主要的护理诊断是
随机抽取上海市区12名男孩作为样本,测得其平均出生体重为3.20kg,标准差为0.50kg,则总体均数95%可信区间的公式是
呼吸带的高度是
关于仲裁协会,下列说法正确的是:()
认识资本化率的重要性,能使估价人员对资本化率的选取抱着()的态度。正是由于对资本化率选取的精度要求很高,使得许多估价人员明知收益法是一种理论充分、普遍适用于收益性房地产估价的方法,但往往不敢贸然采用。
个人抵押授信贷款提供了一个有明确授信额度的循环信贷账户,借款人可使用部分或全部额度,一旦已经使用的余额得到偿还,该信用额度又可以恢复使用。()
将4名优秀学生保送到3所学校去,每所学校至少去一名,则不同的保送方案有多少种?
在虚拟8086模式下,应用程序的特权级是
A、Thepracticecanhelpbuildacleangovernment.B、Thepracticeshowstheideaof"rulingsocietybymen."C、Thepracticedoes
最新回复
(
0
)