首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
admin
2009-02-15
69
问题
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heterogeneous repository of information. However, if we are interested in HTML documents only, we can construct a virtual(66)from the implicit structure of these files. Thus, at the highest level of(67), every such document is identified by its Uniform Resource Locator(URL), has a title and a text Also, Web servers provide some additional information such as the type, length, and the last modification date of a document. So, for data mining purposes, we can consider the site of all HTML documents as arelation:
Document(url,(68), text, type, length, modify)
Where all the(69)are character strings. In this framework, anindividual document is identified with a(70)in this relation. Of course, if some optional information is missing from the HTML document, the associate fields will de left blank, but this is not uncommon in any database.
选项
A、field
B、relation
C、script
D、tuple
答案
D
解析
在万维网上建立一个类似于SQL的查询语言的困难之一是缺乏一种适用于这种巨大的、异构型信息仓库的数据库模式。然而,如果仅限于HTML文档,我们就可以由这种文件的隐含结构建立一种虚拟模式。这样,在最高抽象级别,每个文档都可以由统一资源定位器(URL)来标识,有一个标题和一个文本。同时,由Web服务器了来提供某些附加的信息,例如,类型、长度和文档的最后修改日期。这样,对于数据挖掘应用来说,我们可以把所有HTML文档的集合看做一个关系:
Document (ur1,title,text,type,length,modify)
这里,所有的属性都是字符串。在这种框架下,一个单独的文档可以用这种关系的一个元组来标识。当然,如果某些任选信息在HTML文档中缺失,有关字段就留做空白,但这种情况在任何数据库中都是常见的。
转载请注明原文地址:https://kaotiyun.com/show/WIJZ777K
本试题收录于:
网络工程师上午基础知识考试题库软考中级分类
0
网络工程师上午基础知识考试
软考中级
相关试题推荐
关于质量管理七种工具的描述,不正确的是()。
关于责任分配矩阵(RAM)的描述,不正确的是()。
某大型项目原计划于6个月后交付,目前由于设备故障、人员流失和客户审核缓慢导致项目实际进展比计划延迟了1个月。作为项目经理首先应该做的是()。
项目进度表至少包括每项计划活动的计划开始日期与计划完成日期,常见的做法是用一种或多种格式的图形表示。在下面的图表中,常用于表示项目进度表的是()。
供应链管理是一种将正确数量的商品在正确的时问配送到正确地点的集成的管理思想和方法,评价供应链管理的最重要的指标是______________。
任何企业都是依赖于客户而生存的。某电子商务公司为提升客户满意度与忠诚度,决定引入_________系统。
PPP协议是用于拨号上网和路由器之间通信的点到点通信协议,属于(1)协议,它不具有(2)的功能。(2)
(2009年上半年)管理信息系统建设的结构化方法中,用户参与的原则是用户必须参与(66)。
在下列技术中,____________提供了可靠消息传输、服务接入、协议转换、数据格式转换、基于内容的路由器等功能,能够满足大型异构企业环境的集成要求。
WebSQLisaSQL-like(36)languageforextractinginformationfromtheweb.Itscapabilitiesforperformingnavigationofweb(37)m
随机试题
幼儿在3岁时,已经基本上掌握了()左右个词。
便秘时给婴幼儿按摩腹部应以肚脐为中心,逆时针方向为宝宝按摩腹部,每天3次。()
员工干劲的高低的衡量指标包括()-
Doctorssayangercanbeanextremelydamagingemotionunlessyoulearnhowto【C1】______withit.Theywarnthatangryhostilefe
二陈汤治气痰,可加二陈汤治皮里膜外之痰,可加
女性,30岁,4小时前跌伤后昏迷5分钟,清醒后步行回家。1小时前因剧烈头痛,呕吐3次来诊。查体:昏迷,P64次/分,BP180/90mmHg,R18次/分,左瞳3mm,右瞳2mm,右上、下肢肌力Ⅲ级。诊断应考虑
网络图的主要优点是()。
JETnet常用微管规格有()两种。
OSPF协议中,一般不作为链路状态度量值(metric)的是()。
Ireallydon’tknowhowyou______theirconstantquarreling.
最新回复
(
0
)