首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
admin
2009-02-15
47
问题
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heterogeneous repository of information. However, if we are interested in HTML documents only, we can construct a virtual(66)from the implicit structure of these files. Thus, at the highest level of(67), every such document is identified by its Uniform Resource Locator(URL), has a title and a text Also, Web servers provide some additional information such as the type, length, and the last modification date of a document. So, for data mining purposes, we can consider the site of all HTML documents as arelation:
Document(url,(68), text, type, length, modify)
Where all the(69)are character strings. In this framework, anindividual document is identified with a(70)in this relation. Of course, if some optional information is missing from the HTML document, the associate fields will de left blank, but this is not uncommon in any database.
选项
A、field
B、relation
C、script
D、tuple
答案
D
解析
在万维网上建立一个类似于SQL的查询语言的困难之一是缺乏一种适用于这种巨大的、异构型信息仓库的数据库模式。然而,如果仅限于HTML文档,我们就可以由这种文件的隐含结构建立一种虚拟模式。这样,在最高抽象级别,每个文档都可以由统一资源定位器(URL)来标识,有一个标题和一个文本。同时,由Web服务器了来提供某些附加的信息,例如,类型、长度和文档的最后修改日期。这样,对于数据挖掘应用来说,我们可以把所有HTML文档的集合看做一个关系:
Document (ur1,title,text,type,length,modify)
这里,所有的属性都是字符串。在这种框架下,一个单独的文档可以用这种关系的一个元组来标识。当然,如果某些任选信息在HTML文档中缺失,有关字段就留做空白,但这种情况在任何数据库中都是常见的。
转载请注明原文地址:https://kaotiyun.com/show/WIJZ777K
本试题收录于:
网络工程师上午基础知识考试题库软考中级分类
0
网络工程师上午基础知识考试
软考中级
相关试题推荐
关于责任分配矩阵(RAM)的描述,不正确的是()。
项目执行过程中,客户要求对项目范围进行修改。项目经理首先应该()。
某项目经理正在负责某政府的一个大项目,采用自下而上的估算方法进行成本估算,一般而言,项目经理首先应该(44)。
广域网覆盖的地理范围从几十公里到几千公里,它的通信子网主要使用_______技术。随着微型计算机的广泛应用,大量的微型计算机是通过局域网连人广域网的,而局域网与广域网的互联一般是通过_______设备实现的。(18)
(2012年上半年)以下不属于主动式攻击策略的是(27)。
(2010年下半年)合同变更控制系统规定合同修改的过程,包括(66)。①文书工作②跟踪系统③争议解决程序④合同索赔处理
某单位为加强项目管理,计划在2013年建设一个项目管理系统,但企业领导对该系统没有提出具体要求。钱工是项目负责人,要对项目的技术、经济等进行深入研究和方案论证,应(1)。如果钱工对比了自主开发和外购的成本、时间差异,该行为属于(2)。(
(2009年上半年)(6)的目的是评价项目产品,以确定其对使用意图的适合性,表明产品是否满足规范说明并遵从标准。
WebSQLisaSQL-like(36)languageforextractinginformationfromtheweb.Itscapabilitiesforperformingnavigationofweb(37)m
随机试题
一个刚被创建的进程,它的初始状态是
十二正经循行中“人下齿中”的经脉是
A.磁共振成像B.CT扫描C.骨ECTD.活检E.免疫组化哪项检查对确诊嗅神经母细胞瘤最有帮助
患者女性,74岁。腰背部疼痛六个月前来就诊,体检:肝肋下2cm,脾肋下3cm,多个腰椎骨压痛明显。实验室检查:血红蛋白85g/L,白细胞4.6×109/L,血小板110×109/L,血沉120mm/h,尿蛋白定性(+),24小时尿蛋白定量5g。BUN15m
洋地黄中毒伴缓慢心律失常时应选用()
初产妇,孕40周后临产,宫口开大9cm时自然破膜。不久产妇出现呛咳、呼吸困难、发绀,血压50/30mmHg。护士应采取的护理措施是
美国第一个将巴甫洛夫的研究结果作为学习理论基础的人是()。
必须坚持依法管理、严格管理、科学管理、文明管理,同时努力发展群众()。
设f(χ)在[-a,a](a>0)上有四阶连续的导数,存在.(1)写出f(χ)的带拉格朗日余项的麦克劳林公式。(2)证明:存在ξ1,ξ2∈[-a,a],使得
嵌入式系统使用的存储器有多种类型,按照其存取特性可分为随机存取存储器(英文缩写为RAM)和__________【57】存储器(英文缩写为__________【58】)。
最新回复
(
0
)