首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中主要人物,考生文件夹下文件data.txt给出《三国演义》简介。 问题1:请编写程序,用Python语言中文分词第三方库jieba对文件data.txt进行分词,并将结果写入文件out.txt,每行一个
《三国演义》是中国古典四大名著之一,曹操是其中主要人物,考生文件夹下文件data.txt给出《三国演义》简介。 问题1:请编写程序,用Python语言中文分词第三方库jieba对文件data.txt进行分词,并将结果写入文件out.txt,每行一个
admin
2020-04-10
32
问题
《三国演义》是中国古典四大名著之一,曹操是其中主要人物,考生文件夹下文件data.txt给出《三国演义》简介。
问题1:请编写程序,用Python语言中文分词第三方库jieba对文件data.txt进行分词,并将结果写入文件out.txt,每行一个词,例如:
内容简介
编辑
整个
故事
在
东汉
…
在考生文件夹下给出了程序框架文件PY301—1.py,补充代码完成程序
试题程序:
#请在_____处使用一行代码或表达式替换
#
#注意:请不要修改其他已给出代码
import jieba
f=open(’data.txt’,’r’)
lines =f.readlines()
f.close()
f=open(’out.txt’,’w’)
for line in lines:
line=_____(1)_____ #删除每行首尾可能出现的空格
wordList=_____(2)_____ #用结巴分词,对每行内容进行分词
f.writelines(’\n’_____(3)____)#将分词结果存到文件out.txt中
f.close()
问题2:对文件out.txt进行分析,打印输出曹操出现次数。
在考生文件夹下给出了程序框架文件PY301—2.py,补充代码完成程序
试题程序:
#请在______处使用一行代码或表达式替换
#
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以读的方式打开文件
words =f.readlines()
f.close()
D={}
for w in_____(1)_____: #词频统计
D[w[:一1]]=_______(2)_______+1
print(”曹操出现次数为:{}”.format(______(3)________))
选项
答案
(1)import jieba f=open(’data.txt’,’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:一1]]=D.get(w[:-1],0)+1 print(”曹操出现次数为:{}”.format(D[’曹操’]))
解析
(1)本题要使用jieba库,则首先用import保留字引用jieba库。打开”data.txt”文件后,需要用readlines()函数读人所有行,以每行为元素形成列表lines,然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格,因此第一空填入:line.strip();然后使用jieba库的lcut()函数对元素进行精准分词,因此第二空填入:jieba.lcut(line);最后将换行符’\n’插入到每个词组之间,并写入到文件”out.txt”中,因此第三空填入:join(wordList)。
(2)首先用import保留字引用jieba库。打开”out.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第一空填入:words。
在遍历每个元素时,若字典D中不存键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第二空填入:D.get(w[:一1],0)。
题目要求的是打印输出曹操出现次数,字典D中键”曹操”对应的值即为该词出现的次数。因此,第三空填入:D[’曹操’]。
转载请注明原文地址:https://kaotiyun.com/show/OA6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
有三个关系R、S和T如下:由关系R和S通过运算得到关系T,则所使用的运算为()。
在考生文件夹下完成下列操作:在考生文件夹下创建一个下拉式菜单mymenu.mnx,并生成菜单程序mymenu.mpr。运行该菜单程序时会在当前vfp系统菜单的末尾追加一个“考试”子菜单,如下图所示。菜单命令“统计”和“返回”的功能都通
(1)建立一个表单文件myform,将employee表添加到表单的数据环境中,然后在表单中添加表格控件grid1,指定其记录源类型为“别名”、记录源为employee表文件,最后添加。一个“退出”命令按钮控件Commandl,程序运行时单击该命令按钮将关
在使用查询设计器创建查询时,为了指定在查询结果中是否包含重复记录(对应于DISTINCT),应该使用的选项卡是()。
命令?VARTYPE(TIME())的结果是()。
下列程序段的执行结果是()。DIMEa(8)a(1)=1a(2)=1fori=3to8a(i)=a(i一1)+a(i一2)next?a(7)
在考生文件夹下完成下列操作:(1)在考生文件夹下利用查询设计器创建一个查询,从表中查询演唱“粤语”歌曲的歌手。查询结果包含歌手的姓名、语言和点歌码三个字段;各记录按“点歌码”降序排序,点歌码相同的再按“演唱者”升序排序;查询去向为表ta。最后将查
随机试题
即期外汇交易的功能是什么?
感染性心内膜炎最常发生于:()
卫生部根据全国医疗资源配置、临床用血需求,制定全国采供血机构设置规划指导原则,并负责全国血站建设规划的指导。省、自治区、直辖市人民政府卫生行政部门应当根据前款规定,结合本行政区域人口、医疗资源、临床用血需求等实际情况和当地区域卫生发展规划,制定本行政区域血
患者,男,45岁。高血压3年,不规律服药,今晨与家人争吵时突然出现头痛、左侧肢体活动不利,口眼歪斜,言语不清。血压200/130mmHg,头颅CT显示右侧基底节脑出血。若使用硝普钠,最开始的静滴速度一般为
药品生产企业必须具备必要的条件,遵循必要的行为规则,因为它是()
A上市公司是甲集团公司的子公司,主要从事电子制造业务。2×10年A公司发生以下的合并交易:(1)A公司将除货币资金450万元、持有的市价1500万元L公司限售股权和应付账款2000万元以外的所有资产和负债出售给甲集团。出售净资产按资产评估价作价2
(2010年褊建.春.7)在我国传统学术发展史上,不同时期有不同的标志性学术成就。下列表述正确的是()。
(2018天津选调)中国进入社会主义社会的主要标志是()。
我们通过《红楼梦》中对王熙凤的描写“一双丹凤三角眼,两弯柳叶吊梢眉,粉面含春威不露,丹唇未启笑先闻”形成了王熙凤的形象,这时反映的想象功能是
Leavesarenotdistributedaccidentallyonaplantstem,butarearrangedinaveryprecisewaythatassuresthemthemaximumli
最新回复
(
0
)