首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
91
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
在考生文件夹下完成下列操作:1.建立一个名为score_query的查询。查询评委为“歌手编号”是“01002”的歌手所打的分数,然后将结果存入自由表result中,该自由表的字段有“评委姓名”和“分数”,各记录按分数升序排列。最后运行该查询。2.根据
1.打开考生文件夹下的数据库College.物理删除该数据库中的temp表,然后将3个自由表“教师表”、“课程表”和“学院表”添加到该数据库中。2.为“课程表”和“教师表”分别建立主索引和普通索引,字段名和索引名均为“课程号”,并为两个表建立一对多的联系
在表单数据环境中,将环境中所包含的表字段拖到表单中会生成相应的控件,下列各项中,埘应正确的一项是()。
用程序计算一个整数的各位数字的乘积,在下划线处应填写的语句是()。INPUT“NUM=”TOnumcj=1DOWHlLEnum!=0cj=cj*MOD(num,10)ENDDO?cj
查询2008年1月1日后签订的订单,显示订单的订单号、客户名以及签订日期,正确的SQL语句是()。
在下面的表达式中,运算结果为逻辑真的是()。
下列关于栈和队列的描述中,正确的是()。
在考生文件夹下创建一个下拉式菜单mymenu.mnx,并生成菜单程序enu.mpr。运行该菜单程序时会在当前VFP系统菜单的末尾追加一个“考试”子菜单,如图3-13所示。菜单命令“统计”和“返回”的功能都通过执行过程完成。菜单命令“统计”的功
在VisualFoxPro中,通常以窗口形式出现,用以创建和修改表、表单、数据库等应用程序组件的可视化工具称为
一棵二叉树中共有70个叶子结点与80个度为l的结点,则该二叉树中的总结点数为
随机试题
男,55岁。右胸闷气3个月,胸痛15天,夜间重,查体:颜面及颈部,胸壁略肿胀,胸壁静脉曲张,腋下有一拇指大小的淋巴结,无压痛,活动尚好,心率110次/分,律整,右肺呼吸音消失。采取哪项措施缓解的病人呼吸困难()
女性,45岁,胆囊结石5年,曾胆绞痛发作3次,B超示胆囊结石5枚,直径1~2cm,首选的治疗方法是
下列有关DNA二级结构的叙述哪一项是不正确的
对腹部实质性脏器病变,最简便易行的检查方法是
关于注射用油的质量要求叙述错误的是( )。
根据机电工程注册建造师签章文件类别划分,属于进度管理签章文件的有()
该企业可能得到的投资期望收益率为( )。该企业的标准离差率为( )。
简述幼儿游戏的内涵。
成语“九牛一毛”出自《报任少卿书》:“假令仆伏法受诛,若九牛亡一毛,与蝼蚁何以异?”其与下列哪位历史人物有关系?
硬盘的一个主要性能指标是容量,硬盘容量的计算公式为
最新回复
(
0
)