首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
119
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
在考生文件夹下完成如下基本操作:1.通过SQLINSERT语句插入元组("p7","PN7",1020)到“零件信息”表(注意不要重复执行插入操作),并将相应的SQL语句存储在文件one.prg中。2.通过SQLDELETE语句从“零件信息”表中删
如果在命令窗口执行命令:LISI名称,主窗口中显示:记录行名称1电视机2计算机3电扇线4电脑连线5电话线假定名称字段为字符型,宽度为8,那么下面程序段的输出结果是(
下列表达式中结果不是日期型的是()。
设有如下关系表:[*]则下列操作正确的是()。
用程序计算一个整数的各位数字的乘积,在下划线处应填写的语句是()。INPUT“NUM=”TOnumcj=1DOWHlLEnum!=0cj=cj*MOD(num,10)ENDDO?cj
查询2008年1月1日后签订的订单,显示订单的订单号、客户名以及签订日期,正确的SQL语句是()。
在下面的表达式中,运算结果为逻辑真的是()。
(1)根据“班级学生”库中的表用SOLSELECT命令查询学生的学号、姓名、课程号和成绩,结果按“课程号”降序排序,“课程号”相同时按“成绩”降序排序,并将查询结果存储到cib表中,将使用的sQL语句保存到mysql.txt中。(2)使用表单向
在软件设计中不使用的工具是
(1)利用查询设计器创建查询,从考生文件夹下的xuesheng表和chenji表中查询“数学”、“英语”和“信息技术”3门课中至少有一门课在90分以上(含)的学生记录。查询结果包含“学号”、“姓名”、“数学”、“英语”和“信息技术”5个字段;各记录按“学号
随机试题
下列关于幼儿园安全工作常规说法错误的是()
A、陶土色大便B、米泔样便C、果酱样便D、脓血便E、柏油样便阿米巴痢疾大便性状是
关于X线信息影像的形成与传递的叙述,错误的是
工程咨询服务项目采用经评审的最低评价法时,首先应评审技术建议书,总分低于满分()的技术建议书将被否决。
根据新《海关法》的规定,下列属于关税的纳税义务人的是()。
甲企业与乙企业为同一母公司100%持股的关联企业,甲企业与乙企业均为生产与办公有关产品的增值税一般纳税人。近日,母公司的管理层作出决策,拟将甲企业办公家具生产线转让给乙企业。为此,母公司的财务总监赵先生于2014年8月10日向其常年税务顾问发送了一封电子邮
如果某员工在企业工作了8年9个月,被企业解除了劳动合同,则企业应支付()个月的工资。
全面深化改革的总目标是()。
关系代数中有9种操作,其中,对关系进行垂直分割,消去某些列,并重新安排列的顺序的操作是(51);根据某些关系进行水平分割的操作是(52)。在操作(53)中,选择两个关系的公共属性均相等的元组,并去掉该操作中重复的公共属性列,将得到一种新的操作(54),如果
对于下面的程序ifstreamfin(c:\test.txt);if(fin)cout<<"ok";elsecout<<"wrong";对于if语句中的内容可
最新回复
(
0
)