首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
127
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
(1)在考生文件夹下创建一个名为mymenu.mnx的下拉式菜单,运行该菜单程序时会在当前VisualFoxPro系统菜单的末尾追加一个“考试”子菜单,如下图所示。“统计”和“返回”菜单命令的功能都通过执行“过程”完成。菜单命令“统计”的功能是以
在DOWHILE…ENDDO循环结构中,LOOP命令的作用是()。
以下小题使用如下3个数据库表:学生表:S(学号,姓名,性别,出生日期,院系)课程表:C(课程号,课程名,学时)选课成绩表:SC(学号,课程号,成绩)在上述表中,出生日期数据类型为日期型,学时和成绩为数值型,其他均为字符型。用SQL语句检索选修课
在表单(Form1)的INIT事件中编写程序代码,下列语句中不能将表单的背景颜色设置为绿色的是()。
执行下列程序:CLEARDOPROGlRETURNPROCEDUREPROGX=2DOPROG2?XRETURNPROCEDUREPROG2X=X+3RETURN程序的运行结果为()。
以下函数返回结果为数值型的是()。
下列关于类、对象、屙陛和方法的叙述中,错误的是()。
在考生文件灾下,打开“宾馆”数据库,完成如下操作:(1)打开“客户”表,给“性别”字段增加约束:性别只能为“男”或“女”,默认值为:”女”,表达式为:性别$“男女”。(2)为“入住”表创建一个主索引,主索引的索引名为fkkey,索引表达
(1)利用查询设计器创建查询,从xuesheng和chengii表中找出所有1982年出生的汉族学生记录。查询结果包含“学号”、“姓名”、“数学”、“英语”和“信息技术”5个字段;各记录按“学号”降序排序:杏询去向为表tablel。最后将查询保存在quer
(1)打开表单one,如图3-18所示,通过设置控件的相关属性,使得表单运行时的开始焦点在“打开”命令按钮,并且接下来的焦点的移动顺序是“关闭”和“退出”.(2)打开表单two,使用“布局”工具栏的“顶边对齐”按钮将表单中的3个命令按钮控件的顶
随机试题
学位
我国铁路联运货物运输费用是按()计算
()依法对期货公司及其从业人员从事期货投资咨询业务实行监督管理。
根据刑事法律制度的规定,下列各项中,有期徒刑的期限是()。
我国公布的首家全国农业旅游示范点有()。
教育方针通常由政府或政党提出,对教育实践具有强制性。()
广州战略性新兴产业的产品有的是按国家标准生产,尚未与国际标准___________,与国际同类相关产品技术不___________,导致这些产品只能销往国内市场。填入画横线部分最恰当的一项是()。
学校食堂里,肉类有鸡肉、猪肉、牛肉、羊肉、鱼肉;蛋类有鸡蛋、咸鸭蛋、鹅蛋、松花蛋;蔬菜有白菜、菠菜、花菜。小华每天中午都去食堂吃饭,都点三个不同的菜,其中至少包括肉类、蛋类、蔬菜中的两种,问至少经过多少天,可以确定小华有两天点的菜完全相同?
设函数f(x)任点x=a处可导,则函数丨f(x)丨在点x=a处不可导的允分条件是
A、态度非常生气B、态度非常强硬C、态度非常坚决D、说话声音太大C
最新回复
(
0
)