首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
104
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
在考生文件夹下完成如下操作:1.打开表单one,如图1所示,通过设置控件的相关属性,使得表单开始运行时焦点在“打开”命令按钮上,并且接下来的焦点的移动顺序是“关闭”和“退出”。2.打开表单two,如图2所示,使用“布局”工具栏的“顶边对齐”按钮将表
请在考生文件夹下完成下列基本操作题。(1)新建一个名为“影院管理”的项目文件,将数据库TheatDB加入新建的“影院管理”项目中。(2)为“售票统计”表建立主索引,索引名为idx,要求按日期排序,日期相同时按放映厅排序。(3)为“售票统计”表设置有效
在考生文件夹下完成下列操作:(1)建立一个文件名和表单名均为oneform的表单文件,表单中包括两个标签控件(Labe11和Labe12)、一个选项组控件(Optiongroupl)、一个组合框控件(Combol)和两个命令按钮控件(Command1和C
在表单数据环境中,将环境中所包含的表字段拖到表单中会生成相应的控件,下列各项中,埘应正确的一项是()。
检索“成绩”表中还没有“分数”的学生“学号”和“课程号”,正确的命令是()。
在考生文件夹下,打开招生数据库sdb,完成如下操作:(1)在ksb表中增加个名为“备注”的字段、字段数据类型为“字符”、宽度为30。(2)在考生成绩表ksejb中给成绩字段设置有效性规则和默认值,成绩>=0AND成绩
在软件开发中,需求分析阶段可以使用的工具是
下列程序段执行以后,内存变量A和B的值是CLEARA=10B=20SETUDFPARMSTOREFERENCEDOSQWITH(A),(B)&&参数A是值传递,B是值传递?A,B
在“表单控件”工具栏中,除了控件按钮,还有4个辅助按钮。默认情况下处于按下状态的辅助按钮是
一个栈的初始状态为空。现将元素1、2、3、4、5、A、B、C、D、E依次入栈,然后再依次出栈,则元素出栈的顺序是
随机试题
汽车上常用仪表的名称及功用有哪些?
DNA分子碱基组成规律是
职业道德是同人们的()紧密联系的,具有自身职业特征的道德准则、职业行为规范的总和。
依靠创意人的智慧、技能和天赋,借助高科技手段创新和提升文化资源,通过对知识产权的开发和运用,推出高附加值产品,从而形成的具有创造财富和创造就业潜力的产业是()。
简述货币供给的内生性与外生性。
Whatvocabularylearningstrategydoesthefollowingactivityhelptotrain?Theteachercreatedasituationandaskedthestuden
对法律进行分类,可以从不同的标准、角度出发。一般来讲,根据不同的法律表达形式,可以把法划分为()。
毛泽东在《关于正确处理人民内部矛盾的问题》的讲话中提出,解决人民内部矛盾的方法有()
用线性探测法查找闭散列上,可能要探测多个散列地址,这些位置上的键值(31)。
已知枚举类型定义语句为:enumToken{NAME,NUMBER,PLUS=5,MINUS,PRINT=10};则下列说中错误的是()。
最新回复
(
0
)