首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
106
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
要清除顶层表单中调用的菜单文件,一般在表单的哪个事件中编写程序代码()。
在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是()。
下列选项中,不属于数据管理员(DBA)职责的是()。
报表的数据源可以是()。
以下程序(请注意循环体内的LOOP和EXIT语句)的运行结果是()。CLEARX=5DOWHILE.T.X=X+5IFX=INT(X/5)*577XELSELOOPENDIFIFX>10EXITENDIFENDD0
执行下列一组命令后,选择“职工”表所在工作区的错误命令是()。CLOSEALLUSE仓库IN0USE职工IN0
在考生文件夹下,打开“宾馆”数据库,完成如下简单应用:(1)使用查询设计器设计一个名称为two的查询,查询房价“价格”大于等于280元的每个客房的“客房号”、“类型号”(来自客房表)、“类型名”和“价格”。查询结果按“类型号”升序排序,并将查询结
设有关键码序列(66,13,51,76,81,26,57,69,23),要按关键码值递增的次序排序,若采用快速排序法,并以第一个元素为划分的基准,那么第一趟划分后的结果为()。
下列函数返回类型为数值型的是
随机试题
关于旅游电子商务网站的叙述不正确的是
女性,22岁。查体:叩诊心界为烧瓶样,心音遥远,诊断为心包积液。患者不常见的临床表现包括
患者,女,33岁。突发右上腹绞痛2小时,疼痛向肩部放射,恶心,呕吐2次,呕吐物为胃内容物。半天前曾吃自助餐。肝脾肋下未触及,右上腹腹肌紧张,压痛(+),反跳痛(+)。墨菲征阳性。发热,体温最高38.5℃。口苦咽干,皮肤轻度黄染,舌红苔黄,脉弦滑。该患者
念珠菌性口炎中慢性肥厚型的高龄患者,为了明确诊断有无异常增生,首选的诊断方法是()
A.龙胆草B.黄连C.生姜D.竹茹E.犀角湿热郁蒸型胎黄热重者宜加
1997年9月至10月,欧亚公司与韩国新湖商社双方通过传真方式在中国四川成都签订了四份购销合同,合同约定以信用证为支付方式。为此,欧亚公司为信用证申请人于1997年4月至8月申请开证行农行国际业务部开立了以新湖商社为受益人的五份信用证。1998年12月
在框架结构内力与位移计算当中,可以考虑现浇楼面对梁刚度的影响。今有一截面尺寸为250mm×600mm的中框架梁,其惯性矩I(mm4)可取( )项数值。
下列各项中,应冲减短期投资成本的有()。
钙过量对机体的不利影响有()。
行政监督,是指各类监督主体依法对国家行政机关及其公务员的行政行为所实施的监察、督察、督导活动,如稽查特派员监督。()
最新回复
(
0
)