考生文件夹下存在3个Python源文件，分别对应3个问题；1个文本文件，作为本题目的输入数据，请按照源文件内部说明修改代码，实现以下功能。《卖火柴的小女孩》是丹麦童话故事作家安徒生写的一篇童话故事，发表于1846年。主要讲了一个卖火柴的小女孩在富

admin2021-03-16 75

问题考生文件夹下存在3个Python源文件，分别对应3个问题；1个文本文件，作为本题目的输入数据，请按照源文件内部说明修改代码，实现以下功能。
《卖火柴的小女孩》是丹麦童话故事作家安徒生写的一篇童话故事，发表于1846年。主要讲了一个卖火柴的小女孩在富人阖家欢乐、举杯共庆的大年夜冻死在街头的故事。这里给出《卖火柴的小女孩》的一个网络版本文件，文件名为“小女孩．txt”。
问题1：在“PY301-1．py”文件中修改代码，对“小女孩．txt”文件进行字符频次统计，输出频次最高的中文字符(不包含标点符号)及其频次，字符与频次之间采用英文冒号(：)分隔，将输出结果保存在考生文件夹下，命名为“PY301-1．txt”。示例格式如下。
的：83
试题程序：
#以下代码为提示框架
#请在…处使用一行或多行代码替换
#请在________处使用一行代码替换
#注意：提示框架的代码可以任意修改，以完成程序功能为准
…
fo＝open("PY301-1．txt"，"w")
d＝{}
…
fo．write("{}：{}"．format(________))
fo．close()
问题2：在“PY301-2．py”文件中修改代码，对“小女孩．txt”文件进行字符频次统计，按照频次由高到低，输出前10个频次最高的字符，不包含回车符，字符之间无间隔，连续输出，将输出结果保存在考生文件夹下，命名为“PY301-2．txt”。示例格式如下。
，的一…(共10个字符)
试题程序：
#以下代码为提示框架
#请在…处使用一行或多行代码替换
#注意：提示框架的代码可以任意修改，以完成程序功能为准
…
fo＝open("PY301-2．txt"，"w")
…
d＝{}
…
ls＝list(d．items())
ls．sort(key＝lambda x：x[1]，reverse＝True)#此行可以按照字符频次由高到低排序
…
问题3：在PY301-3．PY文件中修改代码，对“小女孩．txt”文件进行字符频次统计，将所有字符按照频次从高到低排序，字符包括中文、标点、英文等，但不包含空格符和回车符。将排序后的字符及频次输出到考生文件夹下，文件名为“小女孩-频次排序．txt”。字符与频次之间采用英文冒号(：)分隔，各字符之间采用英文逗号(，)分隔，参考CSV格式，最后无逗号，文件内部示例格式如下。
着：30，那：29，火：29
试题程序：
#以下代码为提示框架
#请在…处使用一行或多行代码替换
#注意：提示框架的代码可以任意修改，以完成程序功能为准
…
d＝{}
…
ls＝1ist(d．items())
ls．sort(key＝lambda x：x[1],reverse＝True)
#此行可以按照字符频次由高到低排序
…

选项

答案(1)fi＝open("小女孩．txt"，"r") fo＝open("PY301-1．txt"，"w") txt＝fi．read() d＝{} exclude＝"，。!?、【】<>《》＝：＋－*—“”…" for word in txt： if word in exclude： continue else： d[word]＝d．get(word，0)＋1 ls＝list(d．items()) ls．sort(key＝lambda x：x[1]，reverse＝True) fo．write("{}：{}"．format(ls[0][0],ls[0][1])) fo．close() (2)f＝open("小女孩．txt"，"r") fo＝open("PY301-2．txt"，"w") txt＝fi．read() d＝{} for word in txt： d[word]＝d．get(word，0)＋1 del d["\n"] ls＝list(d．items()) ls．sort(key＝lambda x：x[1]，reverse＝True) #此行可以按照字符频次由大到小排序 for i in range(10)： fo．write(ls[i][0]) fi．close() fo．close() (3)i＝open("小女孩．txt"，"r") fo＝open("小女孩-频次排序．txt"，"w") txt＝f．read() d＝{} for word in txt： d[word]＝d．get(word，0)＋1 del d[""] del d["\n"] ls＝list(d．items()) ls．sort(key＝lambda x：x[1]，reverse＝True) #此行可以按照字符频次由大到小排序 for i in range(len(1s))： ls[i]＝"{} ：{}"．format(ls[i][0]，ls[i][1]) fo．write("，"．join(ls)) fi．close() fo．close()

解析 (1)首先使用open()函数打开文件“小女孩．txt”，把文件的内容通过read()方法保存到变量txt中；定义一个字符串变量exclude用来存放标点符号。然后用for循环遍历txt中的每个字符(word)，并使用if条件进行判断，若该字符在变量exclude中，说明该字符为标点符号，跳出该循环；否则将该字符作为字典d中的一个键，该键所对应的值初始化为l，在后面循环中只要遍历的字符与该键相同，就将该键对应的值加1。
ls＝list(d．items())表示将字典类型变成列表类型，字典中的每个键值对对应列表中的一个元组。随后，对列表ls进行排序，用到sort()方法，参数key＝lambda x：x[1]中lambda是匿名函数，是固定写法，不能写成别的单词；x表示列表中的一个元素，在这里表示一个元组，x只是临时起的名字，也可以使用任意的名字；x[1]表示以元组中第二个元素排序。sort()方法的第二个参数表示是按哪种方式排序，若为reverse＝True表示按降序排序；若该参数缺省或reverse＝False，表示按升序排序。排序后，列表ls中第一个元组即为频次最大的中文字符和频次，ls[0][0]表示该字符，ls[0][1]表示其频次，将这两个元素通过冒号连接写入文件“PY301-1．txt”中。
(2)问题2和问题1的区别在于统计的字符包含标点符号，因此不需要设置字符串变量exclude和使用if条件语句进行判断；题目要求不包含回车符，因此需要使用del删除字典d中键为＼n的元素。最后要无间隔输出前10个频次最大的字符，需要对排序好的列表ls进行for循环遍历，找到前10个元组的第一个元素，并将其直接写入文件“PY301-2．txt”中。
(3)问题3和问题2的区别在于统计的字符中不能包含空格符，因此需要使用del删除字典d中键为空格符的元素。最后要将所有字符和其频次输出，需要对排序好的列表ls进行for循环遍历，遍历列表中的每个元组，并将元组中的两个元素通过冒号连接，再用逗号分隔每个字符写入文件“小女孩-频次排序．txt”中。

转载请注明原文地址:https://kaotiyun.com/show/Tq6p777K

本试题收录于：二级Python题库NCRE全国计算机二级分类

二级Python

NCRE全国计算机二级

相关试题推荐

随机试题

最新回复(0)

二级Python

NCRE全国计算机二级

报表的数据源不包括（）。

下列叙述中正确的是（）。

在VisualFoxpro中，当创建一个数据库时将产生若干文件，其中不包括的是(）。

设数据库中职工表的结构为(职工号，姓名，部门号，出生日期），如果要查询姓名相同的职工信息，则正确的SQL语句是(）。

在表单设计阶段，以下说法正确的是()。

下列不属于软件工程3个要素的是()。

结构化程序设计的3种结构是()。

使用如下数据表：学生．DBF：学号(C，8)，姓名(C，6)，性别(C，2)，出生日期(D)选课．DBF：学号(C，8)，课程号(C，3)，成绩(N，5，1)假定学号的第3、4位为专业代码，要计算各专业学生选修课程号为“101”课程的

下列程序的运行结果是>>>s=’PYTHON’>>>“｛0：3｝”．format(s)

以下选项中，不是Python语言保留字的是

溶液中存在大量多价反离子时，可能降低阴离子表面活性剂的溶解度，产生盐析现象。()

以下对瘫痪病人的护理不正确的是

下列关于房地产纪经行业信用管理的表述中，不正确的是()。

在某建设项目中，合同双方约定承包单位垫资30％施工，并约定了利息，承包单位完成了约定的工程量后，如果建设单位不按约定履行，则()。

根据下面材料。回答下列题目：投资者预测来年的市场收益率为12%，国库券收益率为4%。CFI公司股票的贝塔值为0.50，在外流通股的市价总值为1亿美元。假定该股票被公正地定价，投资者估计其期望收益率为(　　)。

基金招募说明书需要包括()等内容。

城镇化是现代化的必由之路，既是经济发展的结果，又是经济发展的动力。推进新型城镇化的核心是()

关系数据库中，实现主码标识元组的作用是通过

下列关于接入技术特征的描述中，错误的是()。

GeorgeHerbertMeadsaidthathumansaretalkedintohumanity.Hemeantthatwegainpersonalidentityaswecommunicatewithot

二级Python

NCRE全国计算机二级

报表的数据源不包括（）。

下列叙述中正确的是（）。

在VisualFoxpro中，当创建一个数据库时将产生若干文件，其中不包括的是(）。

设数据库中职工表的结构为(职工号，姓名，部门号，出生日期），如果要查询姓名相同的职工信息，则正确的SQL语句是(）。

在表单设计阶段，以下说法正确的是()。

下列不属于软件工程3个要素的是()。

结构化程序设计的3种结构是()。

使用如下数据表：学生．DBF：学号(C，8)，姓名(C，6)，性别(C，2)，出生日期(D)选课．DBF：学号(C，8)，课程号(C，3)，成绩(N，5，1)假定学号的第3、4位为专业代码，要计算各专业学生选修课程号为“101”课程的

下列程序的运行结果是>>>s=’PYTHON’>>>“｛0：3｝”．format(s)

以下选项中，不是Python语言保留字的是

溶液中存在大量多价反离子时，可能降低阴离子表面活性剂的溶解度，产生盐析现象。()

以下对瘫痪病人的护理不正确的是

下列关于房地产纪经行业信用管理的表述中，不正确的是()。

在某建设项目中，合同双方约定承包单位垫资30％施工，并约定了利息，承包单位完成了约定的工程量后，如果建设单位不按约定履行，则()。

根据下面材料。回答下列题目：投资者预测来年的市场收益率为12%，国库券收益率为4%。CFI公司股票的贝塔值为0.50，在外流通股的市价总值为1亿美元。假定该股票被公正地定价，投资者估计其期望收益率为( )。

基金招募说明书需要包括()等内容。

城镇化是现代化的必由之路，既是经济发展的结果，又是经济发展的动力。推进新型城镇化的核心是()

关系数据库中，实现主码标识元组的作用是通过

下列关于接入技术特征的描述中，错误的是()。

GeorgeHerbertMeadsaidthathumansaretalkedintohumanity.Hemeantthatwegainpersonalidentityaswecommunicatewithot

根据下面材料。回答下列题目：投资者预测来年的市场收益率为12%，国库券收益率为4%。CFI公司股票的贝塔值为0.50，在外流通股的市价总值为1亿美元。假定该股票被公正地定价，投资者估计其期望收益率为(　　)。