考生文件夹下存在3个Python源文件,分别对应3个问题;1个文本文件,作为本题目的输入数据,请按照源文件内部说明修改代码,实现以下功能。 《卖火柴的小女孩》是丹麦童话故事作家安徒生写的一篇童话故事,发表于1846年。主要讲了一个卖火柴的小女孩在富

admin2021-03-16  30

问题 考生文件夹下存在3个Python源文件,分别对应3个问题;1个文本文件,作为本题目的输入数据,请按照源文件内部说明修改代码,实现以下功能。
    《卖火柴的小女孩》是丹麦童话故事作家安徒生写的一篇童话故事,发表于1846年。主要讲了一个卖火柴的小女孩在富人阖家欢乐、举杯共庆的大年夜冻死在街头的故事。这里给出《卖火柴的小女孩》的一个网络版本文件,文件名为“小女孩.txt”。
    问题1:在“PY301-1.py”文件中修改代码,对“小女孩.txt”文件进行字符频次统计,输出频次最高的中文字符(不包含标点符号)及其频次,字符与频次之间采用英文冒号(:)分隔,将输出结果保存在考生文件夹下,命名为“PY301-1.txt”。示例格式如下。
    的:83
    试题程序:
    #以下代码为提示框架
    #请在…处使用一行或多行代码替换
    #请在________处使用一行代码替换
    #注意:提示框架的代码可以任意修改,以完成程序功能为准
    …
    fo=open("PY301-1.txt","w")
    d={}
    …
    fo.write("{}:{}".format(________))
    fo.close()
    问题2:在“PY301-2.py”文件中修改代码,对“小女孩.txt”文件进行字符频次统计,按照频次由高到低,输出前10个频次最高的字符,不包含回车符,字符之间无间隔,连续输出,将输出结果保存在考生文件夹下,命名为“PY301-2.txt”。示例格式如下。
    ,的一…(共10个字符)
    试题程序:
    #以下代码为提示框架
    #请在…处使用一行或多行代码替换
    #注意:提示框架的代码可以任意修改,以完成程序功能为准
    …
    fo=open("PY301-2.txt","w")
    …
    d={}
    …
    ls=list(d.items())
    ls.sort(key=lambda x:x[1],reverse=True)#此行可以按照字符频次由高到低排序
    …
    问题3:在PY301-3.PY文件中修改代码,对“小女孩.txt”文件进行字符频次统计,将所有字符按照频次从高到低排序,字符包括中文、标点、英文等,但不包含空格符和回车符。将排序后的字符及频次输出到考生文件夹下,文件名为“小女孩-频次排序.txt”。字符与频次之间采用英文冒号(:)分隔,各字符之间采用英文逗号(,)分隔,参考CSV格式,最后无逗号,文件内部示例格式如下。
    着:30,那:29,火:29
    试题程序:
    #以下代码为提示框架
    #请在…处使用一行或多行代码替换
    #注意:提示框架的代码可以任意修改,以完成程序功能为准
    …
    d={}
    …
    ls=1ist(d.items())
    ls.sort(key=lambda x:x[1],reverse=True)
    #此行可以按照字符频次由高到低排序
    …

选项

答案(1)fi=open("小女孩.txt","r") fo=open("PY301-1.txt","w") txt=fi.read() d={} exclude=",。!?、【】<>《》=:+-*—“”…" for word in txt: if word in exclude: continue else: d[word]=d.get(word,0)+1 ls=list(d.items()) ls.sort(key=lambda x:x[1],reverse=True) fo.write("{}:{}".format(ls[0][0],ls[0][1])) fo.close() (2)f=open("小女孩.txt","r") fo=open("PY301-2.txt","w") txt=fi.read() d={} for word in txt: d[word]=d.get(word,0)+1 del d["\n"] ls=list(d.items()) ls.sort(key=lambda x:x[1],reverse=True) #此行可以按照字符频次由大到小排序 for i in range(10): fo.write(ls[i][0]) fi.close() fo.close() (3)i=open("小女孩.txt","r") fo=open("小女孩-频次排序.txt","w") txt=f.read() d={} for word in txt: d[word]=d.get(word,0)+1 del d[""] del d["\n"] ls=list(d.items()) ls.sort(key=lambda x:x[1],reverse=True) #此行可以按照字符频次由大到小排序 for i in range(len(1s)): ls[i]="{} :{}".format(ls[i][0],ls[i][1]) fo.write(",".join(ls)) fi.close() fo.close()

解析 (1)首先使用open()函数打开文件“小女孩.txt”,把文件的内容通过read()方法保存到变量txt中;定义一个字符串变量exclude用来存放标点符号。然后用for循环遍历txt中的每个字符(word),并使用if条件进行判断,若该字符在变量exclude中,说明该字符为标点符号,跳出该循环;否则将该字符作为字典d中的一个键,该键所对应的值初始化为l,在后面循环中只要遍历的字符与该键相同,就将该键对应的值加1。
ls=list(d.items())表示将字典类型变成列表类型,字典中的每个键值对对应列表中的一个元组。随后,对列表ls进行排序,用到sort()方法,参数key=lambda x:x[1]中lambda是匿名函数,是固定写法,不能写成别的单词;x表示列表中的一个元素,在这里表示一个元组,x只是临时起的名字,也可以使用任意的名字;x[1]表示以元组中第二个元素排序。sort()方法的第二个参数表示是按哪种方式排序,若为reverse=True表示按降序排序;若该参数缺省或reverse=False,表示按升序排序。排序后,列表ls中第一个元组即为频次最大的中文字符和频次,ls[0][0]表示该字符,ls[0][1]表示其频次,将这两个元素通过冒号连接写入文件“PY301-1.txt”中。
(2)问题2和问题1的区别在于统计的字符包含标点符号,因此不需要设置字符串变量exclude和使用if条件语句进行判断;题目要求不包含回车符,因此需要使用del删除字典d中键为\n的元素。最后要无间隔输出前10个频次最大的字符,需要对排序好的列表ls进行for循环遍历,找到前10个元组的第一个元素,并将其直接写入文件“PY301-2.txt”中。
(3)问题3和问题2的区别在于统计的字符中不能包含空格符,因此需要使用del删除字典d中键为空格符的元素。最后要将所有字符和其频次输出,需要对排序好的列表ls进行for循环遍历,遍历列表中的每个元组,并将元组中的两个元素通过冒号连接,再用逗号分隔每个字符写入文件“小女孩-频次排序.txt”中。
转载请注明原文地址:https://kaotiyun.com/show/Tq6p777K
0

最新回复(0)