文件sweb.html保存了一个网页的源代码,其中,“href=”引导后面会有一个URL链接,例如:href=’’http://news.sina.com.cn/feedback/post.html’’,其中,有一种链接前后都有空格,且双引号内以“http

admin2019-09-02  28

问题 文件sweb.html保存了一个网页的源代码,其中,“href=”引导后面会有一个URL链接,例如:href=’’http://news.sina.com.cn/feedback/post.html’’,其中,有一种链接前后都有空格,且双引号内以“http://”开头。
请编写程序,解析这个文件,提取出现符合上述特征的URL链接,每个链接一行,保存导“text—urls.txt”文件中,格式如下:
URL1
URL2
(略)

选项

答案参考程序: fi=open(’’sweb.html’’,’’r’’,encoding=’utf一8’) fo=open(’’text—urls.txt’’,’’w’’,encoding=’utf一8’) txt=fi.read() ls=txt.split(’’’’) urls=[] for itom in ls: if item[:5]==’’href=’’and item[6:13]==’’http://’’: x=item.find(’’>’’,5) if x==一1: urls.append(item[6:一1]) else: urls.append(item[6:x—lencitem)一1]) for item in urls: fo.write(item+’’、n’’) fi.clogo() fo.close()

解析
转载请注明原文地址:https://kaotiyun.com/show/Bk6p777K
0

相关试题推荐
最新回复(0)