算法在新闻推送中的问题以及应对办法。(人大2019年研)

admin2021-11-30  11

问题 算法在新闻推送中的问题以及应对办法。(人大2019年研)

选项

答案算法是指对解题方案的准确而完整的描述,是一系列解决问题的清晰指令。算法代表着用系统的方法描述解决问题的策略机制。在算法主导的移动新闻资讯时代,把用户阅读的选择权交给机器算法依然存在很多争议。这不仅在于技术本身面临的挑战,而且算法营造的拟态环境也存在伦理风险。 (1)个性化推荐算法带来的问题包括: ①内容不符合用户兴趣。个性化推荐算法并不一定能把符合用户兴趣的内容推荐给用户,原因有很多: a.从数据质量上看,个性化推荐对数据的数量和质量要求比较高,如果一个用户缺乏有质量的数据,个性化推荐远远不如热门推荐的效果。多数新闻资讯类应用要面对大量历史阅读记录空白的新增用户,对他们进行个性化推荐的效果并不好。 b.从目前自然语言处理的局限来看,个性化推荐系统无法对文章内容做深入理解。目前的自然语言处理只能从其特有的高频关键词上进行标签层面的相似度匹配,这样产生的肤浅话题无法与用户气质、性格、生活方式进行深层次匹配,很难满足用户阅读新闻资讯中一些细腻的心理需要。协同过滤算法本身的缺陷,也造成了一些个性化推荐算法的推送内容不符合用户必趣。一个经典的例子是,娱乐新闻往往很受欢迎,因此用户在协同过滤中的近邻群体多少都阅读过一些娱乐新闻,但这个用户可能从来不读娱乐新闻,强行推荐会使他反感。 ②内容质量问题。纯粹的个性化推荐系统对文章的质量和内容没有把关。算法只是提取文章中包含的特征关键词,并将其与用户兴趣进行匹配。算法并不知道文章水平如何,内容是否健康。一篇文章可能没有任何有意义的内容,只是堆砌一些用户可能感兴趣的词语,但仍然会被算法推送给用户。算法本身是对用户特征和文本数据进行匹配,因此越是相似的结果越会被优先推荐,这容易导致内容同质化。 ③信息茧房与信息成瘾。信息茧房是指信息个性化技术使得人们可能减少阅读多样化内容的趋势。由于个性化推荐系统是根据用户已有的阅读偏好进行关键词匹配和推荐,因此相似性较低的内容基本上不会被推荐,这样用户的阅读内容会变得狭隘。在一次又一次阅读自己喜欢领域的信息后,用户不断地在自己与整个世界之间筑起一座高墙。许多人沉湎于这样的拟态环境中,无法自拔。 ④可遗忘性。个性化推荐算法“记住”了用户看过的文章和相应的喜好,但是对于用户来说,这种记住不一定是好事,用户也存在着让算法忘记他过去喜好的需求。 ⑤版权问题。算法只负责推荐,并不知道文章由谁撰写,以及是否涉嫌抄袭。事实上,有很多企业的推荐系统中推荐的文章数据,是由爬虫从其他网页抓取的,换句话说,是未经授权的窃取。 (2)推荐算法的优化策略包括: ①不断革新技术。运用以人工神经网络为代表的新的算法范式,对推荐系统中许多难以解决的老问题很可能会有非常好的效果。目前,以深度学习为代表的人工神经网络方法在图像识别、声音识别领域取得了巨大成就,人工神经网络方法正在被许多研究者尝试运用到推荐系统中。针对很多新用户缺乏数据沉淀,从而难以进行有效推荐的问题,可以通过获取用户其他平台信息、获取用户已安装的其他软件信息以及引导用户进行口味选择这三种方法来解决。需要注意的是,此举可能侵犯用户隐私,在实际应用中,应当获得用户的许可和授权。基于内容的推荐不应当划分得过细,以免推荐文章与原先文章主题重合度过高。建议对新闻资讯文章进行分类,根据用户阅读记录,提高用户经常阅读分类的权重。算法的可遗忘性问题只需通过加入重置用户画像的功能,即可圆满解决。 ②构建优质内容生态。从内容生态的构建角度,互联网企业应当考虑整个产业的长远发展,将回报向优质内容的生产者进行倾斜,同时遏制低俗内容的蔓延。作为互联网公司,要改变单纯追求用户时长的KPI(关键绩效指标)评判标准,注意内容的消费升级。 ③加大人工审核力度,加强立法管理。尽管自动化内容审核系统已经做得比较先进,但仍需要人工审核来进行最后把关。要积极通过立法方式规范监管,鼓励优质主旋律内容的生产和传播。同时政府机构应当发挥作用,对市场调节失灵的情况进行合理干预,让信息流消费市场不至于沦为低质量内容循环生产的垃圾堆。政府还应对互联网企业加以引导,鼓励企业将算法权重向优质内容倾斜,对频频出现三俗内容的产品加以约束。 ④克服信息茧房。互联网公司应该改变唯用户时长的KPI评判标准,才能彻底克服信息茧房效应。技术上克服信息茧房问题也有多种途径,可以使用推荐系统获取更多输入信息以增进对用户的了解。协同过滤亦能有效帮助用户发现新的兴趣点。同时,推荐系统中的热门推荐算法会依据当前阅读量排序获得一些热点资讯,多与用户当前兴趣无关,但也能帮助用户发现新的兴趣点。

解析
转载请注明原文地址:https://kaotiyun.com/show/FAha777K
0

最新回复(0)