首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
财经
通过与环境交互,接受奖惩信号不断学习提高的机器学习算法是( )。
通过与环境交互,接受奖惩信号不断学习提高的机器学习算法是( )。
admin
2021-12-03
54
问题
通过与环境交互,接受奖惩信号不断学习提高的机器学习算法是( )。
选项
A、动态学习
B、强化学习
C、深度学习
D、迁移学习
答案
B
解析
动态学习是在动态环境下,学生以动态的思维方式去发现、组合、交流、创造动态信息,从而理解知识发现规律,构建自身动态知识体系,形成动态思维结构的学习方式。A项错误。强化学习是智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。B项正确。深度学习的概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。C项错误。迁移学习是指一种学习对另一种学习的影响,或习得的经验对完成其他活动的影响,广泛存在于各种知识、技能与社会规范的学习中。D项错误。故本题选B。
转载请注明原文地址:https://kaotiyun.com/show/o2Sc777K
本试题收录于:
综合知识题库银行系统招聘考试分类
0
综合知识
银行系统招聘考试
相关试题推荐
下列关于我国的公司债的说法正确的是()。
与其他商业银行相比,新成立的中国邮政储蓄银行的特征有()。
在Word编辑状态下,移动鼠标光标至某段左侧,当鼠标光标变成箭头时连击3下,将会选中()。
省政府办公厅要求各级各部门领导干部深入基层、走近群众开展春节慰问活动,秘书小王起草公文,他使用的公文文种应是()。
产品市场生命周期是指产品从研制成功投入市场开始,经过成长、成熟阶段.最终到衰退、被淘汰为止所经历的时间。()
对于一个烟草企业来讲,以下哪些因素代表的是该企业的机会?()
随着行业营销费用的增加,刺激消费的力度加大,市场需求一般会随之增大,但当营销费用超过一定水平后,就不能进一步促进需求,市场需求达到极限值,这个极限值被叫做()。
我国商业银行的组织形式是单一银行制。()
()是指客户在银行计算机网络和各种终端设备上,自己动手办理以前由银行职员才能办理的一套银行业务。
古希腊智者学派的出现,表明人类第一次意识到自己是自身所属社会的审判者,人有资格、有力量,也有权利重新规范自己的生活,这是原始宗教和自然统治之下人类自我意识的第一次觉醒,是西方人文精神的起源。这种理论是()。
随机试题
下列对交易成本的表述正确的有()。
下述哪条不属强迫症状()
A、药物从给药部位进入体循环B、药物在机体内发生化学结构的变化C、药物在机体内发生化学结构的变化及由体内排出体外D、药物从血液向组织器官转运E、原型药物或其代谢物由体内排出体外药物消除是指
医疗机构配制制剂的最重要条件是
成釉细胞瘤的临床特征错误的是()
卖券还款是指客户通过其信用证券账户申报买券,结算时买入证券直接划转至证券公司融券专用证券账户的一种还券方式。( )
甲公司决定2007年12月31日开始对存货采用成本与可变现净值孰低法计价。2007年12月31日与2008年12月31日的有关存货的数据如下:成本
股份有限公司为了使已发行的可转换债券尽快地实现转换,或者为了达到反兼并、反收购的目的,应采用的策略是()。
赵某、钱某都是某公司的职员,两人同住一宿舍。2007年春,公司派赵某到珠海办事处工作1年。临行前,赵某将已使用了1年的一台电脑委托给钱某保管并允许其使用。1个月后,赵某给钱某写信说自己买了一台笔记本电脑,委托其保管的电脑可以适当价格出售,但modem因还有
TodayI’dliketotalkaboutwhathelpspeoplesuccessfullyintegrateintoanewculture.Whereasthereasonsformigrationare
最新回复
(
0
)