当前位置:文库下载 > 所有分类 > 工程科技 > 电子/电路 > 基于人工情感与Q学习的机器人行为决策_祝宇虹 (1)
免费下载此文档

基于人工情感与Q学习的机器人行为决策_祝宇虹 (1)

智能工程

基于人工情感与Q学习的机器人行为决策

祝宇虹,毛俊鑫

(哈尔滨工业大学机器人技术与系统国家重点实验室,黑龙江哈尔滨150080)

RobotsBehavioralDecision-makingStrategyBasedonArtificial

EmotionandQ-learning

ZHUYu-hong,MAOJun-xin

(StateKeyLaboratoryofRoboticsandSystem,HarbinInstituteofTechnology,Harbin150080,China)

  摘要:提出了一种新颖的带情感权重的Q学习加权策略,并将该策略应用于虚拟机器人的行为决策.通过模拟自然情感产生机理,对害怕"进行了人工情感建模,并从自然情感所具有的生存功能角度

出发,将该模型与强化学习方法相结合,与标准Q学习简单加和策略和Option分层强化学习策略进行比较的仿真实验证明了该策略具有高的成功率.该方法对于提高机器人在恶劣环境下的生存能力和自主决策能力具有很大理论意义和实际应用价值.

关键词:自主移动机器人;人工情感;强化学习中图分类号:TP273.22文献标识码:A

文章编号:1001-2257(2011)07-0061-05Abstract:Thispaperpresentsanovelemotion-weighedQlearningstrategyandapplyitinthebe-haviorselectionofavirtualrobot.Bysimulatingnaturalemotiongenerationmechanism,anartificialemotionmodeloffearisproposed.Moreover,hispapercombinesthismodelwithreinforcementlearningbasedonthesurvivalfunctionofnaturalemotion.Thecomparativesimulationexperiments

收稿日期:2011-03-24

withstandardQlearningwithoutemotionandOp-tionHRLprovethatthestrategyhastheadvan-tageofhighsuccessrate.Thismethodhasgreattheoreticalsignificanceandhighapplicationvalue

forenhancingrobot'ssurvivabilityandautonomousdecision-makingcapacityinharshandcomplexen-vironment.

Keywords:autonomousmobilerobot;artifici-alemotiom;reinforcementlearning

0 引言

在过去的几十年中,神经科学和心理学的情感研究成果正日益引起计算机科学和人工智能领域研究人员的关注.

尽管自1872年以来,达尔文的进化论已经揭示:情感是进化现象,其重要的生存功能已经帮助我们解决了进化过程中的某些挑战,可直到近年来,情感与人类非理性和非逻辑行为之间的联系才又被重视起来.人工智能和人工生命领域关注认知过程的建模和仿真,越来越清楚地认识到情感对感知、学习、决策过程、记忆、行为和其它所有关注功能的建模而言都是一个关键因素.人工情感的研究正越来

作空间和灵活度研究[J].机械设计与研究,2006,22(4):11-12.

[4] 钟 勇,朱建新.一种新的机器人工作空间求解方法

[J].机床与液压,2004,(4):66-67.

作者简介:赵文涛 (1985-),男,陕西兴平人,博士,研究方

向为机器人技术;李 军 (1981-),男,河南驻马店人,博士研究生,研究方向为机器人技术.

参考文献:

[1] 谭小群,李 军,赵国斌,姬昌睿.一种重心调整装置在

四足机器人步行中的应用[J].现代设计与先进制造技术,2008,37(28):25-28.

[2] 曹 毅,王树新,李群智.基于随机概率的机器人工作

空间及其解析表达[J].组合机床与自动化加工技术,2005,(2):1-6.

[3] 韩宝玲,王秋丽,罗庆生.六足仿生步行机器人足端工 «)

第1页下一页

免费下载Word文档免费下载:基于人工情感与Q学习的机器人行为决策_祝宇虹 (1)

(下载1-5页,共5页)

我要评论

返回顶部