所有作者:郑力明 李晓冬 李小勇
作者单位:武警成都指挥学院 信息技术教研室
论文摘要:增强学习意味着学习一种策略,即基于环境的反馈信息构造从状态到行为的映射,其本质为通过与环境的交互试验对策略集合进行评估。将增强学习运用于网络路由中,提出了一种基于梯度上升算法实现的增强学习的自适应路由算法RLAR,通过对比多种现有路由算法,证明了RLAR能有效提高网络路由性能。
关键词: 增强学习 路由 梯度上升 马尔可夫决策过程 自适应
免费下载《RLAR:一种基于增强学习的自适应路由算法》PDF全文(已停止下载)
本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!
下一篇:一个基于聚类的交互式对象搜索系统