[1]唐波;李衍杰;殷保群;.连续时间部分可观Markov决策过程的策略梯度估计[J]控制理论与应用.2009,(07)
|
[2]殷保群;李衍杰;唐昊;代桂平;奚宏生;.半Markov决策过程折扣模型与平均模型之间的关系[J]控制理论与应用.2006,(01)
|
[3]代桂平;殷保群;李衍杰;奚宏生;.半Markov控制过程基于性能势仿真的并行优化算法[J]中国科学技术大学学报.2006,(02)
|
[4]殷保群;李衍杰;周亚平;奚宏生;.可数半Markov决策过程折扣代价性能优化[J]控制与决策.2006,(08)
|
[5]殷保群,李衍杰,周亚平,奚宏生.半Markov控制过程在折扣代价准则下的最优平稳策略[J]控制与决策.2004,(06)
|
[6]秦廷,陈宗海,李衍杰.递推最小二乘算法的补充性证明[J]系统仿真学报.2004,(10)
|
[7]李衍杰,殷保群,奚宏生,周亚平,代桂平.半Markov过程基于性能势的灵敏度分析和性能优化[J]控制理论与应用.2004,(06)
|
[8]李衍杰,殷保群,奚宏生,代桂平.一类连续时间Markov链的灵敏度分析和性能优化[J]中国科学技术大学学报.2004,(06)
|
[9]代桂平,殷保群,李衍杰,周亚平,奚宏生.半Markov控制过程在平均准则下的优化算法[J]中国科学技术大学学报.2005,(02)
|
[10]殷保群,李衍杰,奚宏生,周亚平.一类可数Markov控制过程的最优平稳策略[J]控制理论与应用.2005,(01)
|
更多
|