分类目录归档：强化学习

Emanuel Todorov

Emanuel Todorov是神经科学家，是华盛顿大学运动控制实验室的副教授和主任。他介绍了使用最优控制作为生物运动的正式解释框架，是MuJoCo物理引擎的主要开发者。他被引用次数最多的出版物在Google学术搜索中被引用1871次。Emanuel Todorov还是伦敦大学学院的盖茨比计算神经科学部门的博士后研究员，隶属于Peter Dayan和Geoffrey Hinton，专注于强化学习的研究，是2004年斯隆神经科学奖学金的获得者。

个人主页：http://homes.cs.washington.edu/~todorov/

David Silver

David Silver，DeepMind强化学习研究小组的领头人，担任AlphaGo的首席研究员。1997年毕业于剑桥大学，获得Addison-Wesley奖。Silver与Demis Hassabis共同创办了视频游戏公司Elixir Studios，并担任首席技术官和首席程序员，获得了多项技术和创新奖。Silver于2004年在阿尔伯塔大学回到学术界攻读强化学习博士学位。Silver于2011年获得皇家学会大学研究奖学金，随后成为伦敦大学学院的讲师，现任教授。

个人主页：http://www.dwsilver.com