分类目录归档:强化学习

Emanuel Todorov

Emanuel Todorov是神经科学家,是华盛顿大学运动控制实验室的副教授和主任。他介绍了使用最优控制作为生物运动的正式解释框架,是MuJoCo物理引擎的主要开发者。他被引用次数最多的出版物在Google学术搜索中被引用1871次。Emanuel Todorov还是伦敦大学学院的盖茨比计算神经科学部门的博士后研究员,隶属于Peter Dayan和Geoffrey Hinton,专注于强化学习的研究,是2004年斯隆神经科学奖学金的获得者。

个人主页:http://homes.cs.washington.edu/~todorov/

David Silver

David Silver,DeepMind强化学习研究小组的领头人,担任AlphaGo的首席研究员。1997年毕业于剑桥大学,获得Addison-Wesley奖。Silver与Demis Hassabis共同创办了视频游戏公司Elixir Studios,并担任首席技术官和首席程序员,获得了多项技术和创新奖。Silver于2004年在阿尔伯塔大学回到学术界攻读强化学习博士学位。Silver于2011年获得皇家学会大学研究奖学金,随后成为伦敦大学学院的讲师,现任教授。

个人主页:http://www.dwsilver.com