227-0559-00L  Seminar in Deep Reinforcement Learning

SemesterFrühjahrssemester 2020
DozierendeR. Wattenhofer, O. Richter
Periodizitätjährlich wiederkehrende Veranstaltung
LehrspracheEnglisch
KommentarNumber of participants limited to 25.



Lehrveranstaltungen

NummerTitelUmfangDozierende
227-0559-00 SSeminar in Deep Reinforcement Learning2 Std.
Di10:15-12:00ETZ G 91 »
R. Wattenhofer, O. Richter

Katalogdaten

KurzbeschreibungIn this seminar participating students present and discuss recent research papers in the area of deep reinforcement learning. The seminar starts with two introductory lessons introducing the basic concepts. Alongside the seminar a programming challenge is posed in which students can take part to improve their grade.
LernzielSince Google Deepmind presented the Deep Q-Network (DQN) algorithm in 2015 that could play Atari-2600 games at a superhuman level, the field of deep reinforcement learning gained a lot of traction. It sparked media attention with AlphaGo and AlphaZero and is one of the most prominent research areas. Yet many research papers in the area come from one of two sources: Google Deepmind or OpenAI. In this seminar we aim at giving the students an in depth view on the current advances in the area by discussing recent papers as well as discussing current issues and difficulties surrounding deep reinforcement learning.
InhaltTwo introductory courses introducing Q-learning and policy gradient methods. Afterwards participating students present recent papers. For details see: www.disco.ethz.ch/courses.html
SkriptSlides of presentations will be made available.
LiteraturOpenAI course (https://spinningup.openai.com/en/latest/) plus selected papers.
The paper selection can be found on www.disco.ethz.ch/courses.html.
Voraussetzungen / BesonderesIt is expected that student have prior knowledge and interest in machine and deep learning, for instance by having attended appropriate courses.

Leistungskontrolle

Information zur Leistungskontrolle (gültig bis die Lerneinheit neu gelesen wird)
Leistungskontrolle als Semesterkurs
ECTS Kreditpunkte2 KP
PrüfendeR. Wattenhofer, O. Richter
Formbenotete Semesterleistung
PrüfungsspracheEnglisch
RepetitionRepetition nur nach erneuter Belegung der Lerneinheit möglich.

Lernmaterialien

 
HauptlinkInformation
Es werden nur die öffentlichen Lernmaterialien aufgeführt.

Gruppen

Keine Informationen zu Gruppen vorhanden.

Einschränkungen

PlätzePlätze beschränkt. Spezielles Auswahlverfahren.
WartelisteBis 17.02.2020
BelegungsendeBelegung nur bis 11.02.2020 möglich

Angeboten in

StudiengangBereichTyp
Doktorat Departement Informationstechnologie und ElektrotechnikLehrangebot Doktorat und PostdoktoratWInformation
Elektrotechnik und Informationstechnologie MasterEmpfohlene FächerWInformation
Elektrotechnik und Informationstechnologie MasterVertiefungsfächerWInformation
Informatik MasterSeminar in General StudiesWInformation
Informatik MasterSeminar in Distributed SystemsWInformation