Seminar aus maschinellem Lernen

Übersicht

Im Rahmen dieses Seminars diskutieren wir aktuelle Forschungsergebnisse aus verschiedenen Bereichen des maschinellen Lernens. In diesem Semester wird das Thema des Seminars

  • Monte-Carlo Tree Search

sein, d.h. wir werden aktuelle Forschungsartikel aus diesem Gebiet lesen und diskutieren. Einen einführenden Überblick über dieses Themengebiet finden Sie hier.

Wir werden sowohl verschiedene Varianten des Grundalgorithmus durchbesprechen als auch ihren Einsatz in verschiedenen Anwendungen, insbesondere im Bereich Computer Game Playing. Detaillierte Themenvorschläge werden noch bekanntgegeben. Sie können auch eigene, thematisch relevante Vorschläge machen.

Es wird er­wartet, daß Stu­den­ten die ihnen zugeteil­ten Ma­te­ri­alien in einem ca. 45-minütigen Kurz-Vor­trag (30 min Vor­trag, 15 min Diskus­sion) vorstellen.​ Der Vor­trag sollte je­doch in­haltlich über diese Ma­te­ri­alien hin­aus­ge­hen und eine selbst­ständige Au­seinan­der­set­zung mit dem gewählten Thema demon­stri­eren.

Organisatorisches

Zeit und Ort: Dienstags, 17:10-18:50 Uhr, E202.

Am Di, 21.10.2014 gab es die Vorbesprechung zum Seminar, in welcher die Vergabe der Themen erfolgte. Mögliche Themen sind Unterabschnitte aus dem oben bereits erwähnten Überblicksartikel:

  • Cameron Browne, Edward J. Powley, Daniel Whitehouse, Simon M. Lucas, Peter I. Cowling, Philipp Rohlfshagen, Stephen Tavener, Diego Perez, Spyridon Samothrakis, Simon Colton: A Survey of Monte Carlo Tree Search Methods. IEEE Trans. Comput. Intellig. and AI in Games 4(1): 1-43 (2012)

Jeder der Unter-Abschnitte in den Kapiteln 4, 5 und 6 verweist auf einen Komplex von Arbeiten und kann als Thema gewählt werden. Im Vortrag muss der Abschnitt dann mit Hilfe der im Text angegebenen Referenzen vertieft werden.

Folgende Themen sind bereits vergeben.

18.11. 2014

  • Monte-Carlo Methoden (2.3, Timo Nolle, Slides)
  • Bandit Methoden (2.4, Jan-Hendrik Lange, Slides)

25. 11. 2014

  • UCT + Properties (3.4, Patrick Bitz, Slides)
  • UCT vs. Minimax (3.5, Benedikt Wartusch, Slides)

2. 12. 2014

  • UCT and Temporal-Difference Learning (4.3.1,4.3.2, Jannik Sven Abbenseth, Slides)
  • Bandit-Based Active Learning (4.3.3, Markus Schelmbauer, Slides)

9. 12. 2014

  • Selection Enhancements (5.2.,5.3, Florian Weber, Slides)
  • Single-Player MCTS (4.4, ohne 4.4.1, Rybien Sinjari)

16. 12. 2014

  • Multi-Player UCTS (4.5, Jan-Simon Bunten)
  • Multi-Agent UCTS (4.6, Tjark Vandommele, Slides)

13. 1. 2015

  • Monte-Carlo Alpha-Beta  (4.8.7, Florian Reimold, Slides)
  • Opponent Modeling and UCT (4.8.9)

20. 1. 2015

  • Real-time UCTS (4.7, David Kaufmann, Slides)
  • Feature Selection with MCTS (4.4.1, Robert Pinsler, Slides)

Ablauf

Jede/r Student/in erhält einen oder mehrere Fachartikel zur Ausarbeitung, deren wesentliche Aspekte dann in einem Vortrag vorgestellt und im Anschluß von allen diskutiert werden sollen. Die Vorträge und/oder Folien können wahlweise auf Deutsch oder Englisch gehalten werden. Es wird erwartet, dass regelmäßig am Seminar teilgenommen wird, dafür muss man keine Ausarbeitung anfertigen.

Vorkenntnisse

Da diese Artikel dem letzten Stand der Forschung entsprechen, wird einerseits erwartet, dass entsprechende Grundkenntnisse (und Interesse!) in maschinellem Lernen und Data Mining mitgebracht werden, dass man sich aber andererseits im Zuge der Vorbereitung auch selbständig mit der Thematik weiter vertraut macht und ggf. auch weiterführende bzw. grundlegende Literatur zu Rate zieht (bitte Quellen nennen).

Vorträge

Es wird erwartet, daß Sie die Vorträge mit Folien begleiten. Falls Sie keinen Laptop haben, bitten wir darum, uns die Slides rechtzeitig zu senden, damit wir sie auf einem anderen Laptop einspielen bzw. testen können. Die Vorträge und/oder Slides können wahlweise auf Deutsch oder Englisch gehalten werden.

Benotung

In die Gesamtnote fließen die Ausarbeitung des Vortrags (Folien), die Präsentation, die Beantwortung von Fragen zum Vortrag, sowie die aktive Teilnahme an der Diskussion bei den Vorträgen anderer ein.

Im Vordergrund der Gesamtbenotung steht jedoch die selbständige Auseinandersetzung mit dem Problem. Für eine sehr gute (1.x) Beurteilung muß klar sein, dass Sie die fraglichen Arbeiten verstanden haben und von den vorliegenden Papers abstrahieren können. Eine exakte Wiedergabe des Inhalts der Papiere führt nur zu einer Beurteilung mit 2.x, außerordentlich schwache Leistungen in einem der genannten Punkte zu 3.x oder schlechter.

Kontakt

small ke-icon

Knowledge Engineering Group

Fachbereich Informatik
TU Darmstadt

S2|02 D203
Hochschulstrasse 10

D-64289 Darmstadt

Sekretariat:
Telefon-Symbol+49 6151 16-21811
Fax-Symbol +49 6151 16-21812
E-Mail-Symbol info@ke.tu-darmstadt.de

 
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang