Seminar aus maschinellem Lernen
Übersicht
Im Rahmen dieses Seminars diskutieren wir aktuelle Forschungsergebnisse aus verschiedenen Bereichen des maschinellen Lernens. In diesem Semester wird das Thema des Seminars
- Monte-Carlo Tree Search
sein, d.h. wir werden aktuelle Forschungsartikel aus diesem Gebiet lesen und diskutieren. Einen einführenden Überblick über dieses Themengebiet finden Sie hier.
Wir werden sowohl verschiedene Varianten des Grundalgorithmus durchbesprechen als auch ihren Einsatz in verschiedenen Anwendungen, insbesondere im Bereich Computer Game Playing. Detaillierte Themenvorschläge werden noch bekanntgegeben. Sie können auch eigene, thematisch relevante Vorschläge machen.
Es wird erwartet, daß Studenten die ihnen zugeteilten Materialien in einem ca. 45-minütigen Kurz-Vortrag (30 min Vortrag, 15 min Diskussion) vorstellen. Der Vortrag sollte jedoch inhaltlich über diese Materialien hinausgehen und eine selbstständige Auseinandersetzung mit dem gewählten Thema demonstrieren.
Organisatorisches
Zeit und Ort: Dienstags, 17:10-18:50 Uhr, E202.
Am Di, 21.10.2014 gab es die Vorbesprechung zum Seminar, in welcher die Vergabe der Themen erfolgte. Mögliche Themen sind Unterabschnitte aus dem oben bereits erwähnten Überblicksartikel:
- Cameron Browne, Edward J. Powley, Daniel Whitehouse, Simon M. Lucas, Peter I. Cowling, Philipp Rohlfshagen, Stephen Tavener, Diego Perez, Spyridon Samothrakis, Simon Colton: A Survey of Monte Carlo Tree Search Methods. IEEE Trans. Comput. Intellig. and AI in Games 4(1): 1-43 (2012)
Jeder der Unter-Abschnitte in den Kapiteln 4, 5 und 6 verweist auf einen Komplex von Arbeiten und kann als Thema gewählt werden. Im Vortrag muss der Abschnitt dann mit Hilfe der im Text angegebenen Referenzen vertieft werden.
Folgende Themen sind bereits vergeben.
18.11. 2014
25. 11. 2014
2. 12. 2014
- UCT and Temporal-Difference Learning (4.3.1,4.3.2, Jannik Sven Abbenseth, Slides)
- Bandit-Based Active Learning (4.3.3, Markus Schelmbauer, Slides)
9. 12. 2014
- Selection Enhancements (5.2.,5.3, Florian Weber, Slides)
- Single-Player MCTS (4.4, ohne 4.4.1, Rybien Sinjari)
16. 12. 2014
- Multi-Player UCTS (4.5, Jan-Simon Bunten)
- Multi-Agent UCTS (4.6, Tjark Vandommele, Slides)
13. 1. 2015
- Monte-Carlo Alpha-Beta (4.8.7, Florian Reimold, Slides)
- Opponent Modeling and UCT (4.8.9)
20. 1. 2015
- Real-time UCTS (4.7, David Kaufmann, Slides)
- Feature Selection with MCTS (4.4.1, Robert Pinsler, Slides)
Ablauf
Jede/r Student/in erhält einen oder mehrere Fachartikel zur Ausarbeitung, deren wesentliche Aspekte dann in einem Vortrag vorgestellt und im Anschluß von allen diskutiert werden sollen. Die Vorträge und/oder Folien können wahlweise auf Deutsch oder Englisch gehalten werden. Es wird erwartet, dass regelmäßig am Seminar teilgenommen wird, dafür muss man keine Ausarbeitung anfertigen.
Vorkenntnisse
Da diese Artikel dem letzten Stand der Forschung entsprechen, wird einerseits erwartet, dass entsprechende Grundkenntnisse (und Interesse!) in maschinellem Lernen und Data Mining mitgebracht werden, dass man sich aber andererseits im Zuge der Vorbereitung auch selbständig mit der Thematik weiter vertraut macht und ggf. auch weiterführende bzw. grundlegende Literatur zu Rate zieht (bitte Quellen nennen).
Vorträge
Es wird erwartet, daß Sie die Vorträge mit Folien begleiten. Falls Sie keinen Laptop haben, bitten wir darum, uns die Slides rechtzeitig zu senden, damit wir sie auf einem anderen Laptop einspielen bzw. testen können. Die Vorträge und/oder Slides können wahlweise auf Deutsch oder Englisch gehalten werden.
Benotung
In die Gesamtnote fließen die Ausarbeitung des Vortrags (Folien), die Präsentation, die Beantwortung von Fragen zum Vortrag, sowie die aktive Teilnahme an der Diskussion bei den Vorträgen anderer ein.
Im Vordergrund der Gesamtbenotung steht jedoch die selbständige Auseinandersetzung mit dem Problem. Für eine sehr gute (1.x) Beurteilung muß klar sein, dass Sie die fraglichen Arbeiten verstanden haben und von den vorliegenden Papers abstrahieren können. Eine exakte Wiedergabe des Inhalts der Papiere führt nur zu einer Beurteilung mit 2.x, außerordentlich schwache Leistungen in einem der genannten Punkte zu 3.x oder schlechter.