TUD Computer Poker Challenge - SS 09
- Seminar aus Knowledge Engineering in Spielen (2 SWS)
- Praktikum aus Künstliche Intelligenz (4 SWS)
Nach Maßgabe freier Plätze kann auf Anfrage auch eine der beiden Veranstaltungen für sich belegt werden, Priorität haben jedoch Studenten, die beides absolvieren.
Inhalt
Das Ziel der Challenge ist der Entwurf und die Implementierung eines intelligenten Spielers für (Multiplayer Limit) Texas Hold'em Poker. Die Teilnehmer an der Challenge implementieren alleine oder in Kleingruppen (max. 2-3 Teilnehmer) vorraussichtlich einen Teil eines Bots. Wir ziehen eine Teilnahme an der Computer Poker Challenge in Erwägung.
Organisation
Die Veranstaltung beginnt mit einer Vorbesprechung am Dienstag, dem 10. 3. 2008, ab 16 Uhr in Raum S202/E302. In der Vorbesprechung werden
- die Teilnahmeplätze endgültig vergeben
- wir den Ablauf des Praktikums durchbesprechen
- die Vortragsthemen für das Seminar vergeben
Seminar
Die gewählten Themen werden von den Teilnehmern bis zum zweiten Termin am Montag, den 6.4.2009 um 15:00 (voraussichtlich in S202/E302) bearbeitet und die Folien zu den Präsentationen abgegeben. Die Vorträge finden im Laufe der späteren Treffen statt. Jeder Vortrag sollte nicht länger als 30 min. pro Person dauern. Ziel ist es, den anderen Teilnehmern einen Überblick über das eigene Themengebiet zu geben, sodaß alle Teilnehmer rasch einen Überblick über weiterführende Literatur für die Arbeit am Bot erhalten. Die Folien sollen deshalb 'selbstredend', also auch ohne den dazugehörigen Vortrag verständlich sein.
Praktikum
Die Praktikumsphase beginnt am 6. April.
Zeitplan
- 10. März
- Generelle Vorbesprechung und Vergabe der Seminar-Themen
- 6. April
- Abgabe der Präsentationsfolien und Treffen, Beginn des Praktikums
- 11. Juni
- Deadline für Einreichungen bei der Computer Poker Challenge
Teilnahme und Anmeldung
Die Plätze für die Teilnahme sind begrenzt und werden von uns vergeben. Kriterien für die Auswahl sind (die Reihenfolge sagt nichts über die Gewichtung):- Starkes Interesse an Texas Hold'em Poker
- Vorkenntnisse in Maschinellem Lernen und Künstlicher Intelligenz
- Programmiererfahrung in Computer-Spielen
- Studienleistungen
- Anmeldezeitpunkt
Bei Interesse schicken melden Sie sich bitte unter ke@informatik.tu-darmstadt.de an. Legen Sie Ihrer Anmeldung bitte ein kurzes Statement bei, warum Sie an der Teilnahme besonders interessiert sind (ein Absatz genügt).
Die endgültige Vergabe der Plätze erfolgt in der Vorbesprechung.
Beurteilung
Die Lösungen können in Gruppenarbeit (1-3 Teilnehmer pro Gruppe) erstellt werden. Beurteilt wird Ihr Engagement für die Challenge, die Mitarbeit in den Seminarvorträgen und Praktikumstreffen, Ihre Vorträge (Seminar und Abschluß- Vortrag), sowie natürlich die Qualität Ihres Lösungsweges.
Gutes Abschneiden im Wettbewerb wird ebenfalls notenrelevant sein, jedoch sicher nicht das einzige Kriterium sein. Insbesondere gilt die Umkehrung nicht, d.h. schlechtes Abschneiden bedingt nicht notwendigerweise eine schlechte Note (hier fliessen auch Dinge wie die Orginalität und Kreativität der Lösung mit ein).
Es ist geplant, eine gemeinsame Note für beide Veranstaltungen (Seminar und Praktikum) zu vergeben, jedoch behalten wir uns vor, ggf. auch von diesem Prinzip abzuweichen.
Themen
Vorbereitung (jeder)
- Darse Billings, Lourdes Pena, Jonathan Schaeffer, and Duane Szafron. The challenge of poker. Artificial Intelligence, 134(1-2):201-240, January 2002. Special Issue on Games, Computers and Artificial Intelligence.
Überblick (Daniel Schumann)
- Aaron Davidson. Opponent Modeling in Poker: Learning
and Acting in a Hostile and Uncertain
Environment. M.Sc. thesis. Chapters 4-6
Strategy Evaluation
(Thomas Hartmann,
Markus Zopf)
- Darse Billings and Morgan Kan. A Tool for the Direct Assessment of Poker Decisions. The International Association of Computer Games Journal, October 2006.
- Martin Zinkevich, Michael Bowling, Nolan Bard, Morgan Kan and Darse Billings. Optimal Unbiased Estimators for Evaluating Agent Performance. AAAI, AAAI Press, 2006.
- Michael Bowling, Michael Johanson, Neil Burch and Duane Szafron. Strategy Evaluation in Extensive Games with Importance Sampling. Proceedings of the 25th Annual International Conference on Machine Learning (ICML), pp 72-70, 2008
Tree Search and Simulation (Damian Czarny)
- Darse Billings, Aaron Davidson, Terence Schauenberg, Neil Burch, Michael Bowling, Robert C. Holte, Jonathan Schaeffer and Duane Szafron. Game-Tree Search with Adaptation in Stochastic Imperfect-Information Games. Computers and Games, Lecture Notes in Computer Science, Vol. 3846, pp. 21-34, Springer, 2004.
- Sylvain Gelly and David Silver. Combining online and offline knowledge in UCT. ICML, ACM International Conference Proceeding Series, Vol. 227, pp. 273-280, ACM, 2007
Opponent Modeling (Sebastian Kasten, Steffen Remus)
- Michael Johanson, Martin Zinkevich, Michael Bowling. Computing Robust Counter-Strategies. Advances in Neural Information Processing Systems 20 (NIPS), pp 721-728, 2008
- Shaul Markovitch, Ronit Reger. Learning and Exploiting Relative Weaknesses of Opponent Agents. Autonomous Agents and Multi-Agent Systems, Volume 10, Number 2 / March 2005
- Bret Hoehn, Finnegan Southey, Robert C. Holte and Valeriy Bulitko. Effective Short-Term Opponent Exploitation in Simplified Poker. Proceedings AAAI'05, pp. 783-788.