Maschinelles Lernen: Symbolische Ansätze - WS 10/11

Einführung in maschinelles Lernen und Data Mining mit Schwerpunkt auf Lernen in logisch/symbolischen Repräsentationssprachen.

Prof. Dr. J. Fürnkranz

Die Veranstaltung im Vorlesungsverzeichnis.


Tag Zeit Raum Start
Vorlesung Donnerstag 08:55-10:35 S202/C110 21.10.
Übung Dienstag 09:50-11:30 S202/C110

26.10.

Die Noten der Klausur stehen nun fest. Diese sind in TUCaN eingetragen. Außerdem hängt eine Liste vor den Räumen des Fachgebiets mit den Personen, die nicht in TUCaN geführt werden. Hinweis: Da eine Auflistung der Punkte pro Aufgabe in TUCaN nicht möglich ist, wurde der Aushang aktualisiert. Hier finden nun ALLE Klausurteilnehmer eine Auflistung der Punkte pro Aufgabe.

Die Klausureinsicht findet am 29.04. von 11-12 Uhr in Raum S202/A313 statt.

Die Klausur findet am Mittwoch, 2. März 2011, ab 14:00 in Raum C205 statt. Erlaubte Unterlagen: Sie dürfen ein von Ihnen selbst doppelseitig handbeschriebenes Din A4-Blatt zur Klausur mitbringen. Ausländische Studenten dürfen ein entsprechendes Wörterbuch mitbringen. Alle anderen Unterlagen, insbesondere Elektronische Hilfsmittel (Taschenrechner, Handy, elektronisches Wörterbuch, etc.) sind nicht erlaubt.

Klausursprechstunde am Montag, 28.Februar 2011, von 12:00 bis 13:00 in Raum C110: In der Klausursprechstunde besteht die Möglichkeit letzte Fragen zum Vorlesungsstoff zu klären. Sammeln Sie bitte Ihre Fragen in dem Forum-Thread Klausursprechstunde, um ein schnelles Beantworten zu ermöglichen.


Inhalt

Durch die Entwicklung der Informationstechnologie sind immer größere Datenmengen verfügbar. Diese enthalten oft implizites Wissen, das, wenn es bekannt wäre, große wirtschaftliche oder wissenschaftliche Bedeutung hätte. Data Mining ist ein Forschungsgebiet, das sich mit der Suche nach potentiell nützlichem Wissen in großen Datenmengen beschäftigt, und Maschinelles Lernverfahren gehören zu den Schlüsseltechnologien innerhalb dieses Gebiets.

Die Vorlesung bietet eine Einführung in das Gebiet des Maschinellen Lernens unter dem besonderen Aspekt des Data Minings. Es werden Verfahren aus verschiedenen Paradigmen des Maschinellen Lernens mit exemplarischen Anwendungen vorgestellt. Um das Wissen zu operationalisieren, werden in den Übungen prak­tisch­e Erfahrungen mit Lernalgorithmen gesammelt.

Übungen

In den Übungen erhalten Sie Aufgaben über den Vorlesungsstoff, oft alte Klausur-Aufgaben, die Sie selbst lösen sollen, und die dann in der folgenden Übungsstunde durchbesprochen werden.

  1. Übung, 02.11.10: Klassifikationsprobleme (Musterlösung)
  2. Übung, 09.11.10: Hypothesenraum, Generalisierung (Musterlösung)
  3. Übung, 16.11.10: Version Spaces (Musterlösung)
  4. Übung, 23.11.10: Regellernen (Musterlösung)
  5. Übung, 30.11.10: Regellernen 2 (Musterlösung)
  6. Übung, 07.12.10: Evaluierung (Musterlösung)
  7. Übung, 16.12.10: Instanzbasierte Klassifizierung (Musterlösung)
  8. Übung, 11.01.11: Instanzbasierte Klassifizierung 2 (Musterlösung (updated))
  9. Übung, 18.01.11: Entscheidungsbäume (Musterlösung)
  10. Übung, 25.01.11: Entscheidungsbäume 2 (Musterlösung)
  11. Übung, 01.02.11: Ensemble-Methoden (Musterlösung)
  12. Übung, 08.02.11: Preprocessing (Musterlösung)
  13. Übung, 15.02.11: Assoziationsregeln (Musterlösung)

Klausur

Die Klausur findet am 02.03.2011 um 14:00 statt.

Alte Klausuren finden Sie hier.

Projekt

Ziel des Projektes ist es, praktische Erfahrungen im Maschinellem Lernen zu sammeln. Hierzu sollen mehrere Projektaufgaben mit Hilfe des Machine Learning Frameworks Weka gelöst werden. Das Projekt kann allein bzw. in einer Kleingruppe (maximal 3 Studenten, Name + Matrikelnr. müssen in der Abgabe ersichtlich sein) bearbeitet werden. Die Abgabe soll in einem üblichen Dokumentenformat (z.B. Beamer, PowerPoint o. Word) erfolgen, wobei es Ihnen freigestellt ist, entweder eine Ausarbeitung oder eine Präsentation zu erstellen. Die Folien sollten allerdings  selbstredend, also auch ohne den dazugehörigen Vortrag verständlich sein. Senden Sie bitte ihre Abgabe an diese E-Mail-Adresse: ml-projekt@ke.tu-darmstadt.de.

Das Projekt besteht aus 9 Aufgaben, die bis zum 19.02.2011 bearbeitet werden sollen. Benutzen Sie für die Bearbeitung die hier bereitgestellte Sammlung an Klassifikations- und Regressionsdatensätzen. Für die erfolgreiche Bearbeitung gibt es einen Bonus von bis zu 10 Klausurpunkten, allerdings nur bei bestandener Klausur.

Forum

Das Diskussionsforum zur Lehrveranstaltung finden Sie hier.

Literatur

Die folgenden beiden Lehrbücher behandeln einen Großteil des Stoffes:

Während die Lehrbücher den Stoff im Großen und Ganzen behandeln, und in vielen Punkten auch noch tiefer gehen, werden in der Vorlesung zum Teil andere Schwerpunkte gesetzt. Als ergänzende Literatur empfehlen wir im Wesentlichen die folgenden Arbeiten (bitte auf Updates achten):

Papers zu vielen Themen finden Sie oft auch mit CiteSeer, DER Suchmaschine für wissenschaftliche Texte der Informatik

Machine-Learning-Werkzeuge

Beispiel-Datensätze

Data Mining-Wettbewerbe

Kontakt

small ke-icon

Knowledge Engineering Group

Fachbereich Informatik
TU Darmstadt

S2|02 D203
Hochschulstrasse 10

D-64289 Darmstadt

Sekretariat:
Telefon-Symbol+49 6151 16-21811
Fax-Symbol +49 6151 16-21812
E-Mail-Symbol info@ke.tu-darmstadt.de

 
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang