Data Mining und Maschinelles Lernen - WS 16/17

Einführung in maschinelles Lernen und Data Mining mit Schwerpunkt auf Lernen in logisch/symbolischen Repräsentationssprachen. Vormals "Maschinelles Lernen: Symbolische Ansätze".

LVA 20-00-0052-iv - Prof. Dr. J. Fürnkranz

Die Noten der DMML Klausur SS2017 sind in TUCaN veröffentlich. Die Punkteliste mit gekürzten Matrikelnummern hängt ab morgen (31.08.17) an der Pinwand neben Raum D 205.

Die Klausureinsicht findet statt am Freitag, dem 20.10.17 von 15:30-16:30 Uhr in Raum E 202.

 

Inhalt

Durch die Entwicklung der Informationstechnologie sind immer größere Datenmengen verfügbar. Diese enthalten oft implizites Wissen, das, wenn es bekannt wäre, große wirtschaftliche oder wissenschaftliche Bedeutung hätte. Data Mining ist ein Forschungsgebiet, das sich mit der Suche nach potentiell nützlichem Wissen in großen Datenmengen beschäftigt, und Maschinelles Lernverfahren gehören zu den Schlüsseltechnologien innerhalb dieses Gebiets.

Die Vorlesung bietet eine Einführung in das Gebiet des Maschinellen Lernens unter dem besonderen Aspekt des Data Minings. Es werden Verfahren aus verschiedenen Paradigmen des Maschinellen Lernens mit exemplarischen Anwendungen vorgestellt. Um das Wissen zu operationalisieren, werden in den Übungen prak­tisch­e Erfahrungen mit Lernalgorithmen gesammelt.

Termine

Allgemein findet die Veranstaltung im folgenden Rhythmus statt:


Tag  Zeit  Raum  Start
Vorlesung Donnerstag  11:40 - 13:20  S202/C205  25.10.
Übung Dienstag  11:40 - 13:20  S202/C205 

01.11.

Sprechstunde Mittwoch  11:00 - 12:30  S202/A213 

26.10.

Jedoch können sich, auch kurzfristig, Änderungen ergeben, die Sie aus der folgenden vorläufigen Pla­nung entnehmen können:

 

Übungen

Betreuung: Markus Zopf, Sebastian Kauschke

In den Übungen erhalten Sie Aufgaben über den Vorlesungsstoff, oft alte Klausur-Aufgaben, die Sie selbst lösen sollen, und die dann in der folgenden Übungsstunde durchbesprochen werden.


Übungsblatt Besprechung vrsl. am Lösungsvorschlag
Organistation Organisation - -
Übung 1 Klassifikation  08.11.2016 Klassifikation MuLö
Übung 2 Single Rule  15.11.2016 Single Rule MuLö
Übung 3 Version Spaces  22.11.2016 Version Spaces MuLö
Übung 4 Rule Learning I
 29.11.2016 Rule Learning I Mulö
Übung 5 Rule Learning II
 06.12.2016 Rule Learning II Mulö
Übung 6 Evaluation  13.12.2016 Evaluation Mulö
Übung 7 IBL I
 20.12.2016 IBL I Mulö
Übung 8 IBL II
 10.01.2017 IBL II Mulö
Übung 9 Trees I
 17.01.2017 Trees I Mulö
Übung 10 Trees II
 24.01.2017 Trees II Mulö 
Übung 11 Boosting+Preprocessing
 31.01.2017 Boosting+PreProc Mulö
Übung 12 Assoziationsregeln
 07.02.2017 Assoziationsregeln Mulö

Projekt

Ziel des Projektes ist es, praktische Erfahrungen im Maschinellem Lernen zu sammeln. Hierzu sollen mehrere Projektaufgaben mit Hilfe des Machine-Learning-Frameworks Weka gelöst werden. Des Weiteren folgt im späterem Verlauf eine Implementierungsaufgabe. Das Projekt soll in Kleingruppen von je 3 Studenten bearbeitet werden. Die Abgabe soll in einem üblichen Präsentationsformat (z.B. PDF-Folien) erfolgen.


Aufgaben Abgabe vrsl. am
Projekt I 1-3  20.12.2016
Projekt II 4-6  24.01.2017
Projekt III 7-9  07.02.2016
Projekt IV Implementierung  07.02.2016

In Moodle (https://moodle.informatik.tu-darmstadt.de/course/view.php?id=158) werden die Abgaben zum Projekt hochgeladen. Bitte nutzen Sie auch das dortige Forum (oder das d120 Forum) um sich in Gruppen zu je 3 Personen zusammenzufinden.

 

Klausur

Die Klausur findet am Donnerstag, den 16.02.2017 von 10:00 - 12:00 Uhr statt.

Raumaufteilung:

  • Nachname A-F: S2|02 C205
  • Nachname G-Z: S1|01 A1 (Audimax)

Er­laubte Un­ter­la­gen: Sie dürfen ein von Ihnen selb­st dop­pel­seit­ig handbeschriebenes DIN A4-Blatt zur Klausur mitbringen.​ Ausländis­che Stu­den­ten dürfen ein entsprechen­des Wörter­buch mitbringen.​ Alle an­deren Un­ter­la­gen, ins­beson­dere Elek­tro­n­is­che Hil­f­s­mit­tel (Taschen­rech­n­er, Handy, elek­tro­n­is­ches Wörter­buch, etc.​) sind nicht er­laubt.

Alte Klausuren

 

Forum

Das Diskussionsforum zur Lehrveranstaltung finden Sie hier.

Literatur

Die folgenden Lehrbücher behandeln einen Großteil des Stoffes:

Als ergänzende Literatur empfehlen wir im Wesentlichen die folgenden Kapitel aus diesen Lehrbüchern:

  • Einführung
    • Mitchell, ch. 1
    • Witten & Frank, ch. 1
    • Fürnkranz, Gamberger & Lavrac, ch. 1
    • Flach, ch. 1
  • Regel-Lernen
    • Mitchell, ch.3, ch. 10
    • Witten & Frank, 3.3, 4.4, 6.2
    • Fürnkranz, Gamberger & Lavrac, ch. 2,3,6 - 10
    • Flach, ch.6.1-6.2
  • Evaluation and Cost-Sensitive Learning
    • Witten & Frank, 5.1-5.5, 5., 5.8
    • Flach, ch.2, 12
  • Instance-Based Learning
    • Mitchell, 8.1, 8.2, 8.5, 8.6
    • Witten & Frank, 3.8, 4.7, 6.4
    • Flach, ch. 8.1-8.3
  • Entscheidungsbaum-Lernen
    • Mitchell, ch.3
    • Witten & Frank, 3.2, 4.3, 6.1
    • J. R. Quinlan. Induction of decision trees. Machine Learning, 1:81-106, 1986.
    • Flach, ch. 5
  • Ensemble Methods
  • Pre-Processing
    • Witten & Frank, ch. 7.1-7.5
  • Clustering und Association Rules

Machine-Learning-Werkzeuge

Beispiel-Datensätze

Kontakt

small ke-icon

Knowledge Engineering Group

Fachbereich Informatik
TU Darmstadt

S2|02 D203
Hochschulstrasse 10

D-64289 Darmstadt

Sekretariat:
Telefon-Symbol+49 6151 16-21811
Fax-Symbol +49 6151 16-21812
E-Mail-Symbol info@ke.tu-darmstadt.de

 
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang