Data Min­ing Cup 2011

Prak­tikum aus maschinellem Ler­nen und Data Min­ing (4 SWS)

LVA 20-00-0103-pr im Vor­lesungsverze­ich­nis der TU Darm­stadt, SS 11.

Das Stu­den­ten­team der TU-Darm­stadt hat sehr er­fol­gre­ich am diesjähri­gen Data Min­ing Cup teilgenom­men und den 2.,​ 6.,​ 8.​ und 10.​ Platz belegt.​ Die Ab­schlussvorträge zu den er­ar­beit­eten Lösun­gen wer­den am Di­en­stag, den 5.7.11 ab 15 Uhr in A213 vorgestellt und jeder In­ter­essierte ist her­zlich zu den Präsen­ta­tio­nen ein­ge­laden.

Vorbe­sprechung

Die Vorbe­sprechung find­et am Di­en­stag, den 15.3.2011 um 16:00 Uhr in S202/E202 statt.​​ Während des Semesters find­et der Ter­min vo­raus­sichtlich mittwochs statt.

In­halt und Ablauf

Im Zuge dieses Prak­tikums wer­den wir am Data Min­ing Cup teilnehmen.​​ Der Data Min­ing Cup ist ein in­ter­na­tionaler Wet­tbe­werb für Studenten.​​ Dabei muß eine fest­gelegte Data Min­ing Auf­gabe gelöst werden.​​ In den let­zten Jahren wur­den vorzugsweise reelle Daten aus dem Verkauf analysiert, so soll­ten u.​a.​ Buchverkäufe, Gutscheineinlösun­gen, Auk­tion­spreise und Zahlungsausfälle vorherge­sagt werden.​ Die diesjährige Auf­gabe wird am 15.​​ April 2011 veröffentlicht.​​ Die bis 31.​5.​​ einge­sandten Lösun­gen wer­den gesam­melt und von den Ve­r­anstal­tern an­hand einer Test-Menge, deren Ausgänge vorher un­bekan­nt sind, evaluiert.

Auf­gabe des Prak­tikums ist Ausar­beitung und Ein­re­ichung einer Lösung für den Data Min­ing Cup.​​ Die Haup­tar­beit wird dabei in den er­sten Wochen des Som­mersemesters an­fall­en, in denen Sie die Lösung er­ar­beit­en müssen.​​ Die einzel­nen Lösun­gen sollen dann im Zuge des weit­eren Ver­laufs des Prak­tikums (noch vor Bekan­nt­gabe der of­fiziellen Lösung) doku­men­tiert und im Rah­men von Vorträgen vorgestellt wer­den.

Das Prak­tikum be­gin­nt schon Mitte März.​​ Die Idee ist, daß Sie bis zum Be­ginn des Wet­tbe­werbs Auf­gaben aus den let­zten Jahren bear­beit­en um sich grundle­gende Tech­niken anzueignen und Ihre Lösung dann beim er­sten Tr­e­f­fen im SS vorstellen.​​ Während der er­sten Phase der Ausar­beitung der Lösung wer­den in etwa alle zwei Wochen Tr­e­f­fen zum Ideenaus­tausch stat­tfind­en, in der heis­sen Phase des Prak­tikums (während der Laufzeit des Wet­tbe­werbs) wer­den wir uns vo­raus­sichtlich öfters tr­e­f­fen. Am Ende wer­den die zwei besten Lösun­gen er­mit­telt und ein­gere­icht.

Beurteilung

Die Lösun­gen können in Grup­pe­nar­beit (2-3 Teil­nehmer pro Gruppe) er­stellt werden.​​ Beurteilt wird Ihr En­gage­ment für das Prak­tikum und die Qualität Ihres Lösungsweges (nicht unbe­d­ingt die Qualität der Lösung selb­st, d.​​h.​​ das Ab­schnei­den im Wet­tbe­werb ist nicht un­mit­tel­bar noten­rel­e­vant).

Wiki und Forum

Zu der Ve­r­anstal­tung wird es einen wiki und ein Forum geben.​ Der wiki ist dazu gedacht Neuigkeit­en zu veröffentlichen, sowie Ter­mine bekan­nt zu geben.​ Außerdem wird es dort auch all­ge­meine In­for­ma­tio­nen geben.​ Im Forum soll­ten Fra­gen zu entsprechen­den Prob­le­men, die während des Prozess­es auftreten, gestellt und vor allem auch beant­wortet wer­den.

Der Link zum wiki ist: /stu­dents-wi­ki/bin/view/DmC/Web­Home

Der Link zum Forum ist: /stu­dents-wi­ki/bin/view/Dm­C­Fo­rum11. Das Forum kann auch di­rekt über das wiki er­re­icht wer­den (siehe Webs).

Lit­er­atur

Die fol­gen­den Ar­tikel könnten für eine er­fol­gre­iche Pro­jekt-Bewälti­gung hil­fre­ich sein:

Tools

Die fol­gen­den Soft­ware-Tools stellen Al­go­rith­men und Werkzeuge für das Bear­beit­en der Ar­beit bere­it:
  • Weka: Eins der be­liebtesten Frame­works und APIs im Maschinellem Ler­nen, in Java geschrieben.
  • Rapid­Min­er: Frame­work ähn­lich Weka aus Deutsch­land mit besser­er GUI und weit­eren Funk­tio­nen, Java.
  • NTLK: Spezial­isiert auf Nat­u­ral Lan­guage Pro­cess­ing, stellt aber auch Al­go­rith­men nach Stand der Tech­nik für Python zur Verfügung
  • SVM­light: Gute Im­ple­men­tierung von Sup­port-Vek­tor-Maschi­nen, al­ter­na­tives Lib­SVM Frame­work ist auch z.​B.​ in Weka verfügbar.
Kontakt

small ke-icon

Knowledge Engineering Group

Fachbereich Informatik
TU Darmstadt

S2|02 D203
Hochschulstrasse 10

D-64289 Darmstadt

Sekretariat:
Telefon-Symbol+49 6151 16-21811
Fax-Symbol +49 6151 16-21812
E-Mail-Symbol info@ke.tu-darmstadt.de

 
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang