All­ge­meines zu den Übun­gen Web Min­ing

Zurück zur Vor­lesungs­seite. Zu den Übungsauf­gaben.

Die Be­w­er­tun­gen zu Übung 4 sind on­line.

 Übung 5 ist on­line.

Die nach­fol­gen­den Hin­weise find­en sich in ähn­lich­er Form auch in den Folien zur Vorbe­sprechung der Übun­gen.

An­mel­dung zur Übung 

Wer Übungsauf­gaben abgeben möchte, muss sich mit sein­er TU-ID am Up­load-Sys­tem anmelden.​​ Die An­mel­dung läuft wie folgt ab:

  • Loggen Sie sich unter /web­min­ing-up­load/ mit Ihrer TU-ID ein.
  • Bei der er­sten An­mel­dung müssen Sie sich reg­istri­eren.
  • Eini­gen Sie sich für die Grup­pen­zuord­nung mit ihren Team­mit­gliedern, wer die Gruppe erzeugt. 
    • Diese Per­son erzeugt unter Gruppe eine neue Gruppe und teilt den an­deren Mit­gliedern die Grup­pen­num­mer mit. 
    • Die an­deren Mit­gliedern fügen sich dann unter dem gle­ichen Punkt der ko­r­rek­ten Gruppe zu.
  • Die An­mel­dung ist the­o­retisch jed­erzeit möglich.​​ Allerd­ings ist eine manuelle Zuord­nung zu einer Gruppe nur bis kurz vor der er­sten Ab­gabe möglich.​ Das genaue Datum wird auf dieser Seite mit­geteilt.
  • Nachträgliche Änderun­gen der Grup­pen­zuord­nun­gen sind nur über den Ve­r­anstal­ter über Email möglich.
  • Bitte teilen Sie uns mit soll­ten Schwierigkeit­en mit dem Up­load/An­meldesys­tem auftreten.

Ablauf

Im Rah­men der Übun­gen wer­den prak­tis­che Er­fahrun­gen mit eini­gen der in der Vor­lesung vorgestell­ten Konzepten gesammelt.​ Die Auf­gaben sollen in kleinen Grup­pen (min­destens 2, max­i­mal 3 Teil­nehmer) gelöst werden.​ Geben Sie bei der Ab­gabe alle Grup­pen­mit­glieder an.

Es wird ca.​ alle 14 Tage ein Übungs­blatt geben, das zu lösen ist.​ Die Übungsauf­gaben wer­den dann zu einem bes­timmten Ter­min disku­tiert, wobei einige Grup­pen aufge­fordert wer­den, ihre Lösun­gen zu präsen­tieren.

Es wird er­wartet, dass pro Gruppe min­destens eine Per­son an­we­send ist, und dass Sie in der Lage sind, jedes abgegebene Beispiel im Rah­men der Übun­gen zu präsentieren.​ Sollten Sie dazu aus ir­gendwelchen Gründen nicht in der Lage sein, müssen Sie das rechtzeit­ig bekan­nt geben.

Beurteilung

Die Ab­solvierung der Übun­gen ist nicht verpflich­t­end, Sie können je­doch Bonus­punk­te er­wer­ben, die auf die Klausurnote an­gerech­net werden.​ Verbesserun­gen bis zu einem Noten­grad sind möglich.​ Die Klausur muß je­doch unabhängig von den Übungspunk­ten be­standen werden.​ Im Som­mersemester 2015 gab es z.​B.​ 5 Übun­gen, die jew­eils mit 10 Punk­ten plus 2 möglichen Bonus­punk­ten be­w­ertet wurden.​ Die Summe der Übungspunk­te wird in Klausurpunk­te umgerech­net, so daß die max­i­mal er­re­ich­bare Punk­tzahl (50) für einen Noten­sprung re­icht.

Achtung: In der Ver­gan­gen­heit mußten wir lei­der fest­stellen, dass einige Lösun­gen zur Gänze aus nicht angegebe­nen Quellen im In­ter­net bzw.​ aus Lösun­gen des Vor­jahres kopiert wurden.​ Wir wer­den dies auch weit­er­hin kontrollieren.​ Wir weisen Sie nochmals da­rauf hin, daß diese Übungsab­gaben als Teil Ihrer Prüfungsleis­tung anzuse­hen sind.​ Ein Be­trugsver­such bei der Prüfungsleis­tung führt au­toma­tisch zu einer neg­a­tiv­en Gesamt­beurteilung für diese Vorlesung.​ Geben Sie daher nur ab, wenn Sie Ihre Lösun­gen selb­st er­stellt haben.

Bei der Vor­lesungsklausur wer­den keine Pro­gram­mi­er-Ken­nt­nisse er­wartet!

Ab­gabe

Die Ab­gabe wird als ZIP-Archiv mit dem Namen abgabe1.​zip (bzw.​ abgabe2.​zip usw.​) oder ähn­lich­es auf der Web Min­ing Up­load-Seite mit der TU-ID hochgeladen.​ Dabei kann jedes Team nur eine Ab­gabe hinterlegen.​ Die Datei, die zulet­zt von einem Team­mit­glied hochge­laden wurde, wird dann als Ab­gabe des Teams genom­men.

Das ZIP-Archiv soll fol­gen­des en­thal­ten:
  • das Lösungs­doku­ment: eine PDF-Datei (z.​B.​ abgabe_1.​pdf), die die Lösun­gen der Auf­gaben darstellt.​ Das Doku­ment muss keine spezielle Form haben, es sollte sich je­doch für eine Präsen­ta­tion in der Übung eignen.​ (Unter Win­dows lassen sich PDF-Doku­mente le­icht mit dem virtuellen Druck­ertreiber PDFCre­ator erzeugen.​)
  • zusätzliche Ergeb­nis­dateien, die Teile der Lösung darstellen, welche zu groß sind, um sie sin­nvoll im Lösungs­doku­ment zu in­te­gri­eren, etwa größere Lis­ten und Tabelle.
  • die Quell­dateien der Pro­gramme, welche zur Lösung der Auf­gaben im­ple­men­tiert wur­den.
  • die Beispiel­d­ateien, auf die die Pro­gramme ange­wandt wur­den und auf die sich das Lösungs­doku­ment bezieht.​ Für die Anal­yse von Web-Seit­en soll­ten diese als Of­fline-Kopie vorliegen.​
Bei der Gestal­tung des Lösungs­doku­ment beacht­en Sie bitte fol­gende Hin­weise:
  • Die Lösung muss ohne mündliche Erklärung nachvol­lziehbar sein, d.​h.​ sie muss genügend Erläuterun­gen und Ausführun­gen enthalten.​ Eine reine Ansamm­lung von Graphiken und Tabellen ohne jegliche Be­gleit­texte ist hierfür z.​B.​ nicht aus­re­ichend.
  • Die Dateien zusätzlich zur PDF-Datei soll­ten nur zum Nach­weis oder für De­tail­fra­gen zur Verfügung stehen.​ Eine vollständige Be­w­er­tung sollte allein an­hand der PDF-Datei möglich sein.
  • Tabellen, Di­a­gramme, Graphen, Code-List­ings, Ab­bil­dun­gen jeglich­er Art müssen vollständig beschriftet sein, d.​h.​ sie müssen zu­min­d­est di­rekt an der Ab­bil­dung eine kurze Beschrei­bung en­thal­ten und aus­re­ichend kom­men­tiert sein.​ Im Falle z.​B.​ von Achsen bei einem Graphen müssen diese vollständig beschriftet sein.
  • Die Beispiel­d­ateien, auf die sich eine Anal­yse, Tabelle oder Graphik bezieht, müssen immer angegeben wer­den, und zwar so konkret wie möglich.
  • Bitte keine längeren Code-List­ings einfügen, stattdessen auf die konkrete Quell­datei ver­weisen.
  • Bei Ref­eren­zen auf lokale Dateien diese genau be­nen­nen.
  • PDF im pro­jek­tions­fre­undlichen For­mat erzeu­gen (z.​B.​ Seiten­verhältnis 4:3)

Pro­gram­mierung

Zur Lösung der Auf­gaben wird es im All­ge­meinen notwendig sein, zu programmieren.​ Im Zen­trum der Ausar­beitung eines Übungs­beispiels sollte die Beant­wor­tung der gestell­ten Fra­gen sein.​ Das Pro­gramm, das Sie zur Beant­wor­tung dieser Fra­gen schreiben, ist nur Mit­tel zum Zweck und nur von sekundärem Interesse.​ Dementsprechend bleibt es Ihnen überlassen, welche Pro­gram­mi­er-Werkzeuge Sie ver­wen­den.

Wir würden die Ver­wen­dung von Python oder Perl empfehlen, da für beide Sprachen eine große Samm­lung von Bib­lio­theken zur Be­hand­lung und Ve­r­ar­beitung von Text- und Web-Doku­menten zur Verfügung steht.

Python

Im fol­gen­den sind einige für die Übung rel­e­vante Python-Frame­works aufgeführt.

Perl

Eine kom­fort­able Win­dows-In­stal­la­tion bi­etet Ac­tivePerl an.​ Tu­to­ri­als zu Perl und Beispiel­pro­gramme find­en Sie zahlre­ich im Netz, z.​B.​ jenes aus der Web-Min­ing-Ve­r­anstal­tung 2006.​ Perl-Mod­ule für alle Lebensla­gen find­en sie im CPAN Archive. Eine empfehlenswerte Samm­lung von prak­tis­chen Bausteinen ist das Perl Cook­book. Perl-Mod­ule in­stal­lieren Sie am ein­fach­sten mit perl -MC­PAN -e shell und dann mit in­stall mod­ul-name.

Javascript

Javascript-Pro­gramme sind, ins­beson­dere wenn man eins der zahlre­ichen Javascript-Frame­work ver­wen­det, sehr le­icht zu pro­gram­mieren und er­lauben eine Vielzahl von nützlichen An­wen­dun­gen auf Web­seit­en.
  • node.​js: Plat­form, um Javascript-Pro­gramme ohne Brows­er laufen zu lassen
  • W3 Javascript School: Tu­to­ri­als und Doku­men­ta­tion für die Pro­gram­mierung von Javascript

Di­a­gramme

Sie können zum Er­stellen der Graphen jedes be­liebige Werkzeug heranziehen.​ Aufgrund der großen Daten­men­gen ist je­doch ein au­toma­tisiertes Plot­ten der Daten empfehlenswert.

  • mat­plotlib (Python): Um­fan­gre­iche Bib­lio­thek zum Er­stellen von Plots ori­en­tiert sich in sein­er Funk­tion­sweise an mat­lab.
  • jfree (Java): Um­fan­gre­iche Bib­lio­thek zum Er­stellen von Plots
  • gnu­plot: Tool zum Er­stellen von Plots.​ Vielle­icht gibt es auch Wrap­per zu Python und an­deren Sprachen.
  • r-pro­ject: R ist eine Sprache und Umge­bung für statis­tis­che Berech­nun­gen und Grafiken.
  • graphviz: Tool zum Ze­ich­nen von (un)gerichteten Graphen.​ Ein Python Wrap­per ex­istiert.

Weit­ere nützliche Links

  • svn: Zen­trale Ver­sionsver­wal­tung (VCS) - benötigt einen Serv­er
  • mer­cu­ri­al: Dezen­trales VCS - benötigt keinen Serv­er
  • git: Dezen­trales VCS - benötigt keinen Serv­er

Übungsauf­gaben

Übungs­blatt 1

Übungs­blatt 2

Übungs­blatt 3

Übungs­blatt 4

Übungs­blatt 5

Tu­to­rien

Es find­et zu jeder Übung, und zwar ca.​ eine Woche nach einer der Be­sprechung und de­mentsprechend auch in der Woche vor der nächsten Ab­gabe, ein Tu­to­ri­um statt.​ In diesem können Lösungsab­gaben nochmals persönlich be­sprochen wer­den und ggf.​ für die nächste Ab­gabe Fra­gen gestellt werden.​ Es wird ein­dringlich emp­fohlen, von diesem Ange­bot Ge­brauch zu machen.​ Das Tu­to­ri­um wird geleit­et von Robert He­im­bach.

Das Tu­to­ri­um find­et üblicher­weise mittwochs von 14:30 bis 15:00 in E302 statt.​ Änderun­gen sind bitte der fol­gen­den Liste und Links zu ent­nehmen:

Ansprech­part­ner

Enel­do Loza Mencía, Robert He­im­bach

Kontakt

small ke-icon

Knowledge Engineering Group

Fachbereich Informatik
TU Darmstadt

S2|02 D203
Hochschulstrasse 10

D-64289 Darmstadt

Sekretariat:
Telefon-Symbol+49 6151 16-21811
Fax-Symbol +49 6151 16-21812
E-Mail-Symbol info@ke.tu-darmstadt.de

 
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang