Seminar aus Data und Web Mining- SS 07
Mining Social and Other Networks
Im Rahmen dieses Seminars werden wir neue Forschungsergebnisse aus den Bereichen Data und Web Mining diskutieren. Ausgewählt werden neuere Publikationen aus den relevanten Journalen und Konferenz-Proceedings des Gebiets. Dieses Semester liegt der Themenschwerpunkt auf Link Mining, d.h. der Analyse von Netzwerkstrukturen aller Art. Überblicksartikel über dieses Gebiet finden Sie hier:
- T. E. Senator. Link Mining Applications: Progress and Challenges. SIGKDD explorations 7(2):76-83, 2005.
- L. Getoor and C. P. Diehl. Link Mining: A Survey. SIGKDD explorations 7(2):3-12, 2005.
Ankndigungen
Achtung! Das Seminar am 26.6. muß leider entfallen. Dafür sind an den beiden darauf folgenden Dienstagen jeweils 3 Vorträge (d.h. normale Beginnzeit, geplante Endzeit ist 18.40h).
Zeit und Ort
Tag | Zeit | Raum | Beginn |
---|---|---|---|
Dienstag | 16:15-17:55 | S202/A102 | 24.4. |
Ablauf
Jede/r Student/in erhält einen oder mehrere Fachartikel zur Ausarbeitung, deren wesentliche Aspekte dann in einem ca. 30-mintigen Vortrag vorgestellt und im Anschluß von allen diskutiert werden sollen. In einigen Fällen sollten das Thema zu zweit aufgearbeitet werden, wobei beide Studenten gleichermaßen vortragn sollen. Die Vorträge und/oder Folien können wahlweise auf Deutsch oder Englisch gehalten werden.
Vorkenntnisse
Da diese Artikel dem letzten Stand der Forschung entsprechen, wird einerseits erwartet, dass entsprechende Grundkenntnisse (und Interesse!) in Data und Web Mining mitgebracht werden, dass man sich aber andererseits im Zuge der Vorbereitung auch selbständig mit der Thematik weiter vertraut macht und ggf. auch weiterführende bzw. grundlegende Literatur zu Rate zieht (bitte Quellen nennen).
Themen
Jedes Thema ist für 2 Studenten ausgelegt, wobei die Aufteilung allerdings nicht immer ein Papier pro Student ist, sondern in einigen Fällen eine Zusammenarbeit notwendig ist (ist generell immer möglich).
Social and Other Networks (8.5.)
Ralf Neugebauer (Slides) & Paul Arndt (Slides)
- Watts, Duncan J. Networks, Dynamics, and the Small-World Phenomenon American Journal of Sociology. 105: 493-527, 1999.
- Hill, R. and Dunbar, R. 2002. Social Network Size in Humans. Human Nature, Vol. 14, No. 1, pp. 53-72.
- Ravi Kumar, Prabhakar Raghavan, Sridhar Rajagopalan, D. Sivakumar, Andrew Tomkins, Eli Upfal: The Web as a Graph. Proceedings PODS 2000: 1-10, 2000.
Link Analysis Ranking (15.5.)
Pinus Hennadiy & Mark Lampe (Slides)
- Soumen Chakrabarti, Byron Dom, Ravi Kumar, Prabhakar Raghavan, Sridhar Rajagopalan, Andrew Tomkins, David Gibson, Jon M. Kleinberg: Mining the Web's Link Structure. IEEE Computer 32(8): 60-67 (1999)
- Allan Borodin, Gareth O. Roberts, Jeffrey S. Rosenthal, Panayiotis Tsaparas: Link analysis ranking: algorithms, theory, and experiments. ACM Trans. Internet Techn. 5(1): 231-297 (2005)
Link-Based Classification (22.5.)
Eva Twellmeyer
- Yiming Yang, Sean Slattery, Rayid Ghani: A Study of Approaches to Hypertext Categorization. J. Intell. Inf. Syst. 18(2-3): 219-241 (2002)
Björn Heidenreich (Slides)
- Prithviraj Sen, Lise Getoor Link-based Classification. Technical Report CS-TR-4858, University of Maryland, Number CS-TR-4858 - February 2007.
Link-Based Object Identification (29.5.)
Tobias Sobel (Slides)
- Dmitri V. Kalashnikov, Sharad Mehrotra, Zhaoqi Chen: Exploiting Relationships for Domain-Independent Data Cleaning. Proceedings SDM-05, 2005.
Han Dong
- Bhattacharya, Indrajit and Getoor, Lise: Collective Entity Resolution In Relational Data. ACM Transactions on Knowledge Discovery from Data (TKDD) 1(1), 2007.
Characterizing and Sampling Network Topology (5.6.)
Yin Chen (Slides)
- Rattigan, M., M. Maier, and D. Jensen. Using structure indices for efficient approximation of network properties. Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2006.
Viktor Seifert (Slides)
- E. M. Airoldi and K. M. Carley, Sampling Algorithms for Pure Network Topologies SIGKDD explorations 7(2):13-22, 2005.
Temporal Changes (12.6.)
Lu Zheng (Vortrag entfallen)
- J. O'Madadhain, J. Hutchins and P. Smyth, Prediction and Ranking Algorithms for Event-Based Network Data, SIGKDD explorations 7(2):23-30, 2005.
Florian Nattermann (Slides)
- P. Sarkar and A. Moore, Dynamic Social Network Analysis using Latent Space Models, SIGKDD explorations 7(2):41-47, 2005.
Spreading Influence (19.6.)
Benjamin Herbert (Slides)
- P. Domingos, M. Richardson. Mining the Network Value of Customers. Proceedings of the Seventh International Conference on Knowledge Discovery and Data Mining, 2001.
Thomas W. (Slides)
- David Kempe, Jon M. Kleinberg, ï¿œa Tardos: Maximizing the spread of influence through a social network. KDD 2003: 137-146
Link Prediction (3.7.)
Claus Brech & Moritz Mark (Slides)
- David Liben-Nowell, Jon M. Kleinberg: The link prediction problem for social networks. Proceedings CIKM 2003: 556-559, 2003.
- M. J. Rattigan and D. Jensen. The Case for Anomalous Link Discovery. SIGKDD explorations 7(2):41-47, 2005.
- Sisay Fissaha Adafre and Maarten de Rijke. Discovering Missing Links in Wikipedia. _Proceedings of the ACM SIGKDD Workshop on Link Discover (LinkKDD-05), 2005.
Community Analysis (3.7.,10.7.)
Hendrik Schaffer (3.7., Slides)
- S. White, P. Smyth. Algorithms for estimating relative importance in networks. Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2003, pp. 266-275
Sebastian Rose (10.7., Slides)
- Lars Backstrom, Daniel P. Huttenlocher, Jon M. Kleinberg, Xiangyang Lan: Group formation in large social networks: membership, growth, and evolution. Proceedings KDD-06, pp. 44-54, 2006.
Detection of Subcommunities (10.7.)
Bernd Rapp
- M Girvan, MEJ Newman. Community structure in social and biological networks. Proceedings of the National Academy of Sciences, 2002.
Florian Schwager
- Michihiro Kuramochi, George Karypis: Finding Frequent Patterns in a Large Sparse Graph. Data Min. Knowl. Discov. 11(3): 243-271 (2005)
Applications (17.7.)
Christian Groß & Timo Philipp (Slides)
- Ted E. Senator, Henry G. Goldberg, Jerry Wooton, Matthew A. Cottini, A. F. Umar Khan, Christina D. Klinger, Winston M. Llamas, Michael P. Marrone, Raphael W. H. Wong: The Financial Crimes Enforcement Network AI System (FAIS) Identifying Potential Money Laundering from Reports of Large Cash Transactions. AI Magazine 16(4):21-39 (1995).
- Jennifer Schroeder, Jennifer Jie Xu, Hsinchun Chen: CrimeLink Explorer: Using Domain Knowledge to Facilitate Automated Crime Association Analysis. Proceedings ISI 2003: 168-180, 2003.
- Susan T. Ennett, Karl E. Bauman. Peer Group Structure and Adolescent Cigarette Smoking: A Social Network Analysis Journal of Health and Social Behavior, Vol. 34, No. 3 (Sep., 1993), pp. 226-236
- G Madey, V Freeh, R Tynan. The open source software development phenomenon: An analysis based on social network theory. Americas Conference on Information Systems (AMCIS2002), 2002