Fortgeschrittene Computerintensive Methoden, SS 2011

Manuel Eugster, Bettina Grün (3VO + 1UE)

Aktuelles

  • In der letzten Einheit am 28.7.2011 wird kein neuer Stoff mehr durchgenommen, sondern es findet eine Fragestunde statt. Danach werden keine Fragen zur Prüfung mehr beantwortet.
    Aufgrund von Terminschwierigkeiten findet die Einheit erst um 18:00 im CIP-Pool (Institut für Statistik) statt.
    Zu diesem Termin wird auch die Einteilung der Termine für die mündliche Prüfung vorgenommen.
  • Details zum Inhalt der Prüfung siehe hier.
  • Die Einführungsveranstaltung findet am 02.05. im Hörsaal E006 (Geschwister-Scholl-Platz 1) statt.

Termine

Vorlesung bzw. Übung: Montag12-14 E006 (Geschwister-Scholl-Platz 1)
bzw.
CIP-Pool (Institut für Statistik)
Vorlesung bzw. Übung: Donnerstag12-14 A016 (Geschwister-Scholl-Platz 1)
bzw.
CIP-Pool (Institut für Statistik)

Bitte beachten Sie -- je nach Art der Einheit findet die Veranstaltung im Hörsaal bzw im CIP-Pool statt:

  • VO: E006 am Montag und A016 am Donnerstag
  • UE: CIP-Pool

Materialien

Thema Termin Art Material
Einleitung 02.05. Mo VO Folien
Benchmarking 05.05. Do VO Folien
09.05. Mo VO
12.05. Do UE Übung, Lösung,
Mischmodelle 16.05. Mo VO Folien
19.05. Do UE Übung, fcim-beispiele-03.R, fcim-beispiele-03-init.R, fcim-beispiele-03-spellman.R
Neurale Netze 23.05. Mo VO Folien, fcim-beispiele-04.R
26.05. Do UE Übung, fcim-beispiele-04-hw-init.R, fcim-beispiele-04-hw-canvas.R, fcim-beispiele-04-ziphelpers.R, Lösung
Bäume 30.05. Mo VO Folien, fcim-beispiele-05.R
06.06. Mo VO
09.06. Do UE Übung, fcim-beispiele-05-msd-data.R, fcim-beispiele-05-msd-summary.R, fcim-beispiele-05-msd-tree.R
Ensemble Methoden 16.06. Do VO Folien, fcim-beispiele-06.R
20.06. Mo VO
27.06. Mo UE Übung, fcim-beispiele-06-rf.R, fcim-beispiele-06-music.R
Archetypenanalyse 30.06. Do VO Folien, fcim-beispiele-07-toy.R, fcim-beispiele-07-skel.R
04.07. Mo UE Übung
Text Mining 07.07. Do VO Folien, fcim-beispiele-08-oz.R, "The Wizard of Oz"-Bücher
Bag-of-Words Modelle 11.07. Mo VO Folien, fcim-beispiele-09.R
Text Mining & Bag-of-Words Modelle 14.07. Do UE Übung Teil 1 & 2, fcim-beispiele-08-gb100-data.R (gb-top100.zip, top100-2011-07-12-downloaded.csv), gb-helpers.R, fcim-beispiele-08-gb100-tm.R (dtm_gb100.rda), fcim-beispiele-08-gb100-model.R
18.07. Mo UE
Assoziationsregeln 21.07. Do VO Folien, fcim-beispiele-10-supermarkt.R, fcim-beispiele-10-marketing.R
25.07. Mo UE Übung, fcim-beispiele-10-gb100-arules.R,
Fragestunde 28.07. Do
18 Uhr im CIP-Pool

Auszüge aus dem Inhalt

Die Vorlesung behandelt theoretische und praktische Konzepte aus den Bereichen Computational Statistics, Statistical Learning und Machine Learning. In der Übung werden diese Konzepte und Methoden auf aktuelle Beispiele angewendet und veranschaulicht.

Voraussichtliche Themen sind:

  • Model Assessment und Model Selection
  • Entscheidungsbäume: CART, ID3, C4.5, random forest, party
  • Neuronale Netzwerke
  • Assoziationsregeln
  • Archetypenanalyse
  • Ensemble Methoden: Bagging, Boosting
  • Mischmodelle
  • Text mining und Topic Modelle

Schein

Mündliche Prüfung (25min) am Ende des Semesters (1. Augustwoche). Termine werden in der letzten Juli-Woche ausgemacht. Details zur Prüfung siehe hier.

Vorraussetzung

Statistik I-IV, Multivariate Verfahren, Computerintensive Methoden und gute R-Kenntnisse sind empfohlen.

Literatur

Als allgemeine Vorlage dient:

  • T. Hastie, R. Tibshirani, J. Friedman. The Elements of Statistical Learning. Springer, 2009. [pdf]
Weitere Unterlagen sind:
  • W. N. Venables, B.D. Ripley. Modern Applied Statistics with S. Springer, 2002.
  • R. Kohavi, J. R. Quinlan, Decision-tree discovery, in W. Klosgen and J. M. Zytkow, editors, Handbook of Data Mining and Knowledge Discovery, chapter 16.1.3, pages 267-276. Oxford University Press, 2002. [pdf]
  • T. Hothorn, K. Hornik, A. Zeileis. Unbiased recursive partitioning: A conditional inference framework. Journal of Computational and Graphical Statistics, 15(3):651-674, 2006. [pdf]
  • A. Zeileis, T. Hothorn, K. Hornik. Model-based recursive partitioning. Journal of Computational and Graphical Statistics, 17(2):492-514, 2008. [pdf]
  • L. Breiman. Bagging Predictors. Machine Learning, 24:123-140, 1996. [html]
  • L. Breiman. Random forests. Machine Learning, 45:5-32, 2001. [html]
  • P. Bühlmann, T. Hothorn. Boosting algorithms: Regularization, prediction and model fitting. Statistical Science, 22(4): 477-505, 2007. [html]
  • A. Banerjee, I.S. Dhillon, J. Ghosh, S. Sra. Clustering on the Unit Hypersphere using von Mises-Fisher Distributions. Journal of Machine Learning Research, 6(Sep):1345--1382, 2005. 2003. [html]
  • D. Blei, A.Y. Ng, M.I. Jordan. Latent Dirichlet Allocation. Journal of Machine Learning Research, 3(Jan): 993-1022, 2003. [html]