Fortgeschrittene Computerintensive Methoden, SS 2011
Manuel Eugster, Bettina Grün (3VO + 1UE)
Aktuelles
- In der letzten Einheit am 28.7.2011 wird kein neuer
Stoff mehr durchgenommen, sondern es findet eine
Fragestunde statt. Danach werden keine Fragen zur
Prüfung mehr beantwortet.
Aufgrund von Terminschwierigkeiten findet die Einheit
erst um 18:00 im CIP-Pool (Institut für Statistik)
statt.
Zu diesem Termin wird auch die Einteilung der Termine
für die mündliche Prüfung vorgenommen.
- Details zum Inhalt der Prüfung
siehe hier.
- Die Einführungsveranstaltung findet am 02.05. im
Hörsaal E006 (Geschwister-Scholl-Platz 1) statt.
Termine
| Vorlesung bzw. Übung: |
Montag | 12-14 |
E006 (Geschwister-Scholl-Platz 1)
bzw.
CIP-Pool (Institut für Statistik)
|
| Vorlesung bzw. Übung: |
Donnerstag | 12-14 |
A016 (Geschwister-Scholl-Platz 1)
bzw.
CIP-Pool (Institut für Statistik)
|
Bitte beachten Sie -- je nach Art der Einheit findet die
Veranstaltung im Hörsaal bzw im CIP-Pool statt:
- VO: E006 am Montag und A016 am Donnerstag
- UE: CIP-Pool
Materialien
| Thema |
Termin |
Art |
Material |
| Einleitung |
02.05. Mo |
VO |
Folien |
| Benchmarking |
05.05. Do |
VO |
Folien
|
| 09.05. Mo |
VO |
| 12.05. Do |
UE |
Übung,
Lösung,
|
| Mischmodelle |
16.05. Mo |
VO |
Folien
|
| 19.05. Do |
UE |
Übung,
fcim-beispiele-03.R,
fcim-beispiele-03-init.R,
fcim-beispiele-03-spellman.R
|
| Neurale Netze |
23.05. Mo |
VO |
Folien,
fcim-beispiele-04.R
|
| 26.05. Do |
UE |
Übung,
fcim-beispiele-04-hw-init.R,
fcim-beispiele-04-hw-canvas.R,
fcim-beispiele-04-ziphelpers.R,
Lösung
|
| Bäume |
30.05. Mo |
VO |
Folien,
fcim-beispiele-05.R
|
| 06.06. Mo |
VO |
| 09.06. Do |
UE |
Übung,
fcim-beispiele-05-msd-data.R,
fcim-beispiele-05-msd-summary.R,
fcim-beispiele-05-msd-tree.R
|
| Ensemble Methoden |
16.06. Do |
VO |
Folien,
fcim-beispiele-06.R
|
| 20.06. Mo |
VO |
| 27.06. Mo |
UE |
Übung,
fcim-beispiele-06-rf.R,
fcim-beispiele-06-music.R
|
| Archetypenanalyse |
30.06. Do |
VO |
Folien,
fcim-beispiele-07-toy.R,
fcim-beispiele-07-skel.R
|
| 04.07. Mo |
UE |
Übung
|
| Text Mining |
07.07. Do |
VO |
Folien,
fcim-beispiele-08-oz.R,
"The Wizard of Oz"-Bücher
|
| Bag-of-Words Modelle |
11.07. Mo |
VO |
Folien,
fcim-beispiele-09.R
|
| Text Mining & Bag-of-Words Modelle |
14.07. Do |
UE |
Übung Teil 1 & 2,
fcim-beispiele-08-gb100-data.R
(gb-top100.zip, top100-2011-07-12-downloaded.csv),
gb-helpers.R,
fcim-beispiele-08-gb100-tm.R
(dtm_gb100.rda),
fcim-beispiele-08-gb100-model.R
|
| 18.07. Mo |
UE |
| Assoziationsregeln |
21.07. Do |
VO |
Folien,
fcim-beispiele-10-supermarkt.R,
fcim-beispiele-10-marketing.R
|
| 25.07. Mo |
UE |
Übung,
fcim-beispiele-10-gb100-arules.R,
|
| Fragestunde |
28.07. Do
|
|
18 Uhr im CIP-Pool |
Auszüge aus dem Inhalt
Die Vorlesung behandelt theoretische und praktische
Konzepte aus den Bereichen Computational
Statistics, Statistical Learning und Machine
Learning. In der Übung werden diese Konzepte und
Methoden auf aktuelle Beispiele angewendet und
veranschaulicht.
Voraussichtliche Themen sind:
- Model Assessment und Model Selection
- Entscheidungsbäume: CART, ID3, C4.5, random forest,
party
- Neuronale Netzwerke
- Assoziationsregeln
- Archetypenanalyse
- Ensemble Methoden: Bagging, Boosting
- Mischmodelle
- Text mining und Topic Modelle
Schein
Mündliche Prüfung (25min) am Ende des Semesters
(1. Augustwoche). Termine werden in der letzten Juli-Woche
ausgemacht. Details zur Prüfung
siehe hier.
Vorraussetzung
Statistik I-IV, Multivariate Verfahren, Computerintensive
Methoden und gute R-Kenntnisse sind empfohlen.
Literatur
Als allgemeine Vorlage dient:
- T. Hastie, R. Tibshirani, J. Friedman. The Elements
of Statistical Learning. Springer,
2009. [pdf]
Weitere Unterlagen sind:
- W. N. Venables, B.D. Ripley. Modern Applied Statistics with S. Springer, 2002.
- R. Kohavi, J. R. Quinlan, Decision-tree
discovery, in W. Klosgen and J. M. Zytkow,
editors, Handbook of Data Mining and Knowledge
Discovery, chapter 16.1.3, pages 267-276. Oxford
University Press,
2002. [pdf]
- T. Hothorn,
K. Hornik, A. Zeileis. Unbiased recursive partitioning:
A conditional inference framework. Journal of
Computational and Graphical Statistics, 15(3):651-674,
2006. [pdf]
- A. Zeileis, T. Hothorn, K. Hornik. Model-based
recursive partitioning. Journal of Computational and
Graphical Statistics, 17(2):492-514,
2008. [pdf]
- L. Breiman. Bagging Predictors. Machine Learning,
24:123-140,
1996. [html]
- L. Breiman. Random forests. Machine Learning,
45:5-32, 2001. [html]
- P. Bühlmann, T. Hothorn. Boosting algorithms:
Regularization, prediction and model
fitting. Statistical Science, 22(4): 477-505, 2007.
[html]
- A. Banerjee, I.S. Dhillon, J. Ghosh,
S. Sra. Clustering on the Unit Hypersphere using von
Mises-Fisher Distributions. Journal of Machine
Learning Research, 6(Sep):1345--1382, 2005.
2003. [html]
- D. Blei, A.Y. Ng, M.I. Jordan. Latent Dirichlet
Allocation. Journal of Machine Learning Research,
3(Jan): 993-1022,
2003. [html]