Martin Mächler: Katalogdaten im Herbstsemester 2018 |
Name | Herr Prof. em. Dr. Martin Mächler |
Namensvarianten | Martin Maechler |
Adresse | Seminar für Statistik (SfS) ETH Zürich, HG GO 14.2 Rämistrasse 101 8092 Zürich SWITZERLAND |
Telefon | +41 44 632 34 08 |
maechler@stat.math.ethz.ch | |
URL | http://stat.ethz.ch/~maechler |
Departement | Mathematik |
Beziehung | Titularprofessor im Ruhestand |
Nummer | Titel | ECTS | Umfang | Dozierende | |
---|---|---|---|---|---|
401-3620-68L | Student Seminar in Statistics: Statistical Learning with Sparsity ![]() Maximale Teilnehmerzahl: 24 Hauptsächlich für Studierende der Bachelor- und Master-Studiengänge Mathematik, welche nach der einführenden Lerneinheit 401-2604-00L Wahrscheinlichkeit und Statistik (Probability and Statistics) mindestens ein Kernfach oder Wahlfach in Statistik besucht haben. Das Seminar wird auch für Studierende der Master-Studiengänge Statistik bzw. Data Science angeboten. | 4 KP | 2S | M. Mächler, M. H. Maathuis, N. Meinshausen, S. van de Geer | |
Kurzbeschreibung | We study selected chapters from the 2015 book "Statistical Learning with Sparsity" by Trevor Hastie, Rob Tibshirani and Martin Wainwright. (details see below) | ||||
Lernziel | During this seminar, we will study roughly one chapter per week from the book. You will obtain a good overview of the field of sparse & high-dimensional modeling of modern statistics. Moreover, you will practice your self-studying and presentation skills. | ||||
Inhalt | (From the book's preface:) "... summarize the actively developing field of statistical learning with sparsity. A sparse statistical model is one having only a small number of nonzero parameters or weights. It represents a classic case of “less is more”: a sparse model can be much easier to estimate and interpret than a dense model. In this age of big data, the number of features measured on a person or object can be large, and might be larger than the number of observations. The sparsity assumption allows us to tackle such problems and extract useful and reproducible patterns from big datasets." For presentation of the material, occasionally you'd consider additional published research, possibly e.g., for "High-Dimensional Inference" | ||||
Skript | Website: with groups, FAQ, topics, slides, and Rscripts : https://stat.ethz.ch/lectures/as18/seminar.php#course_materials | ||||
Literatur | Trevor Hastie, Robert Tibshirani, Martin Wainwright (2015) Statistical Learning with Sparsity: The Lasso and Generalization Monographs on Statistics and Applied Probability 143 Chapman Hall/CRC ISBN 9781498712170 Access : - https://www.taylorfrancis.com/books/9781498712170 (full access via ETH (library) network, if inside ETH (VPN)) - Author's website (includes errata, updated pdf, data): https://web.stanford.edu/~hastie/StatLearnSparsity/ | ||||
Voraussetzungen / Besonderes | We require at least one course in statistics in addition to the 4th semester course Introduction to Probability and Statistics, as well as some experience with the statistical software R. Topics will be assigned during the first meeting. | ||||
401-5640-00L | ZüKoSt: Seminar on Applied Statistics ![]() | 0 KP | 1K | M. Kalisch, R. Furrer, L. Held, T. Hothorn, M. H. Maathuis, M. Mächler, L. Meier, N. Meinshausen, M. Robinson, C. Strobl, S. van de Geer | |
Kurzbeschreibung | Etwa 5 Vorträge zur angewandten Statistik. | ||||
Lernziel | Kennenlernen von statistischen Methoden in ihrer Anwendung in verschiedenen Anwendungsgebieten. | ||||
Inhalt | In etwa 5 Einzelvorträgen pro Semester werden Methoden der Statistik einzeln oder überblicksartig vorgestellt, oder es werden Probleme und Problemtypen aus einzelnen Anwendungsgebieten besprochen. | ||||
Voraussetzungen / Besonderes | Dies ist keine Vorlesung. Es wird keine Prüfung durchgeführt, und es werden keine Kreditpunkte vergeben. Nach besonderem Programm: http://stat.ethz.ch/events/zukost Lehrsprache ist Englisch oder Deutsch je nach ReferentIn. | ||||
401-6215-00L | Using R for Data Analysis and Graphics (Part I) ![]() ![]() | 1.5 KP | 1G | M. Mächler, M. Tanadini | |
Kurzbeschreibung | The course provides the first part an introduction to the statistical software R (https://www.r-project.org/) for scientists. Topics covered are data generation and selection, graphical and basic statistical functions, creating simple functions, basic types of objects. | ||||
Lernziel | The students will be able to use the software R for simple data analysis and graphics. | ||||
Inhalt | The course provides the first part of an introduction to the statistical software R for scientists. R is free software that contains a huge collection of functions with focus on statistics and graphics. If one wants to use R one has to learn the programming language R - on very rudimentary level. The course aims to facilitate this by providing a basic introduction to R. Part I of the course covers the following topics: - What is R? - R Basics: reading and writing data from/to files, creating vectors & matrices, selecting elements of dataframes, vectors and matrices, arithmetics; - Types of data: numeric, character, logical and categorical data, missing values; - Simple (statistical) functions: summary, mean, var, etc., simple statistical tests; - Writing simple functions; - Introduction to graphics: scatter-, boxplots and other high-level plotting functions, embellishing plots by title, axis labels, etc., adding elements (lines, points) to existing plots. The course focuses on practical work at the computer. We will make use of the graphical user interface RStudio: www.rstudio.org Note: Part I of UsingR is complemented and extended by Part II, which is offered during the second part of the semester and which can be taken independently from Part I. | ||||
Skript | An Introduction to R. http://stat.ethz.ch/CRAN/doc/contrib/Lam-IntroductionToR_LHL.pdf | ||||
Voraussetzungen / Besonderes | The course resources will be provided via the Moodle web learning platform Please login (with your ETH (or other University) username+password) at https://moodle-app2.let.ethz.ch/course/view.php?id=1145 Choose the course "Using R for Data Analysis and Graphics" (there is at least one other course about "R", do not choose the wrong one!) and follow the instructions for registration. | ||||
401-6217-00L | Using R for Data Analysis and Graphics (Part II) ![]() ![]() | 1.5 KP | 1G | M. Mächler, M. Tanadini | |
Kurzbeschreibung | The course provides the second part an introduction to the statistical software R for scientists. Topics are data generation and selection, graphical functions, important statistical functions, types of objects, models, programming and writing functions. Note: This part builds on "Using R... (Part I)", but can be taken independently if the basics of R are already known. | ||||
Lernziel | The students will be able to use the software R efficiently for data analysis, graphics and simple programming | ||||
Inhalt | The course provides the second part of an introduction to the statistical software R (https://www.r-project.org/) for scientists. R is free software that contains a huge collection of functions with focus on statistics and graphics. If one wants to use R one has to learn the programming language R - on very rudimentary level. The course aims to facilitate this by providing a basic introduction to R. Part II of the course builds on part I and covers the following additional topics: - Elements of the R language: control structures (if, else, loops), lists, overview of R objects, attributes of R objects; - More on R functions; - Applying functions to elements of vectors, matrices and lists; - Object oriented programming with R: classes and methods; - Tayloring R: options - Extending basic R: packages The course focuses on practical work at the computer. We will make use of the graphical user interface RStudio: www.rstudio.org | ||||
Skript | An Introduction to R. http://stat.ethz.ch/CRAN/doc/contrib/Lam-IntroductionToR_LHL.pdf | ||||
Voraussetzungen / Besonderes | Basic knowledge of R equivalent to "Using R .. (part 1)" ( = 401-6215-00L ) is a prerequisite for this course. The course resources will be provided via the Moodle web learning platform Please login (with your ETH (or other University) username+password) at https://moodle-app2.let.ethz.ch/course/view.php?id=1145 Choose the course "Using R for Data Analysis and Graphics" and follow the instructions for registration. | ||||
447-6221-00L | Nichtparametrische Regression ![]() Fachstudierende "Universität Zürich (UZH)" im Master-Studiengang Biostatistik von der UZH können diese Lerneinheit nicht direkt in myStudies belegen. Leiten Sie die schriftliche Teilnahmebewilligung des Dozenten an die Kanzlei weiter. Als Einverständnis gilt auch ein direktes E-Mail des Dozenten an kanzlei@ethz.ch. Die Kanzlei wird anschliessend die Belegung vornehmen. | 1 KP | 1G | M. Mächler | |
Kurzbeschreibung | Fokus ist die nichtparametrische Schätzung von Wahrscheinlichkeitsdichten und Regressionsfunktionen. Diese neueren Methoden verzichten auf einschränkende Modellannahmen wie 'lineare Funktion'. Sie benötigen eine Gewichtsfunktion und einen Glättungsparameter. Schwerpunkt ist eine Dimension, mehrere Dimensionen und Stichproben von Kurven werden kurz behandelt. Übungen am Computer. | ||||
Lernziel | Kenntnisse der Schätzung von Wahrscheinlichkeitsdichten und Regressionsfunktionen mittels verschiedener statistischer Methoden. Verständnis für die Wahl der Gewichtsfunktion und des Glättungsparameters, auch automatisch. Praktische Anwendung auf Datensätze am Computer. | ||||
447-6245-00L | Data-Mining ![]() ![]() Fachstudierende "Universität Zürich (UZH)" im Master-Studiengang Biostatistik von der UZH können diese Lerneinheit nicht direkt in myStudies belegen. Leiten Sie die schriftliche Teilnahmebewilligung des Dozenten an die Kanzlei weiter. Als Einverständnis gilt auch ein direktes E-Mail des Dozenten an kanzlei@ethz.ch. Die Kanzlei wird anschliessend die Belegung vornehmen. | 1 KP | 1G | M. Mächler | |
Kurzbeschreibung | Block über "Prognoseprobleme", bzw. "Supervised Learning" Teil 1, Klassifikation: logistische Regression, Lineare/Quadratische Diskriminanzanalyse, Bayes-Klassifikator; additive & Baummodelle, weitere flexible ("nichtparametrische") Methoden. Teil 2, Flexible Vorhersage: Additive Modelle, MARS, Y-Transformations-Modelle (ACE,AVAS); Projection Pursuit Regression (PPR), Neuronale Netze. | ||||
Lernziel | |||||
Inhalt | Aus dem weiten Feld des "Data Mining" behandeln wir in diesem Block nur sogenannte "Prognoseprobleme", bzw. "Supervised Learning". Teil 1, Klassifikation, repetiert logistische Regression und Lineare / Quadratische Diskriminanzanalyse (LDA/QDA), und erweitert diese (im Rahmen des "Bayes-Klassifikators") auf (generalisierte) additive ("GAM") und Baummodelle ("CART"), und (summarisch/kurz) auf weitere flexible ("nichtparametrische") Methoden. Teil 2, Flexible Vorhersage (kontinuierliche oder Klassen-Zielvariable) umfasst Additive Modelle, MARS, Y-Transformations-Modelle (ACE, AVAS); Projection Pursuit Regression (PPR), Neuronale Netze. | ||||
Skript | Grundlage des Kurses ist das Skript. | ||||
Voraussetzungen / Besonderes | Die Uebungen werden ausschliesslich mit der (Free, open source) Software "R" (http://www.r-project.org) durchgeführt, womit am Schluss auch eine "Schnellübung" als Schlussprüfung stattfindet. |