Martin Mächler: Katalogdaten im Herbstsemester 2020

NameHerr Prof. Dr. Martin Mächler
Adresse
Seminar für Statistik (SfS)
ETH Zürich, HG G 16
Rämistrasse 101
8092 Zürich
SWITZERLAND
Telefon+41 44 632 34 08
E-Mailmaechler@stat.math.ethz.ch
URLhttp://stat.ethz.ch/~maechler
DepartementMathematik
BeziehungTitularprofessor

NummerTitelECTSUmfangDozierende
401-3622-00LStatistical Modelling Information 8 KP4GP. L. Bühlmann, M. Mächler
KurzbeschreibungIn der Regression wird die Abhängigkeit einer zufälligen Response-Variablen von anderen Variablen untersucht. Wir betrachten die Theorie der linearen Regression mit einer oder mehreren Ko-Variablen, hoch-dimensionale lineare Modelle, nicht-lineare Modelle und verallgemeinerte lineare Modelle, Robuste Methoden, Modellwahl und nicht-parametrische Modelle.
LernzielEinführung in Theorie und Praxis eines umfassenden und vielbenutzten Teilgebiets der Statistik, unter Berücksichtigung neuerer Entwicklungen.
InhaltIn der Regression wird die Abhängigkeit einer beobachteten quantitativen Grösse von einer oder mehreren anderen (unter Berücksichtigung zufälliger Fehler) untersucht. Themen der Vorlesung sind: Einfache und multiple Regression, Theorie allgemeiner linearer Modelle, Hoch-dimensionale Modelle, Ausblick auf nichtlineare Modelle. Querverbindungen zur Varianzanalyse, Modellsuche, Residuenanalyse; Einblicke in Robuste Regression. Durchrechnung und Diskussion von Anwendungsbeispielen.
SkriptVorlesungsskript
Voraussetzungen / BesonderesThis is the course unit with former course title "Regression".
Credits cannot be recognised for both courses 401-3622-00L Statistical Modelling and 401-0649-00L Applied Statistical Regression in the Mathematics Bachelor and Master programmes (to be precise: one course in the Bachelor and the other course in the Master is also forbidden).
401-5640-00LZüKoSt: Seminar on Applied Statistics Information 0 KP1KM. Kalisch, A. Bandeira, P. L. Bühlmann, R. Furrer, L. Held, T. Hothorn, M. H. Maathuis, M. Mächler, L. Meier, M. Robinson, C. Strobl, C. Uhler, S. van de Geer
KurzbeschreibungEtwa 5 Vorträge zur angewandten Statistik.
LernzielKennenlernen von statistischen Methoden in ihrer Anwendung in verschiedenen Anwendungsgebieten.
InhaltIn etwa 5 Einzelvorträgen pro Semester werden Methoden der Statistik einzeln oder überblicksartig vorgestellt, oder es werden Probleme und Problemtypen aus einzelnen Anwendungsgebieten besprochen.
Voraussetzungen / BesonderesDies ist keine Vorlesung. Es wird keine Prüfung durchgeführt, und es werden keine Kreditpunkte vergeben.
Nach besonderem Programm:
http://stat.ethz.ch/events/zukost
Lehrsprache ist Englisch oder Deutsch je nach ReferentIn.
401-6215-00LUsing R for Data Analysis and Graphics (Part I) Belegung eingeschränkt - Details anzeigen 1.5 KP1GM. Mächler
KurzbeschreibungThe course provides the first part an introduction to the statistical software R (https://www.r-project.org/) for scientists. Topics covered are data generation and selection, graphical and basic statistical functions, creating simple functions, basic types of objects.
LernzielThe students will be able to use the software R for simple data analysis and graphics.
InhaltThe course provides the first part of an introduction to the statistical software R for scientists. R is free software that contains a huge collection of functions with focus on statistics and graphics. If one wants to use R one has to learn the programming language R - on very rudimentary level. The course aims to facilitate this by providing a basic introduction to R.

Part I of the course covers the following topics:
- What is R?
- R Basics: reading and writing data from/to files, creating vectors & matrices, selecting elements of dataframes, vectors and matrices, arithmetics;
- Types of data: numeric, character, logical and categorical data, missing values;
- Simple (statistical) functions: summary, mean, var, etc., simple statistical tests;
- Writing simple functions;
- Introduction to graphics: scatter-, boxplots and other high-level plotting functions, embellishing plots by title, axis labels, etc., adding elements (lines, points) to existing plots.

The course focuses on practical work at the computer. We will make use of the graphical user interface RStudio: www.rstudio.org

Note: Part I of UsingR is complemented and extended by Part II, which is offered during the second part of the semester and which can be taken independently from Part I.
SkriptAn Introduction to R. http://stat.ethz.ch/CRAN/doc/contrib/Lam-IntroductionToR_LHL.pdf
Voraussetzungen / BesonderesThe course resources will be provided via the Moodle web learning platform.
Subscribing via Mystudies should *automatically* make you
a student participant of the Moodle course of this lecture, which is at

https://moodle-app2.let.ethz.ch/course/view.php?id=13499

ALL material is available on this moodle page.
401-6217-00LUsing R for Data Analysis and Graphics (Part II) Belegung eingeschränkt - Details anzeigen 1.5 KP1GM. Mächler
KurzbeschreibungThe course provides the second part an introduction to the statistical software R for scientists. Topics are data generation and selection, graphical functions, important statistical functions, types of objects, models, programming and writing functions.
Note: This part builds on "Using R... (Part I)", but can be taken independently if the basics of R are already known.
LernzielThe students will be able to use the software R efficiently for data analysis, graphics and simple programming
InhaltThe course provides the second part of an introduction to the statistical software R (https://www.r-project.org/) for scientists. R is free software that contains a huge collection of functions with focus on statistics and graphics. If one wants to use R one has to learn the programming language R - on very rudimentary level. The course aims to facilitate this by providing a basic introduction to R.

Part II of the course builds on part I and covers the following additional topics:
- Elements of the R language: control structures (if, else, loops), lists, overview of R objects, attributes of R objects;
- More on R functions;
- Applying functions to elements of vectors, matrices and lists;
- Object oriented programming with R: classes and methods;
- Tayloring R: options
- Extending basic R: packages

The course focuses on practical work at the computer. We will make use of the graphical user interface RStudio: www.rstudio.org
SkriptAn Introduction to R. http://stat.ethz.ch/CRAN/doc/contrib/Lam-IntroductionToR_LHL.pdf
Voraussetzungen / BesonderesBasic knowledge of R equivalent to "Using R .. (part 1)" ( = 401-6215-00L ) is a prerequisite for this course.

The course resources will be provided via the Moodle web learning platform.
Subscribing via Mystudies should *automatically* make you
a student participant of the Moodle course of this lecture, which is at

https://moodle-app2.let.ethz.ch/course/view.php?id=13500

ALL material is available on this moodle page.
447-6221-00LNichtparametrische Regression Belegung eingeschränkt - Details anzeigen
Fachstudierende "Universität Zürich (UZH)" im Master-Studiengang Biostatistik von der UZH können diese Lerneinheit nicht direkt in myStudies belegen. Leiten Sie die schriftliche Teilnahmebewilligung des Dozenten an die Kanzlei weiter. Als Einverständnis gilt auch ein direktes E-Mail des Dozenten an kanzlei@ethz.ch. Die Kanzlei wird anschliessend die Belegung vornehmen.
1 KP1GM. Mächler
KurzbeschreibungFokus ist die nichtparametrische Schätzung von Wahrscheinlichkeitsdichten und Regressionsfunktionen. Diese neueren Methoden verzichten auf einschränkende Modellannahmen wie 'lineare Funktion'. Sie benötigen eine Gewichtsfunktion und einen Glättungsparameter. Schwerpunkt ist eine Dimension, mehrere Dimensionen und Stichproben von Kurven werden kurz behandelt. Übungen am Computer.
LernzielKenntnisse der Schätzung von Wahrscheinlichkeitsdichten und Regressionsfunktionen mittels verschiedener statistischer Methoden.
Verständnis für die Wahl der Gewichtsfunktion und des Glättungsparameters, auch automatisch.
Praktische Anwendung auf Datensätze am Computer.
447-6245-00LData-Mining Information Belegung eingeschränkt - Details anzeigen
Fachstudierende "Universität Zürich (UZH)" im Master-Studiengang Biostatistik von der UZH können diese Lerneinheit nicht direkt in myStudies belegen. Leiten Sie die schriftliche Teilnahmebewilligung des Dozenten an die Kanzlei weiter. Als Einverständnis gilt auch ein direktes E-Mail des Dozenten an kanzlei@ethz.ch. Die Kanzlei wird anschliessend die Belegung vornehmen.
1 KP1GM. Mächler
KurzbeschreibungBlock über "Prognoseprobleme", bzw. "Supervised Learning"

Teil 1, Klassifikation: logistische Regression, Lineare/Quadratische Diskriminanzanalyse, Bayes-Klassifikator; additive & Baummodelle, weitere flexible ("nichtparametrische") Methoden.

Teil 2, Flexible Vorhersage: Additive Modelle, MARS, Y-Transformations-Modelle (ACE,AVAS); Projection Pursuit Regression (PPR), Neuronale Netze.
Lernziel
InhaltAus dem weiten Feld des "Data Mining" behandeln wir in diesem Block nur sogenannte "Prognoseprobleme", bzw. "Supervised Learning".

Teil 1, Klassifikation, repetiert logistische Regression und Lineare / Quadratische Diskriminanzanalyse (LDA/QDA), und erweitert diese (im Rahmen des "Bayes-Klassifikators") auf (generalisierte) additive ("GAM") und Baummodelle ("CART"), und (summarisch/kurz) auf weitere flexible ("nichtparametrische") Methoden.

Teil 2, Flexible Vorhersage (kontinuierliche oder Klassen-Zielvariable) umfasst Additive Modelle, MARS, Y-Transformations-Modelle (ACE, AVAS); Projection Pursuit Regression (PPR), Neuronale Netze.
SkriptGrundlage des Kurses ist das Skript.
Voraussetzungen / BesonderesDie Uebungen werden ausschliesslich mit der (Free, open source) Software "R"
(http://www.r-project.org) durchgeführt, womit am Schluss auch eine "Schnellübung" als Schlussprüfung stattfindet.