401-3620-20L  Student Seminar in Statistics: Inference in Some Non-Standard Regression Problems

SemesterHerbstsemester 2022
DozierendeF. Balabdaoui
Periodizitätjedes Semester wiederkehrende Veranstaltung
LehrspracheEnglisch
KommentarMaximale Teilnehmerzahl: 24
Hauptsächlich für Studierende der Bachelor- und Master-Studiengänge Mathematik, welche nach der einführenden Lerneinheit 401-2604-00L Wahrscheinlichkeit und Statistik (Probability and Statistics) mindestens ein Kernfach oder Wahlfach in Statistik besucht haben. Das Seminar wird auch für Studierende der Master-Studiengänge Statistik bzw. Data Science angeboten.



Lehrveranstaltungen

NummerTitelUmfangDozierende
401-3620-00 SStudent Seminar in Statistics: Inference in Some Non-Standard Regression Problems2 Std.
Mo12:15-14:00HG E 33.1 »
F. Balabdaoui

Katalogdaten

KurzbeschreibungReview of some non-standard regression models and the statistical properties of estimation methods in such models.
LernzielThe main goal is the students get to discover some less known regression models which either generalize the well-known linear model (for example monotone regression) or violate some of the most fundamental assumptions (as in shuffled or unlinked regression models).
InhaltLinear regression is one of the most used models for prediction and hence one of the most understood in statistical literature. However, linearity might be too simplistic to capture the actual relationship between some response and given covariates. Also, there are many real data problems where linearity is plausible but the actual pairing between the observed covariates and responses is completely lost or at partially. In this seminar, we review some of the non-classical regression models and the statistical properties of the estimation methods considered by well-known statisticians and machine learners. This will encompass:
1. Monotone regression
2. Single index model
3. Unlinked regression
LiteraturIn the following is the tentative material that will be read and studied by each pair of students (all the items listed below are available through the ETH electronic library or arXiv). Some of the items might change.

1. Chapter 2 from the book "Nonparametric estimation under shape constraints" by P. Groeneboom and G. Jongbloed, 2014, Cambridge University Press

2. "Nonparametric shape-restricted regression" by A. Guntuoyina and B. Sen, 2018, Statistical Science, Volume 33, 568-594

3. "Asymptotic distributions for two estimators of the single index model" by Y. Xia, 2006, Econometric Theory, Volume 22, 1112-1137

4. "Least squares estimation in the monotone single index model" by F. Balabdaoui, C. Durot and H. K. Jankowski, Journal of Bernoulli, 2019, Volume 4B, 3276-3310

5. "Least angle regression" by B. Efron, T. Hastie, I. Johnstone, and R. Tibshirani, 2004, Annals of Statsitics, Volume 32, 407-499.

6. "Sharp thresholds for high dimensional and noisy sparsity recovery using l1-constrained quadratic programming (Lasso)" by M. Wainwright, 2009, IEEE transactions in Information Theory, Volume 55, 1-19

7."Denoising linear models with permuted data" by A. Pananjady, M. Wainwright and T. A. Courtade and , 2017, IEEE International Symposium on Information Theory, 446-450.

8. "Linear regression with shuffled data: statistical and computation limits of permutation recovery" by A. Pananjady, M. Wainwright and T. A. Courtade , 2018, IEEE transactions in Information Theory, Volume 64, 3286-3300

9. "Linear regression without correspondence" by D. Hsu, K. Shi and X. Sun, 2017, NIPS

10. "A pseudo-likelihood approach to linear regression with partially shuffled data" by M. Slawski, G. Diao, E. Ben-David, 2019, arXiv.

11. "Uncoupled isotonic regression via minimum Wasserstein deconvolution" by P. Rigollet and J. Weed, 2019, Information and Inference, Volume 00, 1-27
Voraussetzungen / BesonderesThe students need to be comfortable with regression models, classical estimation methods (Least squares, Maximum Likelihood estimation...), rates of convergence, asymptotic normality, etc.

Leistungskontrolle

Information zur Leistungskontrolle (gültig bis die Lerneinheit neu gelesen wird)
Leistungskontrolle als Semesterkurs
ECTS Kreditpunkte4 KP
PrüfendeF. Balabdaoui
Formunbenotete Semesterleistung
PrüfungsspracheEnglisch
RepetitionRepetition nur nach erneuter Belegung der Lerneinheit möglich.
ZulassungsbedingungNot for students who already registered for this seminar (course unit 401-3620-20L) in the Spring Semester 2020.

Lernmaterialien

Keine öffentlichen Lernmaterialien verfügbar.
Es werden nur die öffentlichen Lernmaterialien aufgeführt.

Gruppen

Keine Informationen zu Gruppen vorhanden.

Einschränkungen

PlätzePlätze beschränkt. Spezielles Auswahlverfahren.
BelegungsbeginnBelegung ab 01.08.2022 möglich
VorrangDie Belegung der Lerneinheit ist bis 28.08.2022 nur durch die primäre Zielgruppe möglich
Primäre ZielgruppeData Science MSc (261000)
Mathematik BSc (404000) ab Semester 05
Statistik MSc (436000)
Mathematik MSc (437000)
Angewandte Mathematik MSc (437100)
Mathematik (Mobilität) (448000)
Mathematik (Mobilität) (448000)
Aktuar SAV (448100)
WartelisteBis 26.09.2022
BelegungsendeBelegung nur bis 16.09.2022 möglich

Angeboten in

StudiengangBereichTyp
Data Science MasterSeminarWInformation
Mathematik BachelorSeminareWInformation
Mathematik MasterSeminareWInformation
Statistik MasterSeminar oder SemesterarbeitWInformation