===== Compléments sur les modèles de régression (M2 Statistique UPMC) ===== === Cours === == Transparents == * {{ members/aguilloux:enseignements:m2upmc:chapitre1.pdf| Chapitre 1 }} {{ members/aguilloux:enseignements:m2upmc:r_data_chapitre1.zip| Code et données }} * {{ members/aguilloux:enseignements:m2upmc:chapitre2.pdf| Chapitre 2 }} * {{:members:aguilloux:enseignements:m2upmc:chapitre3.pdf| Chapitre 3}} {{:members:aguilloux:enseignements:m2upmc:code_chapitre3.zip|Codes pour le chapitre 3}} * {{:members:aguilloux:enseignements:m2upmc:chapitre4.pdf| Chapitre 4}} {{:members:aguilloux:enseignements:m2upmc:rchapitre4.rmd.zip|Codes pour le cours sur les GAM}}{{:members:aguilloux:enseignements:m2upmc:rchapitre4_boosting.rmd.zip|Cours pour le cours sur le Gradient Boosting}} === TPs === == TP 1 : régression linéaire == * Données : https://archive.ics.uci.edu/ml/datasets/Student+Performance * {{:members:aguilloux:enseignements:m2upmc:tp1.rmd.zip| Sujet}} * {{:members:aguilloux:enseignements:m2upmc:tp1_corrected.rmd.zip| Correction partielle}} * {{:members:aguilloux:enseignements:m2upmc:tp1_corrected.rmd_2.zip | Correction }} == TP 2 : sélection de variables et pénalisations == * {{:members:aguilloux:enseignements:m2upmc:tp2.rmd.zip| | Sujet }} Vous **pouvez** me rendre le TP (pour le 9/11) en me l'envoyant sous format pdf ou html. Attention à bien nommer votre fichier votrenom_TP2. Vous pouvez me le rendre par équipe de 2. == TP 3 : Régression de Poisson == * {{:members:aguilloux:enseignements:m2upmc:poisson_regression.rmd.zip|Sujet}} * {{:members:aguilloux:enseignements:moro2016.pdf| Moro et al. 2016}} == TP 4 : Inflation de zéros == * {{:members:aguilloux:enseignements:zeroinfpoisson.rmd.zip|Sujet}} * {{:members:aguilloux:enseignements:flare_data_sets.zip|Données}} * Code sharing at https://codeshare.io/G8v7BD Vous **pouvez** me rendre le TP (pour le 21/12) en me l'envoyant sous format pdf ou html. Attention à bien nommer votre fichier votrenom_TP4. Vous pouvez me le rendre par équipe de 2. == TP 5 : GAM == * {{:members:aguilloux:enseignements:m2upmc:gam_sujet.rmd.zip| Sujet }} * Code sharing at https://codeshare.io/ad6pdR == TP 6 : Gradient boosting == * {{:members:aguilloux:enseignements:m2upmc:gboost_sujet.rmd.zip| Sujet}} * {{:members:aguilloux:enseignements:m2upmc:ozone.rdata.zip|Données}} * Description A data frame with 366 observations on 13 variables, each observation is one day Usage data(Ozone) Format * 1 Month: 1 = January, ..., 12 = December * 2 Day of month * 3 Day of week: 1 = Monday, ..., 7 = Sunday * 4 Daily maximum one-hour-average ozone reading * 5 500 millibar pressure height (m) measured at Vandenberg AFB * 6 Wind speed (mph) at Los Angeles International Airport (LAX) * 7 Humidity (%) at LAX * 8 Temperature (degrees F) measured at Sandburg, CA * 9 Temperature (degrees F) measured at El Monte, CA * 10 Inversion base height (feet) at LAX * 11 Pressure gradient (mm Hg) from LAX to Daggett, CA * 12 Inversion base temperature (degrees F) at LAX * 13 Visibility (miles) measured at LAX Details The problem is to predict the daily maximum one-hour-average ozone reading (V4). === Challenge === Le challenge pour ce cours est https://challengedata.ens.fr/en/challenge/25/predict_the_crude_oil_production_trend.html. Vous devez former des équipes de 3 personnes maximum. Vous devrez rendre un rapport de 10 pages maximum (hors annexes) expliquant votre démarche pour le **14/01/2017**. === Examen 2016-2017 === {{:members:aguilloux:enseignements:m2upmc:examen.pdf|sujet}} {{:members:aguilloux:enseignements:m2upmc:rattrapage.pdf| sujet de rattrapge}} {{:members:aguilloux:enseignements:m2upmc:correction_partiell.pdf|Correction sur le LARS}}