Apprentissage-Grande-Dimension

On considère une matrice de données X et un vecteur d’observations Y à expliquer. Les observations portent sur p variables, mesurées sur n individus. Les données fil rouge de ce repo seront des données d’apprentissage supervisée en génomique.

En présence de nombreuses variables explicatives, on suppose généralement que peu d’entre elles sont pertinentes pour modéliser/prédire Y. Il existe quatre familles de méthodes permettant de contourner le fléau de grande dimension :

tests multiples : utilisés en pré-traitement pour filtrer les variables
réduction de dimension : utilisés en pré-traitement pour réduire la dimension de l’espace des variables
choix de modèles : pour choisir le meilleur sous-modèle
régressions sous contraintes (ou pénalisées) : pour contraindre le nombre de paramètres dans le modèle

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
Rmarkdown		Rmarkdown
images		images
sujets		sujets
README.md		README.md
TP1.R		TP1.R
TP2.R		TP2.R
TP3.R		TP3.R
TP4.R		TP4.R
projet_cancer.R		projet_cancer.R

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Rmarkdown

Rmarkdown

images

images

sujets

sujets

README.md

README.md

TP1.R

TP1.R

TP2.R

TP2.R

TP3.R

TP3.R

TP4.R

TP4.R

projet_cancer.R

projet_cancer.R

Repository files navigation

Apprentissage-Grande-Dimension

About

Releases

Packages

Languages

bouachalazhar/Apprentissage-Grande-Dimension

Folders and files

Latest commit

History

Repository files navigation

Apprentissage-Grande-Dimension

About

Topics

Resources

Stars

Watchers

Forks

Languages