Jeudis d'Agap : Modèles linéaires généralisés multivariés à composantesModèles linéaires généralisés multivariés à composantes

30 mars 2017

de 10h30 à 12h00, à l'amphithéâtre Jacques Alliot Cirad, avenue Agropolis (Lavalette) 34398 Montpellier Cedex 5

par Xavier Bry. Présence de Catherine Trottier (Université de Montpellier, UMR IMAG, équipe probabilités et statistique)

Si l'on souhaite modéliser un ensemble de phénotypes à l'aide d'un grand nombre de covariables (génétiques, environnementales..), ce grand nombre pose problème. Nous présentons une méthode de régularisation des modèles linéaires généralisés multivariés, fondée sur la construction de composantes.
Un ensemble de variables réponses Y est supposé dépendre, au sein d’une modélisation GLM, d’un ensemble de variables explicatives X et d’un ensemble T de variables supplémentaires. X est divisé en R groupes de variables, conceptuellement homogènes : X1,…, XR, que l’on nommera «thèmes explicatifs». Les variables dans chaque thème Xr sont supposées nombreuses et redondantes. Ainsi, la régression linéaire généralisée nécessite une régularisation par rapport à chaque thème. À l’opposé, les variables dans T sont supposées peu nombreuses, sélectionnées, et ne nécessitent aucune régularisation. La régularisation est réalisée en cherchant dans chaque Xr un nombre approprié de composantes orthogonales, permettant à la fois de modéliser Y et de capturer l’information structurelle pertinente dans Xr. Pour estimer un modèle avec un seul thème, nous proposons une méthode qui optimise un compromis entre la qualité d’ajustement et une mesure de force structurelle des composantes. Ce principe est mis en œuvre dans un algorithme permettant ensuite de gérer la multiplicité des thèmes explicatifs.
Un package R est disponible, il est mis en œuvre en foresterie par exemple pour modéliser le peuplement de sites à partir de caractéristiques divisées en plusieurs groupes : géographiques, géologiques et climatiques...

Contact : Marie Denis
UMR Agap / Equipe Génome et sélection