Jump to Navigation

5 décembre 2016

Indéfini
Heure et lieu: 
11h, salle de réunion, bâtiment 210
Nom intervenant: 
Michael Blum
Titre: 
Détection d'outliers en grande dimension: application à la génomique des populations
Résumé: 

Notre objectif est de détecter quelles sont les variables outliers dans des jeux de données de grande dimension. Les méthodes de détection d'outliers sont utilisées en génomique pour détecter quels sont les gènes qui permettent aux individus de s’adapter à leur environnement. Nous proposons une approche rapide basée sur l’analyse en composantes principales. Le principe est de considérer comme gènes candidats ceux qui sont excessivement corrélés avec les composantes principales. Pour ce faire, nous calculons pour chaque marqueur génétique un vecteur qui mesure l’association entre un marqueur génétique et les composantes principales. Nous utilisons ensuite la distance de Mahalanobis pour trouver quels sont les vecteurs atypiques. En utilisant un jeu de données humains comprenant un peu plus d’un millier d’individus et des centaines de milliers de marqueurs génétiques, nous montrons que cette approche permet de détecter des exemples d’adaptation biologique chez l’homme.

Année: 
2016
Organisme intervenant: 
Univ. J. Fourier & CNRS, Laboratoire TIMC-IMAG, Grenoble
Date du jour: 
Lundi, Décembre 5, 2016


Main menu 2

Seminaire | by Dr. Radut