[IR] Métagénomique / Métatranscriptomique Projet TARA Océans
2 rue Gaston Crémieux 91000 Evry
TARA Océans est un projet multidisciplinaire regroupant 24 équipes de 10 pays (Europe, Amérique du Nord et Russie), alliant l'océanographie à la bioinformatique via la chimie, la microbiologie, la physique et la génomique, avec pour but la collecte et l'analyse de données descriptives de la flore et de la faune planctonique marine (virus, prokaryotes, protistes & métazoaires), pour des organismes dont la taille va de 0,1 µm jusqu'à 2 mm. Ce large spectre d'organismes marins a un impact significatif sur plusieurs grands cycles biogéochimiques (du carbone, de l'azote et de l'oxygène, entre autres), et est d'une très grande importance dans la chaîne alimentaire marine. Pendant un voyage de 3 ans qui a couvert la majorité des océans du globe, 210 stations de prélèvement ont été réalisées.
Un élément clef du projet consiste en la description de la communauté planctonique à travers le matériel génétique récupéré des organismes échantillonnés, afin de caractériser sa diversité et de comprendre certains des facteurs qui modèlent cette population en regard aux paramètres environnementaux. Dans cette optique, un vaste effort de séquençage est conduit au CEA/Genoscope pour déterminer les signatures génomiques (le contenu en gène des différentes populations) et transcriptomiques (la partie active de ce catalogue) de tous les échantillons récoltés lors de l'expédition . De ces données, des catalogues de gènes sont construits et utilisés pour décrire la diversité fonctionnelle des organismes présents dans les différentes populations, leur distribution taxonomique, ainsi que les fluctuation parmi les échantillons collectés.
Dans le cadre de ce projet, nous recherchons un(e) candidat(e) autonome et motivé(e), de niveau M2 ou thèse, qui rejoindra notre équipe pour :
- participer à l'analyse fonctionnelle de données métagénomiques et métatranscriptomiques eukaryotes propres à certaines stations du projet
- participer à l'étude statistique de ces données
- participer à l'intégration de ces données avec celles venant d'autres laboratoires (océanographie).
Des connaissances solides sont souhaitées dans les domaines suivants :
- la manipulation de données de séquence massive dans un contexte Unix/Linux
- l'utilisation de langages pour le traitement de ces données (shell / perl / python)
- l'analyses statistiques de données génomiques (la maîtrise de R est un plus)
- l'interprétation biologique des données fonctionnelles.