Modélisation stochastique et analyse statistique de l'expression génétique

  • Organisateurs : H. Biermé, F. Malrieu et R. Yvinec
  • Soutien : cette rencontre est soutenue par le projet ANR PIECE et l'ARC (Action de Recherches Collaboratives) Poitiers-Tours.

Quand ?

Le jeudi 5 janvier 2017.

Où ?

Au Laboratoire de Mathématiques et Applications, Poitiers.

La conférence aura lieu dans la salle 06, au rdc du LMA (bâtiment 3) sur le plan. plan

L'arrêt de bus le plus proche (environ 50 m) est l'arrêt Gustave Eiffel sur le bd Marie et Pierre Curie.

Depuis la gare de Poitiers centre, il faut compter environ 25 minutes de bus avec principalement la ligne 1 direction Futuroscope/Lycée Pilote. Vous pouvez voir votre itinéraire sur le site de vitalis http://www.vitalis-poitiers.fr/

Depuis la gare du Futuroscope, les horaires sont ici.

Programme

09h30→10h00 Accueil

10h10→10h45 Eugenio Cinquemani (INRIA, Grenoble) : Reconstruction of promoter activity statistics from reporter protein population snapshot data

10h45→11h20 Ulysse Herbach (ICJ/INRIA, Lyon) : Modèles stochastiques de réseaux de gènes

11h20→11h55 Renaud Dessalles (INRIA Paris/INRA Jouy-en-Josas) : Modèles stochastiques pour l'expression génétique: division cellulaire, réplication du gène et interactions entre les productions

12h00→13h45 Déjeuner

13h45→14h20 Aurélie Tréfier (INRA, Nouzilly) : Translatome of the follicle-stimulating hormone receptor, in primary rat Sertoli cells

14h20→14h55 Alice Cleynen (IMAG, Montpellier) : Détection de rupture dans les données de séquençage

14h55→15h25 Café

15h25→16h00 Melina Gallopin (I2BC, Orsay) : Network inference from gene expression data with small sample size

16h00→16h35 Ahmed Moussa (ENSA, Tanger) : Data en Bioinformatique : de l’Acquisition à la Distribution

Inscription

L'inscription est gratuite mais obligatoire. Merci de remplir le formulaire ci-dessous.

Vos coordonnées
Repas de midi
Validation : bon courage pour le calcul mental...
219 +6 = ?

Liste des inscrits

Nom Prénom Institution
BertrandAnneUniversité de Poitiers
Biermé Hermine LMA Université de Poitiers
ChesseboeufClémentLMA Université de Poitiers
CinquemaniEugenioINRIA Grenoble - Rhone-Alpes
CleynenAliceIMAG, université de Montpellier
ConstantCamilleLMA Université de Poitiers
DessallesRenaudINRA
Dugé de BernonvilleThomasUniversité François-Rabelais
DurieuOlivierUniversité François-Rabelais de Tours
El HajAbirLMA Université de Poitiers
GallopinMélinaUniversité Paris-Sud
GeorgelinChristineLaboratoire De Mathématiques et Physique Théorique
HerbachUlysseICJ Université Lyon 1
IbazizenMohamedLMA Université de Poitiers
Karayan-TaponLucieUniversité de Poitiers/CHU de Poitiers
LieseckeFranziskaUniversité François-Rabelais Tours
LouisPierre-YvesLMA Université de Poitiers
MalrieuFlorentUniversité François-Rabelais de Tours
MégretLucile IBPS Université Pierre et Marie Curie (Paris VI)
MirebrahimiMeghdadUniversité de Poitiers
MoussaAhmedLabTIC, ENSA, Université Abdelmalek Essaadi Tanger, Maroc
NaarAmirCHU de Poitiers
PhanAnthonyLMA Universite de poitiers
RagotStephanieFaculté Médecine Pharmacie Poitiers
RobinFrédériqueINRIA de Paris
SlaouiYousriLMA Université de Poitiers
TrefierAurélieINRA
VannierBrigitteUniversite de Poitiers
YvinecRomainINRA Nouzilly
MEKONTCHOU FOUDJIOMICHAELUniversité de Yaoundé 1

Résumé des exposés

  • Eugenio Cinquemani : Reconstruction of promoter activity statistics from reporter protein population snapshot data

Variability enters cellular dynamics in many ways, giving rise to cell-to-cell variability as well as nondeterministic, fluctuating single-cell response. This variability can nowadays be observed and quantified in several experimental ways, allowing one to investigate phenomena that cannot be characterized in a population-average deterministic framework.

In this talk I will concentrate on intrinsic noise and the problem of reconstructing the laws driving stochastic gene expression from experimental data. I will consider continuous-time Markov chain models of reporter gene systems, genetic constructs where the synthesis of an experimentally quantifiable (reporter) protein is placed under the control of the activity of a gene of interest.

I will show that the time-lapse observation of reporter abundance mean and variance in a population of cells enables identification of constant promoter activation/deactivation rates, and discuss how the same population snapshots allow for the reconstruction of the statistics (in particular, the autocovariance function) of promoter switching processes with variable, possibly stochastic rates, an important step toward the characterization of unknown gene regulation mechanisms.

  • Alice Cleynen : Détection de rupture dans les données de séquençage

Résumé

  • Renaud Dessalles : Modèles stochastiques pour l'expression génétique: division cellulaire, réplication du gène et interactions entre les productions

La production des protéines est le processus fondamental par lequel l’information génétique d’une cellule est synthétisée en un produit fonctionnel, la protéine. C’est un processus hautement stochastique, en particulier pour les bactéries, car il résulte de nombreux évènements aléatoires de différentes natures. Les modèles classiques de production des protéines (comme ceux de Rigney et Schieve (1977) et Berg (1978)) représentent les mécanismes de transcription et de traduction pour déterminer leur impact relatif sur la variabilité des protéines. Néanmoins, beaucoup d’aspects n’y sont pas représentés comme la division cellulaire, la réplication du gène et le partage des ressources communes que sont les ARN-polymerases et les ribosomes dans la synthèse des protéines. Nous proposons ici une série de modèles qui intègrent successivement ces différents éléments ; l’analyse mathématique et les simulations de ces modèles permettront de déterminer la variabilité induite par ces différents éléments et de la comparer à des mesures expérimentales.

En collaboration avec Vincent Fromion et Philippe Robert.

  • Mélina Gallopin : Network inference from gene expression data with small sample size

Gaussian graphical models are widely utilized to infer networks from gene expression data. However, inferring the graph is difficult when the sample size is small compared to the number of genes. To reduce the number of parameters to estimate in the model, we propose a non-asymptotic model selection procedure supported by strong theoretical guarantees based on an oracle type inequality and a minimax lower bound. The covari- ance matrix of the model is approximated by a block-diagonal matrix. The structure of this matrix is detected by thresholding the sample covariance matrix, where the threshold is selected using the slope heuristic. Based on the block-diagonal structure of the covariance matrix, the estimation problem is divided into several independent problems: subsequently, the network of dependencies between variables is inferred using the graphical lasso algorithm in each block. The performance of the procedure is illustrated on simulated data. An application to a RNA-seq gene expression dataset with a limited sample size is presented: the dimension reduction allows attention to be objectively focused on interactions among smaller subsets of genes, leading to a more parsimonious and interpretable modular network.

  • Ulysse Herbach : Modèles stochastiques de réseaux de gènes

L'expression génétique des cellules a longtemps été observable uniquement via des quantités moyennes mesurées sur des populations. L'arrivée récente des techniques single-cell, en plein essor, permet aujourd'hui d'observer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est souvent très forte et diffère clairement de la simple perturbation autour d'une valeur moyenne.

Ce constat incite à aborder sous un nouvel angle le problème statistique de l'inférence de réseaux de régulation. En effet, il met en défaut les méthodes classiques basées sur des modèles linéaires gaussiens, mais offre en même temps l'opportunité d'utiliser une description physique fondamentalement stochastique de l'expression des gènes. Une telle approche pourrait permettre, en exploitant pleinement l'information contenue dans les données de cellules uniques, d'obtenir des modèles statistiques plus robustes, dans un contexte où le nombre de paramètres est généralement bien supérieur au nombre de données.

Je m'intéresserai ici à la construction de modèles stochastiques de réseaux de gènes, basés sur des interactions de type activation/inhibition, qui puissent décrire les observations à partir d'arguments biologiques plutôt qu'empiriques. Mathématiquement, il s'agira de voir les gènes comme un système de particules en interaction formant un processus de Markov déterministe par morceaux. J'exposerai deux méthodes simples pour obtenir, à partir de la loi stationnaire de ce processus, un modèle statistique explicite : une méthode heuristique rappelant la pseudo-vraisemblance de Besag pour des réseaux quelconques, ainsi qu'une méthode exacte pour des réseaux possédant certaines symétries. Dans le deuxième cas, je montrerai que la loi stationnaire du réseau de gènes fait apparaître une structure intéressante de champ de Markov caché.

  • Ahmed Moussa : Data en Bioinformatique : de l’Acquisition à la Distribution

La Bioinformatique, comme la plupart des disciplines scientifiques dépendantes des nouvelles technologies, est dans une ère où l’information est de plus en plus grande, présentée sous de nombreuses formes et représentée à différents niveaux, y compris les niveaux génomique, transcriptomique, protéomique et métabolomique. Cette avalanche d’information, notamment génétique, est la conséquence des données générées par les centres de séquençage à grande échelle, des installations d'analyse à haut débit et les laboratoires publics et privés qui produisent de grandes quantités de données telles que les séquences nucléotidiques et protéiques, structures cristallines des protéines, des mesures d'expression des gènes, les protéines et les interactions génétiques. En Juillet 2008, plus de 18 millions d'articles ont été indexées dans PubMed et plus de 260.000 nouvelles séquences nucléotidiques d’organismes avaient été soumises à GenBank. Selon les estimations, en 2025 les Data Bioinformatiques vont dépasser certains systèmes de générations de données de masses tels que Twiter Youtube notamment aux niveaux stockage et analyse. Dans ce travail, nous allons donner un aperçu traçant les nouvelles technologies utilisées au cours de la dernière décennie pour la génération de l’information génétique. L’accent sera mis sur les principales technologies de séquençage à haut débit à savoir les MicroArrays, les Séquenceurs Nouvelles Génération et les nouveaux Spectromètres de Masse. Nous allons aborder les questions relatives aux stockages de ces données, aux développements d’algorithmes de traitement et d’analyse de ces données, et aussi à l’intégration des résultats aux bases de données (biocuration). Plusieurs pipelines d’analyse de ces données dévéloppé sur la plate-forme Galaxy seront aussi présentés, mettant l’accent ainsi sur l’intérêt du travail collaboratif qui est mis en place pour faciliter l’utilisation de ces données bioinformatiques par les chercheurs entre autres, en médecine, biologie et/ou pharmacie.

  • Aurélie Tréfier : Translatome of the follicle-stimulating hormone receptor, in primary rat Sertoli cells

Résumé

event/gene_poitiers_2017.txt · Last modified: 2017/01/10 00:16 by 41.244.235.182
 
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki