Quand ?Le jeudi 5 janvier 2017. Où ?Au Laboratoire de Mathématiques et Applications, Poitiers.
La conférence aura lieu dans la salle 06, au rdc du LMA (bâtiment 3) sur le plan. L'arrêt de bus le plus proche (environ 50 m) est l'arrêt Gustave Eiffel sur le bd Marie et Pierre Curie. Depuis la gare de Poitiers centre, il faut compter environ 25 minutes de bus avec principalement la ligne 1 direction Futuroscope/Lycée Pilote. Vous pouvez voir votre itinéraire sur le site de vitalis http://www.vitalis-poitiers.fr/ Depuis la gare du Futuroscope, les horaires sont ici. |
09h30→10h00 Accueil
10h10→10h45 Eugenio Cinquemani (INRIA, Grenoble) : Reconstruction of promoter activity statistics from reporter protein population snapshot data
10h45→11h20 Ulysse Herbach (ICJ/INRIA, Lyon) : Modèles stochastiques de réseaux de gènes
11h20→11h55 Renaud Dessalles (INRIA Paris/INRA Jouy-en-Josas) : Modèles stochastiques pour l'expression génétique: division cellulaire, réplication du gène et interactions entre les productions
12h00→13h45 Déjeuner
13h45→14h20 Aurélie Tréfier (INRA, Nouzilly) : Translatome of the follicle-stimulating hormone receptor, in primary rat Sertoli cells
14h20→14h55 Alice Cleynen (IMAG, Montpellier) : Détection de rupture dans les données de séquençage
14h55→15h25 Café
15h25→16h00 Melina Gallopin (I2BC, Orsay) : Network inference from gene expression data with small sample size
16h00→16h35 Ahmed Moussa (ENSA, Tanger) : Data en Bioinformatique : de l’Acquisition à la Distribution
L'inscription est gratuite mais obligatoire. Merci de remplir le formulaire ci-dessous.
Nom | Prénom | Institution |
---|---|---|
Bertrand | Anne | Université de Poitiers |
Biermé | Hermine | LMA Université de Poitiers |
Chesseboeuf | Clément | LMA Université de Poitiers |
Cinquemani | Eugenio | INRIA Grenoble - Rhone-Alpes |
Cleynen | Alice | IMAG, université de Montpellier |
Constant | Camille | LMA Université de Poitiers |
Dessalles | Renaud | INRA |
Dugé de Bernonville | Thomas | Université François-Rabelais |
Durieu | Olivier | Université François-Rabelais de Tours |
El Haj | Abir | LMA Université de Poitiers |
Gallopin | Mélina | Université Paris-Sud |
Georgelin | Christine | Laboratoire De Mathématiques et Physique Théorique |
Herbach | Ulysse | ICJ Université Lyon 1 |
Ibazizen | Mohamed | LMA Université de Poitiers |
Karayan-Tapon | Lucie | Université de Poitiers/CHU de Poitiers |
Liesecke | Franziska | Université François-Rabelais Tours |
Louis | Pierre-Yves | LMA Université de Poitiers |
Malrieu | Florent | Université François-Rabelais de Tours |
Mégret | Lucile | IBPS Université Pierre et Marie Curie (Paris VI) |
Mirebrahimi | Meghdad | Université de Poitiers |
Moussa | Ahmed | LabTIC, ENSA, Université Abdelmalek Essaadi Tanger, Maroc |
Naar | Amir | CHU de Poitiers |
Phan | Anthony | LMA Universite de poitiers |
Ragot | Stephanie | Faculté Médecine Pharmacie Poitiers |
Robin | Frédérique | INRIA de Paris |
Slaoui | Yousri | LMA Université de Poitiers |
Trefier | Aurélie | INRA |
Vannier | Brigitte | Universite de Poitiers |
Yvinec | Romain | INRA Nouzilly |
MEKONTCHOU FOUDJIO | MICHAEL | Université de Yaoundé 1 |
Variability enters cellular dynamics in many ways, giving rise to cell-to-cell variability as well as nondeterministic, fluctuating single-cell response. This variability can nowadays be observed and quantified in several experimental ways, allowing one to investigate phenomena that cannot be characterized in a population-average deterministic framework.
In this talk I will concentrate on intrinsic noise and the problem of reconstructing the laws driving stochastic gene expression from experimental data. I will consider continuous-time Markov chain models of reporter gene systems, genetic constructs where the synthesis of an experimentally quantifiable (reporter) protein is placed under the control of the activity of a gene of interest.
I will show that the time-lapse observation of reporter abundance mean and variance in a population of cells enables identification of constant promoter activation/deactivation rates, and discuss how the same population snapshots allow for the reconstruction of the statistics (in particular, the autocovariance function) of promoter switching processes with variable, possibly stochastic rates, an important step toward the characterization of unknown gene regulation mechanisms.
La production des protéines est le processus fondamental par lequel l’information génétique d’une cellule est synthétisée en un produit fonctionnel, la protéine. C’est un processus hautement stochastique, en particulier pour les bactéries, car il résulte de nombreux évènements aléatoires de différentes natures. Les modèles classiques de production des protéines (comme ceux de Rigney et Schieve (1977) et Berg (1978)) représentent les mécanismes de transcription et de traduction pour déterminer leur impact relatif sur la variabilité des protéines. Néanmoins, beaucoup d’aspects n’y sont pas représentés comme la division cellulaire, la réplication du gène et le partage des ressources communes que sont les ARN-polymerases et les ribosomes dans la synthèse des protéines. Nous proposons ici une série de modèles qui intègrent successivement ces différents éléments ; l’analyse mathématique et les simulations de ces modèles permettront de déterminer la variabilité induite par ces différents éléments et de la comparer à des mesures expérimentales.
En collaboration avec Vincent Fromion et Philippe Robert.
Gaussian graphical models are widely utilized to infer networks from gene expression data. However, inferring the graph is difficult when the sample size is small compared to the number of genes. To reduce the number of parameters to estimate in the model, we propose a non-asymptotic model selection procedure supported by strong theoretical guarantees based on an oracle type inequality and a minimax lower bound. The covari- ance matrix of the model is approximated by a block-diagonal matrix. The structure of this matrix is detected by thresholding the sample covariance matrix, where the threshold is selected using the slope heuristic. Based on the block-diagonal structure of the covariance matrix, the estimation problem is divided into several independent problems: subsequently, the network of dependencies between variables is inferred using the graphical lasso algorithm in each block. The performance of the procedure is illustrated on simulated data. An application to a RNA-seq gene expression dataset with a limited sample size is presented: the dimension reduction allows attention to be objectively focused on interactions among smaller subsets of genes, leading to a more parsimonious and interpretable modular network.
L'expression génétique des cellules a longtemps été observable uniquement via des quantités moyennes mesurées sur des populations. L'arrivée récente des techniques single-cell, en plein essor, permet aujourd'hui d'observer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est souvent très forte et diffère clairement de la simple perturbation autour d'une valeur moyenne.
Ce constat incite à aborder sous un nouvel angle le problème statistique de l'inférence de réseaux de régulation. En effet, il met en défaut les méthodes classiques basées sur des modèles linéaires gaussiens, mais offre en même temps l'opportunité d'utiliser une description physique fondamentalement stochastique de l'expression des gènes. Une telle approche pourrait permettre, en exploitant pleinement l'information contenue dans les données de cellules uniques, d'obtenir des modèles statistiques plus robustes, dans un contexte où le nombre de paramètres est généralement bien supérieur au nombre de données.
Je m'intéresserai ici à la construction de modèles stochastiques de réseaux de gènes, basés sur des interactions de type activation/inhibition, qui puissent décrire les observations à partir d'arguments biologiques plutôt qu'empiriques. Mathématiquement, il s'agira de voir les gènes comme un système de particules en interaction formant un processus de Markov déterministe par morceaux. J'exposerai deux méthodes simples pour obtenir, à partir de la loi stationnaire de ce processus, un modèle statistique explicite : une méthode heuristique rappelant la pseudo-vraisemblance de Besag pour des réseaux quelconques, ainsi qu'une méthode exacte pour des réseaux possédant certaines symétries. Dans le deuxième cas, je montrerai que la loi stationnaire du réseau de gènes fait apparaître une structure intéressante de champ de Markov caché.
La Bioinformatique, comme la plupart des disciplines scientifiques dépendantes des nouvelles technologies, est dans une ère où l’information est de plus en plus grande, présentée sous de nombreuses formes et représentée à différents niveaux, y compris les niveaux génomique, transcriptomique, protéomique et métabolomique. Cette avalanche d’information, notamment génétique, est la conséquence des données générées par les centres de séquençage à grande échelle, des installations d'analyse à haut débit et les laboratoires publics et privés qui produisent de grandes quantités de données telles que les séquences nucléotidiques et protéiques, structures cristallines des protéines, des mesures d'expression des gènes, les protéines et les interactions génétiques. En Juillet 2008, plus de 18 millions d'articles ont été indexées dans PubMed et plus de 260.000 nouvelles séquences nucléotidiques d’organismes avaient été soumises à GenBank. Selon les estimations, en 2025 les Data Bioinformatiques vont dépasser certains systèmes de générations de données de masses tels que Twiter Youtube notamment aux niveaux stockage et analyse. Dans ce travail, nous allons donner un aperçu traçant les nouvelles technologies utilisées au cours de la dernière décennie pour la génération de l’information génétique. L’accent sera mis sur les principales technologies de séquençage à haut débit à savoir les MicroArrays, les Séquenceurs Nouvelles Génération et les nouveaux Spectromètres de Masse. Nous allons aborder les questions relatives aux stockages de ces données, aux développements d’algorithmes de traitement et d’analyse de ces données, et aussi à l’intégration des résultats aux bases de données (biocuration). Plusieurs pipelines d’analyse de ces données dévéloppé sur la plate-forme Galaxy seront aussi présentés, mettant l’accent ainsi sur l’intérêt du travail collaboratif qui est mis en place pour faciliter l’utilisation de ces données bioinformatiques par les chercheurs entre autres, en médecine, biologie et/ou pharmacie.