Share

Thesis BIOC

  • A study of selected endocrine disrupting chemicals and their binding to host molecules with molecular modelling.
    • Mazurek Anna Helena
    , 2024 . Endocrine Chemical Disruptors (EDCs) are substances that exhibit adverse effects as a consequence of an endocrine mode of action. It often includes interaction with receptors in the same way as receptor’s natural ligands. Among EDCs there are Active Pharmaceutical Ingredients (APIs) such as steroid hormones. Cyclodextrins (CDs) are cyclic oligosaccharides used as drug delivery systems for APIs of a low solubility in water, and as toxin removing agents. The goal of this study was to develop different molecular modelling techniques to analyze interactions between chosen EDCs and Estrogen Receptor (ER) or CDs. This could lead to a better understanding of the EDCs interactions with the chosen host molecules and possibly show a way to better recognize new potential EDCs. Moreover, the research could point out new direction for toxic EDCs removal or steroidal APIs delivery with application of CDs. The chosen EDCs were: estradiol (EST), progesterone (PRO), bisphenol A (BPA), two of them being APIs (EST and PRO), two of them being classic good examples of well-described EDCs (EST and BPA), one of them being a natural ligand of ER (EST) and one of them being an external to a human body toxin (BPA).Following molecular modelling methods have been in this study: 1) for the first time parametrization of chosen EDCs and CD in AMOEBA polarizable force field and succeeding Molecular Dynamics (MD) simulation of the ER + EST system using Tinker software, 2) benchmark tests of applied parameters in Quantum Mechanics (QM) (Density Functional Theory and semi-empirical approaches) and Molecular Mechanics (MD/MMGBSA) based computation approaches on the example of EST+β-CD system, 3) for the first time crystallization and structural analysis of the EST+β-CD system both in a crystalline state and as a water solution (both computational and experimental approaches).The results and conclusions are as follows: 1) MD simulations of crystal structures showed improved agreement with experiment over an additive force field. A 10 ns simulation of the EST-ER complex was stable and protein-hormone interactions wellreproduced. The developed parameters should thus be suitable for studying hormone and EDC interactions with their hosts. 2) This work for the first time justifies the EST-βCD molar ratio as 1:2 using the high-resolution mass spectrometry and phase solubility studies. While some of the QM methods properly indicated the correct host: guest ratio at the same time they failed to accurately predict the Gibbs free energy (ΔG) of complexation. QM methods that properly described the value of ΔG of 1:2 complex formation, failed to favouer it when compared with 1:1 complex ratio. MD/MMGBSA method accurately predicted the stability constant of the complexed but was not conclusive to indicate the formation of either 1:1 or 1:2 complex. 3) Using SCXRD, the crystal structure of the EST-βCD complex has been determined, being to the best of our knowledge the first solved crystal structure of an estrogen/CD complex. The periodic DFT calculations of NMR properties using GIPAW were found to be particularly helpful in the analysis of disorder in the solid state and interpretation of experimental NMR results
  • Roles of NHSL3 in cell migration
    • Novikov Nikita
    , 2024 . The molecular mechanisms underlying cell migration remain incompletely understood, despite many recent advances. Here, we show that NHSL3, a recently identified member of the Nance-Horan Syndrome protein family, is a novel regulator of single cell and collective migration. The NHSL3 gene, also known as KIAA1522, encodes as many as four isoforms through different transcription initiation sites and alternative splicing in human breast MCF10A cells. Using GFP fusion proteins, we observed that all three long isoforms were localized at the lamellipodium edge and at cell-cell contacts, whereas the short isoform was only present at the lamellipodium edge. The NHSL3 knock-out (KO), inactivating all isoforms in MCF10A cells, impaired migration of single cells and collective monolayers. When wounded, KO monolayers display decreased speed of the cells that follow leader cells when compared with parental cells, whereas single KO cells were more persistent than parental cells. We then rescued KO cells with the different isoforms. All isoforms more or less rescued the collective migration phenotype, the most efficient being isoform i2 and the least efficient being the short isoform i3S. In sharp contrast and to our surprise, only the short isoform i3S rescued single cell migration. Moreover, a specific siRNA that targets specifically the short isoform displayed the same migration phenotype in single cells as the NHSL3 KO that inactivates all isoforms.To get an insight into the mechanisms involved, we performed comparative proteomics of the different isoforms and sorted potential direct partners by a bioinformatics pipeline based on AlphaFold2 that predicted putative binding sites. Long isoforms of NHSL3 interacted with well-known regulators of actin cytoskeleton, such as WAVE regulatory complex (WRC), IRSp53 and MENA/VASP proteins. The short i3S isoform interacted with much fewer proteins, none of which being an obvious candidate to control migration persistence of single cells. In collective migration assays, a mutant form of NHSL3 i2 that does not bind to MENA/VASP proteins impaired the recruitment of MENA/VASP proteins to cell-cell contacts and did not rescue the collective migration phenotype of NHSL3 KO cells. In single cell assays, a mutant form of NHSL3 i3S designed to impair the interaction with the 14-3-3θ partner failed to recruit 14-3-3θ at the lamellipodium edge and did not rescue the single cell migration. Altogether these results demonstrate that NHSL3 regulates both single cell and collective migration through different mechanisms that involve specific interactions with 14-3-3θ and MENA/VASP proteins, respectively.
  • Machine learning to understand and engineer the structural kinome
    • Reveguk Ivan
    , 2023 . Protein kinases (PKs) comprise one of the most ancient and ubiquitous enzyme groups deeply embedded in a cell's molecular machinery. Changing their targets' conformation via phosphate transfer, PKs themselves cycle between active and inactive states. Any misbalance between them can lead to harmful diseases, including cancers. The DFG motif, situated within the activation loop (AL), displays conformational variability in the less constrained inactive state: a property that small molecule inhibitors often exploit. Namely, there are two major DFG motif orientations, known as the DFG-in and DFG-out. The latter precludes substrate binding and is typically associated with higher inhibitor selectivity. Despite being pivotal to drug design efforts, little is known regarding which features shape AL conformational landscape. This work constitutes a systematic attempt to uncover them via careful data curation and mining. Over its course, we created the largest structural kinome assembly to date, encompassing nearly ten thousand annotated PK domains. Clustering these domains enabled semi-supervised labeling of the DFG motif conformations. These labels served as input to our interpretable machine-learning (ML) pipeline incorporating decision tree-based ensembles and a model-agnostic feature selection algorithm. The obtained classifiers accurately predicted the DFG conformations and active/inactive states and relied on readily interpretable structural hallmarks. We used the obtained annotations and ML models' predictions to characterize sequence elements likely responsible for shifting the AL inactive state's conformational balance, or "discriminative" positions. To uncover these, we created several sequence-based datasets, each having a different level of conformational propensity attributed to a sequence. We used the same ML pipeline and phylogenetic analysis to show that a clear DFG conformational propensity is likely privileged to a group of closely related receptor tyrosine protein kinases. The discovered discriminating positions overlapped with the existing literature and mutagenesis studies and may provide a foundation for future experimental efforts, including computational protein design applications. Finally, the developed methodology enables automating the annotation of the structural kinome. Generalizable towards problems of similar nature, it may increase the efficiency and transparency of data mining in structural biology.
  • Involvement of eIF2 in cardiomyocytes response to endoplasmic reticulum stress
    • Cardenal Peralta Cristina
    , 2023 . Over the last decade, endoplasmic reticulum (ER) stress has emerged as an important mechanism involved in the development of cardiac diseases including ischemia, dilated cardiomyopathy and heart failure. ER stress triggers the Unfolded Protein Response (UPR) initiated by the phosphorylation of the alpha subunit of the eukaryotic initiation factor 2 (eIF2). It is considered that a mild-to-moderate induction of ER stress triggers a restorative autophagy-based response whereas severe or chronic ER stress promotes an apoptotic response which contributes to the development of the cardiac disease. Therefore, cardiac therapy based on ER stress modulation is emerging as a promising new approach to promote beneficial adaptations and avoid apoptosis.Our INSERM's collaborator showed that sirtuin 1 (SIRT1), an NAD+-dependent lysine deacetylase, protects cardiomyocytes from ER stress-induced apoptosis by specifically attenuating activation of the eIF2α phosphorylation pathway and promoting autophagy. They also identified acetylation of two lysines of eIF2α, K141 and K143 and demonstrated that SIRT1 deacetylates these lysines to protect the heart from severe ER stress.No information is available on the consequences of eIF2α acetylation on its structural organization and its function. The aim of this PhD project is to decipher the molecular and structural basis of the SIRT1:eIF2α interaction. During this PhD, we were able to successfully purify an acetylated version eIF2α using an orthogonal system derived from the archaeal pyrrolysine system. Using this system, an acetyl-lysine was introduced on the place of a STOP codon. After extensive optimization, we were able to use this protein to test SIRT1 catalytic activity using western blotting. We also produced an acetylated version of the protein which carried an S52D mutation, mimicking phosphorylation, and were able to also obtain catalytic rates using this version of the protein.We also characterized SIRT1’s catalytic activity using mimic peptides of 143 lysine acetylation in eIF2α. The use of peptides in the literature is controversial because most of them are modified with a hydrophobic moiety that can affect SIRT1 affinity for its substrate. In our approach, we use non-modified peptides, closer to the native substrate.During this thesis, we were able to obtain a crystallographic structure of a mimic of eIF2α acetylation. Finally, we initiated crystallization trials with SIRT1:peptide substrates and SIRT1:eIF2α.
  • Vinculin-Arp2/3 interaction antagonises branched actin to control single and collective cell behaviours
    • James John
    , 2023 . Development, growth and maintenance of tissues are emergent properties arising from individual cell behaviour. Cell behaviour is finely tuned by a multitude of regulatory pathways in response to stimuli received from their microenvironment. Physical forces are sensed at cell-substrate contacts called focal adhesions (FAs) and cell-cell contacts called adherens junctions (AJs) which connect the exterior of a cell to its actin cytoskeleton. In response to force sensing, the actin cytoskeleton is remodelled to regulate complex cell behaviours such as proliferation, migration and cell-junction maintenance that are under the control of branched actin. During cancer progression, these three processes are deregulated. Vinculin (VCL), described as a tumour suppressor, is a structural and mechanotransductory protein present in both FAs and AJs. In addition to reinforcing the link between the actin cytoskeleton and adhesive structures, VCL is likely to plays a second regulatory role on the actin cytoskeleton by interacting with the branched actin nucleator Arp2/3. The goal of this project was to determine the effects of VCL on branched actin, and ultimately cell behaviour. To this end, we used CRISPR-Cas9 genome editing techniques to perturb this interaction.We began studying the effects of the interaction on individual cell behaviour by expressing a VCL 811-881 peptide in Parental MCF10A cells. We found that the peptide binds the canonical Arp2/3 complex, and cells expressing the peptide are able to migrate more persistently, spread over a larger area, make larger lamellipodia and continue to proliferate at high cell densities. All these phenotypes indicate that Arp2/3 activity is increased in these cells. VCL knockout (VCL-/-) cell lines and a mutant cell line where VCL cannot bind Arp2/3 (VCL P878A-KI) both behave similarly. TIRF-SIM imaging revealed that the actin network assembly rate was increased in VCL-/-, VCL P878A-KI and VCL 811-881 expressing cells compared to Parental MCF10A. Together, this demonstrates that the function of the VCL-Arp2/3 interaction is to antagonize generation of branched actin networks in the lamellipodium, and that the VCL 811-881 peptide acts as a dominant negative of VCL function.To understand the role of the VCL-Arp2/3 interaction on collective cell behaviour, we first studied AJs which not only hold cells together but also allow them to pass on mechanical signals. We found that the VCL controls Arp2/3 recruitment to AJs and cell-cell junction stability. Once AJs were mature, Parental MCF10A cells were able to organise long-range transcellular actin networks coordinated across multiple cells. During hypotonic unjamming, these cells migrate collectively as domains constrained by the long-range actin network. VCL P878A cells are not constrained by any long-range transcellular actin network and migrate more collectively while VCL-/- cells develop a very short-range actin network leading to reduced collective migration. Our results indicate that Arp2/3 activity has to be finely regulated at AJs by VCL to form this long range network and regulate collective migration.Thus, we have established as a novel role for VCL in regulating the actin cytoskeleton through a direct interaction that antagonizes Arp2/3. Perturbation of this interaction leads to several phenotypes characteristic of cancer cells – increased proliferation, increased persistence of migration, perturbation of cell junctions and misregulation of collective migration. Since Arp2/3 activity is known to be upregulated in several cancer types, our results provide a potential mechanism for vinculin’s role as a tumour suppressor.
  • PPP2R1A regulates migration persistence through the WAVE Shell Complex
    • Wang Yanan
    , 2022 . During cell migration, the RAC1-WAVE-ARP2/3 signaling pathway induces the network of branched actin, that serves as a motor for lamellipodia protrusion. This pathway is finely regulated by numerous feed-back and feed-forward signals that control the protrusion lifetime and migration persistence. We screened in MCF10A human breast epithelial cells for proteins that associate with the WAVE complex during persistent migration, but whose association with WAVE is modulated when the downstream production of branched actin is inhibited. The differential proteomics screen identified PPP2R1A (a regulatory subunit of the PP2A trimeric phosphatase) as the strongest hit and a novel WAVE-associated factor required for migration persistence in normal and cancer human cells, in various conditions. The differential proteomics screen identified PPP2R1A (a regulatory subunit of the PP2A trimeric phosphatase) as the strongest hit and a novel WAVE-associated factor required for migration persistence in normal and cancer human cells, in various conditions. Our observation that PPP2R1A interacts with four WAVE complex subunits, but not with WAVE/WASF, led to a purification and characterization of a “WAVE shell complex (WSC)”, a novel variant of WAVE containing the migration regulatory protein NHSL1 that turned out to be necessary for the existence of WSC. Interestingly, PPP2R1A is mutated on hotspots in different cancer types, and these mutations abolish its interaction with NHSL1 and WSC, suggesting a critical role of for this pathway not only in normal cells, but also in cancer progression.
  • Role of aIF5B in archaeal translation initiation
    • Kazan Ramy
    , 2022 . Translation initiation universally occurs with accurate selection of the start codon that defines the reading frame on the mRNA. The mechanism involves a macromolecular complex composed of the small ribosomal subunit, the mRNA, a specialized methionylated initiator tRNA and initiation factors (IFs). Once the start codon is selected at the P site on the small ribosomal subunit and the large subunit is associated, the IFs are released and an elongation competent ribosome is formed. Although the general principles are the same in the three domains of life, the molecular mechanisms are different in bacteria, eukaryotes and archaea as illustrated by the different number and types of the initiation factors.In eukaryotes and in archaea, late steps of translation initiation involve the two initiation factors a/eIF1A and a/eIF5B. Importantly, a/eIF5B and a/eIF1A are orthologues of the bacterial proteins IF1 and IF2 respectively. Therefore, late steps of translation initiation have a universal character.We determined the cryo-EM structure of an archaeal translation initiation complex containing the small ribosomal subunit, a model mRNA, the methionylated initiator tRNA and the two initiation factors aIF5B and aIF1A. The two initiation factors are very well defined in the cryo-EM map. aIF5B is bound to the methionine group of the initiator tRNA by its domain IV while domains I, II, and III contacts the body part of the small ribosomal subunit in the uS12, h5 region. For the first time, interaction between archaeal aIF1A and aIF5B is observed. The structure allows us to model the late steps of translation initiation and to understand how aIF5B facilitates the joining of the large ribosomal subunit. Our results are compared to the eukaryotic and bacterial cases.
  • Rôles d’Arpin dans la migration cellulaire et la réparation de l’ADN
    • Simanov Gleb
    , 2021 . Au front de migration, la protrusion de la membrane appelée lamellipode est générée par la polymérisation de l'actine branchée par Arp2/3. Ce processus est orchestré par la petite GTPase Rac1 capable d'activer le complexe WAVE et d'exposer son domaine WCA nécessaire pour l'activation d'Arp2/3. Différentes boucles de rétroaction positive soutiennent l'activité de Rac1 et stabilisent le lamellipode. Rac1 active aussi l’inhibiteur d'Arp2/3, Arpin, créant une boucle de rétroaction négative. Comme WAVE, Arpin possède un motif A à son extrémité C-terminale, pour lequel il existe deux sites d’interaction à la surface d’Arp2/3. Au lieu d’empêcher la formation de lamellipode, Arpin régule sa durée de vie et, ainsi, contrôle la persistance de la migration cellulaire. Récemment, une nouvelle fonction d'Arp2/3 dans la recombinaison homologue (HDR) a été rapportée.Dans ma thèse, je me suis attaché à mieux comprendre les rôles et les régulations d'Arpin dans la cellule. Nous avons identifié de nouveaux partenaires d'interaction d'Arpin, les Tankyrases 1 et 2. En interrompant spécifiquement l’interaction des Tankyrases ou d’Arp2/3 avec Arpin, j’ai montré que ces deux interactions sont nécessaires pour l’activité d'Arpin dans la régulation de la migration cellulaire. En collaboration, nous avons étudié les mécanismes d'interaction d'Arpin avec le complexe Arp2/3 et montré qu’Arpin se lie à un seul site sur Arp2/3, au niveau de la sous-unité Arp3. Outre le motif A, l’interaction nécessite un motif C non identifié auparavant, similaire au domaine C des activateurs d’Arp2/3. Deuxièmement, j'ai montré que la déplétion d'Arpin stimulait l'efficacité de la HDR mais favorisait l'accumulation des sites de réparation d’ADN dans le noyau. Arpin, ainsi, pourrait jouer un rôle régulateur dans la réparation de l’ADN.
  • Computational design of proteins and enzymes
    • Opuu Vaitea
    , 2020 . We propose a set of methods to design molecular systems. We start from naturally optimized components, namely proteins. Proteins can act as structural components, information transporters, or catalysts. We use computational methods to complement experiments and design protein systems.First, we fully redesigned a PDZ domain involved in metabolic pathways. We used a physics-based approach combining molecular mechanics, continuum electrostatics, and Monte Carlo sampling. Thousands of variants predicted to adopt the PDZ fold were selected. Three were validated experimentally. Two showed binding of the natural peptide ligand.Next, we redesigned the active site of the methionyl-tRNA synthetase enzyme (MetRS). We used an adaptive Monte Carlo method to select variants for methionine (Met) binding. Out of 17 predicted variants that were tested experimentally, 17 were found to be active. We extended the method to transition state binding to select mutants directly according to their catalytic power.We redesigned the MetRS binding site to obtain activity towards two β-amino acids, in order to expand the genetic code. These unnatural amino acids can enhance the structural repertoire of proteins. 20 predicted mutants were tested. Although none had increased β-Met activity, three had a gain in selectivity for β-Met. We then implemented a method to select optimal positions for design and applied it to β-Met and β-Val. Around 20 variants are being experimental tested.Finally, in vivo protein modifications raise the question of their eventual drift away from the original design. We introduce here a design approach for overlapping genes coding PDZ domains. This overlap would reduce genetic drift and provide bio-confinement. We computationally produced almost 2000 pairs of overlapping PDZ domains. One was validated by 2 microsecond molecular dynamic simulations. Experiments are underway.
  • Incorporation de la beta alanine dans des polypeptides
    • Nigro Giuliano
    , 2019 . Les cellules vivantes utilisent 20 acides α aminés canoniques lors de la synthèse ribosomale des protéines, même si dans de rares occasions, d’autres acides aminés (selenocysteine ou pyrrolysine) peuvent être utilisés. Le répertoire des acides aminés utilisables est donc assez restreint. Cela limite la possibilité de construire des protéines ayant de nouvelles propriétés. Une tendance forte dans le domaine de l’ingénierie des protéines est la construction de systèmes permettant d’incorporer des acides aminés non canoniques pendant la biosynthèse in vivo. Ces travaux ont connu d’importants succès, mais tous les acides aminés incorporés jusqu'aux années 2010 étaient des acides aminés α. L’incorporation d’acides aminés β à des sites spécifiques créerait une flexibilité supérieure à celle des acides aminés α dans la chaîne principale, ce qui augmenterait les possibilités de repliement de la protéine. Il a été montré récemment en utilisant un système de traduction in vitro de synthèse protéique qu’il était possible d’incorporer des acides aminés β à des positions spécifiques (Katoh and Suga, 2018). Pour parvenir à transposer ce système in vivo, la principale limitation est l’aminoacylation des ARNt avec les acides aminés β. Il a été récemment proposé que certaines aminoacyl-ARNt synthetases étaient capables d’utiliser les acides aminées β, mais cette capacité reste limitée.Le but de cette thèse est d’incorporer la β-méthionine dans des polypeptides in vivo. Pour cela nous avons caractérisé la reconnaissance et l’utilisation de la L-β-homométhionine par la méthionyl-ARNt synthetase (MetRS) d’E. coli. Nous avons en particulier déterminé une structure cristallographique à haute résolution du complexe MetRS: β -Met. En utilisant la spectroscopie de fluorescence ainsi que la spectroscopie de masse, nous avons pu mettre en évidence l’activation de la -Met en adénylate ainsi que son estérification à un ARNtMet. Toutefois, les efficacités mesurées sont très petites par rapport à ce qui avait été publié. Une contamination de la -Met commerciale par de la méthionine pourrait expliquer ces différences. Une étude in silico basée sur la structure du complexe MetRS:β-Met a été menée en collaboration avec l’équipe de Bio-informatique du laboratoire afin de rechercher des enzymes mutantes plus efficaces vis à vis des acides aminés β. Enfin, nous avons amorcé la mise en place d’une méthode d’évolution dirigée destinée à améliorer l’efficacité d’incorporation des acides aminés β in vivo.
  • Insights into the control of mRNA decay by YTH proteins during the transition from meiosis to mitosis in yeasts.
    • Hazra Ditipriya
    , 2019 . Insights into the control of mRNA decay by YTH proteinsduring the transition from meiosis to mitosis in yeasts.Keywords: Epitranscriptomics, mRNA decay, meiosis, multi-protein complexes, YTH domainCell cycle is controlled by multi-layered processes. A gene is transcribed in mRNA which is translated in proteins but innumerable regulation processes are working to control every step of this apparently simple process. Among these regulatory check points, post-transcriptional regulation is an important one, where formation of a protein-RNA complex may direct the cellular fate. Among these RNA binding proteins, YTH domain proteins are most novel, discovered in late 90s. YTH domain proteins are abundant in eukaryotes and absent in prokaryotes. YTH domain proteins constitute the majority of reader proteins that can specifically identify m6A modification. Human beings have five YTH domain proteins YTHDF1-3, YTHDC1-2 (Hazra, D., Chapat, C., & Graille, M. (2019). m6A mRNA Destiny: Chained to the rhYTHm by the YTH-Containing Proteins. Genes, 10(1), 49.). Although it is evident that these proteins are controlling cellular fate, the function of each protein and their network is yet to be elucidated. In yeast, there is only one YTH domain protein present: Pho92 in Saccharomyces cerevisiae and Mmi1 in Schizosaccharomyces pombe. Apart from the YTH domain there is no sequence homology between these two proteins but their cellular function is similar.It is well established that Mmi1 is responsible for degradation of meiosis specific transcripts during vegetative growth of the cell. Mmi1 forms a tight complex with a small protein, Erh1 (Erh1-Mmi1 complex or EMC). EMC can physically interact with Not1 of CCR4-Not complex and recruit it for degradation of DSR (determinant of selective removal) containing RNAs. The action of Mmi1 is in turn regulated by an RRM domain protein, Mei2. During meiosis, Mei2, along with a lncRNA meiRNA sequesters Mmi1 in a nuclear dot, rendering it inactive and ensuring smooth continuance of meiosis. These three proteins, Mmi1-Erh1-Mei2 play a key role in mitosis to meiosis switch.In S. cerevisiae, Pho92 is involved in the degradation of PHO4 transcripts contributing to phosphate metabolism pathway, during phosphate starvation and also participates in the degradation of mRNAs containing the N6-methyladenosine (m6A) epitranscriptomics marks. Similarly, to S. pombe Mmi1, Pho92 recruits CCR4-Not complex by physical interaction with Not1.During my PhD, I have tried to elucidate the role of these two YTH domain proteins from two model organisms, S. cerevisiae and S. pombe, in mRNA degradation and cell cycle regulation using biochemical and structural approaches.Pho92 of S. cerevisiae physically interacts with Not1 of CCR4-Not complex, we were able to determine the boundaries of this interaction. The interaction between these two proteins was studied by Fluorescence anisotropy. The protein complex was successfully purified and crystallization trials are ongoing.From S. pombe, structure of Mei2-RRM3 was solved with and without an RNA. RNA binding properties of Mei2-RRM3 was studied by ITC. The structure of Erh1 was also solved and we tried to elucidate its importance for biological function of Mmi1. A co-crystallization trial was performed with Mmi1-Mei2-RNA but it was unsuccessful and we ended up with Mmi1 crystals.
  • Computer simulations to engineer PDZ-peptide recognition
    • Villa Francesco
    , 2018 . Protein-protein interactions (PPIs) regulate complex signaling networks in eukaryotic cells. Many binding events between several protein domains transfer information through communication pathways. Disrupting or altering the equilibrium between PPIs plays an important role inseveral diseases and the inibition of targeted PPIs is a recognized strategy for computational drug design. In the present thesis we focused on PDZ domains, which are among the most widespread signaling domains. PDZs recognize the 4-10 C-terminal amino acids of their target proteins as well as the corresponding peptides in isolation. We studied PDZ:peptide binding for the Tiam1 protein, which is a Rac GTP exchange factor involved in neuronal protrusion and axon guidance. Tiam1 activity modulates signaling for cell proliferation and migration, whose dysregulation increases growth of metastatic cancers. Its natural binder peptide is Syndecan1 (Sdc1), composed of 8 amino acids. Its last 5 Cter residues drive interactions in the binding pocket. Experimental affinities for several mutants of Sdc1 and in the protein domain constitute a complete dataset to study many ionic interactions with molecular simulations. These calculations are still challenging, despite the dramatic improvement of biomolecular modelling in the 1990's and 2000's. Upon binding, residues are transferred from a solvent-exposed environment to a solvent-poor one. This is expected to change the electron distribution within residues and nearby solvent molecules. Comparing ligands that differ by one or more ionic side-chain mutations, more sophisticated force fields where electronic polarizability is treated explicitly may be required. We developed and tested both Computational Protein Design (CPD) models and more precise free energy calculation methods based on polarizable molecular dynamics. We developed a general, high-througtput CPD protocol to optimize protein:peptide binding. The model has been implemented in on our in-house CPD package Proteus ( Simonson et al, 2014) and has been tested computing relative binding affinities for many variants of the Tiam1:Sdc1 complex. Monte Carlo sampling of equilibrium distributions of protein sequences is performed using an adaptive bias potential which flattens the energy landscape in sequence space and allows to estimate binding affinities for thousands of protein variants in limited CPU time (~1hour). We also improved our CPD implicit solvent model, implementing a more realistic description of the solute-solvent dielectric boundary. The new method, called Fluctuating Dielectric Boundary (FDB) showed a systematic improvement in the prediction of acid:base constants of several proteins. Promising results were also obtained for the complete sequence redesign of three PDZ domains. In the second part of this work we studied Tiam1:peptide affinities with more sophisticated models, based on free energy simulations with the Drude Polarizable Force field (DrudeFF). We first computed relative binding free energies for charge mutations in the Tiam1:Sdc1 complex, obtaining a clear improvement respect to equivalent calculations performed using two additive force fields. We applied the well-enstablished Dual Topology Approach: to our knowledge, this was the first example of such a calculation for a protein:peptide complex with uses the DrudeFF. Then we went on, developing the Drude polarizable models for methyl phosphate (MP) and phospho tyrosine (pTyr). We were interested in the change in binding affinity associated with phosphorylation of a Tyrosine residue of Sdc1, but Drude pTyr parameters were not yet developed. We tested our new phosphate parameters studying standard binding free energies between MP and magnesium (Mg2+) in water solution. Results showed a good agreement with experiment, improving previous calculations performed using additive force field
  • Regulation of the invasion suppressor Arpin by Tankyrases
    • Chemeris Angelina
    , 2018 . The evolutionarily conserved Arp2/3 complex plays a central role in nucleating the branched actin filament arrays that drive cell migration, endocytosis, and other processes. Recently, an inactivator of the Arp2/3 complex at the lamellipodium tip, a small protein, Arpin, was discovered and characterized. On its C-terminus, Arpin possesses an acidic (A) motif, which is homologous to the A-motif of various Nucleation Promoting Factors (NPFs). It was predicted that Arpin can bind at two binding sites to the Arp2/3 complex, similar to VCA domains of NPFs. Here, we used single particle electron microscopy to obtain a 3D reconstruction of the Arp2/3 complex bound to Arpin at a 25Å resolution. We showed that the binding of Arpin causes the standard open conformational of the Arp2/3 complex. We confirmed that there are two binding sites on the Arp2/3 complex for Arpin: one on the back of the Arp3 subunit, and the second is located between Arp2 and ARPC1 subunits. The distance between the Arp2/3 complex and Arpin (5 nm) supports the view that Arpin interacts with its partner via its unstructured C-terminal acidic tail.Next, using the pull-down assay, we identified the new Arpin binding partners, Tankyrases1/2. Interestingly, Tankyrases and the Arp2/3 complex possess overlapping amino acid sequences at Arpin binding sites. Hence, we demonstrated a competition between the ARC4 domain of Tankyrase1 and the Arp2/3 complex in a dose-dependent manner.To understand the principles of Tankyrases-Arpin interaction, we created a mutant Arpin (ArpinG218D) that lacks its ability to interact with Tankyrases, but not with the Arp2/3 complex in vitro. Interestingly, ArpinG218D was not able to inhibit the Arp2/3 complex in vivo, suggesting that Tankyrase may be necessary for Arpin-Arp2/3 complex interaction. Arpin is the turning factor of migrating cells, so we performed a migration analysis of MCF10-A cells expressing either wild type Arpin (ArpinWT) or mutant ArpinG218D in parallel with the depletion of endogenous Arpin. Cells expressing ArpinG218D had higher directional persistence, similar to the cells where the endogenous Arpin was knocked down. Thus, we suggested that mutant ArpinG218D cannot inactivate the Arp2/3 complex since it is not present at the lamellipodial tip. We compared the amount of protein for both ArpinWT and ArpinG218D in the membrane fraction of the migrating cells. A significant difference (44%) in the amount of ArpinWT and Arpin G218D was consistent with our hypothesis.Tankyrases are therapeutic targets in a variety of cancers, but currently there is no structural model available for these large and flexible proteins. In this work, we obtained for the first time two 3D reconstructions of full-length Tankyrase1 and Tankyrase1 bound to Arpin using single particle electron microscopy. The achieved resolution (27Å) was enough to detect a dramatic conformational change in Tankyrase SAM and PARP domains upon binding of Arpin molecules. In our reconstruction, three Arpins were bound to the ARC1, ARC4 and ARC5 domains of Tankyrase1. ARC5 was shown to be the most flexible part of the ARC cluster.Based on the obtained data, we suggested a model of regulation of the activity of Arpin by Tankyrases. According to our model, Tankyrases bind Arpin in the cytoplasm, change their conformational state and bring Arpin closer to the membrane in the lamellipodia. Deciphering the extracellular signals, Rac GTPase activates Arpin, which sequentially inactivates the Arp2/3 complex, while Tankyrases are released.
  • Le checkpoint de l’actine branchée corticale contrôle la progression du cycle cellulaire
    • Molinié Nicolas
    , 2018 . Résumé : Le cytosquelette d’actine génère et mécanotransduit des forces. Dans cette étude, nous montrons que l’actine branchée corticale, qui dépend de RAC1, WAVE et des complexes Arp2/3 contenant ARPC1B, est spécifiquement détectée par le senseur Coronin1B, qui signale, via WISp39 et l’inhibiteur de cycline/CDK p21, à la cellule, de progresser dans le cycle cellulaire. En conséquence, la formation d’un lamellipode et la migration persistante des cellules qui en découle, est corrélée à la durée de la phase G1. L’actine branchée corticale détermine l’entrée en phase S des cellules, en intégrant les stimuli solubles des facteurs de croissance et la mécanotransduction des adhérences à la matrice extracellulaire et aux cellules voisines. Le complexe Arp2/3 est globalement sur-exprimé dans le cancer du sein. Parmi ses sous-unités, la sur-expression de l’isoforme ARPC1B est le plus fort facteur prognostique pour les patientes. En outre, l’inhibition du complexe Arp2/3 bloque la prolifération de lignées de carcinomes mammaires et de mélanomes transformées par l’oncogène RAC1, contre laquelle il n’existe pas de thérapie ciblée. La découverte du checkpoint de l’actine branchée corticale apporte ainsi de nouvelles options pronostiques, diagnostiques et thérapeutiques dans les cancers.
  • Computational protein design : un outil pour l'ingénierie des protéines et la biologie synthétique
    • Mignon David
    , 2017 . Le « Computational protein design » ou CPD est la recherche des séquences d’acides aminés compatibles avec une structure protéique ciblée. L’objectif est de concevoir une fonction nouvelle et/ou d’ajouter un nouveau comportement. Le CPD est en développement dans de notre laboratoire depuis plusieurs années, avec le logiciel Proteus qui a plusieurs succès à son actif.Notre approche utilise un modèle énergétique basé sur la physique et s’appuie sur la différence d’énergie entre l’état plié et l’état déplié de la protéine. Au cours de cette thèse, nous avons enrichi Proteus sur plusieurs points, avec notamment l’ajout d’une méthode d’exploration Monte Carlo avec échange de répliques ou REMC. Nous avons comparé trois méthodes stochastiques pour l’exploration de l’espace de la séquence : le REMC, le Monte Carlo simple et une heuristique conçue pour le CPD, le «Multistart Steepest Descent » ou MSD. Ces comparaisons portent sur neuf protéines de trois familles de structures : SH2, SH3 et PDZ. En utilisant les techniques d’exploration ci-dessus, nous avons été en mesure d’identifier la conformation du minimum global d’énergie ou GMEC pour presque tous les tests dans lesquels jusqu’à 10 positions de la chaîne polypeptidique étaient libres de muter (les autres conservant leurs types natifs). Pour les tests avec 20 positions libres de muter, le GMEC a été identifié dans 2/3 des cas. Globalement, le REMC et le MSD donnent de très bonnes séquences en termes d’énergie, souvent identiques ou très proches du GMEC. Le MSD a obtenu les meilleurs résultats sur les tests à 30 positions mutables. Le REMC avec huit répliques et des paramètres optimisés a donné le plus souvent le meilleur résultat lorsque toutes les positions peuvent muter. De plus, comparé à une énumération exacte des séquences de faible énergie, le REMC fournit un échantillon de séquences de grande diversité.Dans la seconde partie de ce travail, nous avons testé notre modèle pour la conception de domaines PDZ. Pour l’état plié,nous avons utilisé deux variantes d’un modèle de solvant GB. La première utilise une frontière diélectrique protéine/solvant effective moyenne ; la seconde, plus rigoureuse, utilise une frontière exacte qui fluctue le long de la trajectoire MC. Pour caractériser l’état déplié, nous utilisons un ensemble de potentiels chimiques d’acide aminé ou énergies de références. Ces énergies de références sont déterminées par maximisation d’une fonction de vraisemblance afin de reproduire les fréquences d’acides aminés des domaines PDZ naturels. Les séquences conçues par Proteus ont été comparées aux séquences naturelles. Nos séquences sont globalement similaires aux séquences Pfam, au sens des scoresBLOSUM40, avec des scores particulièrement élevés pour les résidus au cœur de la protéine. La variante de GB la plus rigoureuse donne toujours des séquences similaires à des homologues naturels modérément éloignés et l’outil de reconnaissance de plis Super family appliqué à ces séquences donne une reconnaissance parfaite. Nos séquences ont également été comparées à celles du logiciel Rosetta. La qualité, selon les mêmes critères que précédemment, est très comparable, mais les séquences Rosetta présentent moins de mutations que les séquences Proteus.
  • Étude computationnelle du domaine PDZ de Tiam1
    • Panel Nicolas
    , 2017 . Les interactions protéine-protéine sont souvent contrôlées par de petits domaines protéiques qui régulent les chemins de signalisation au sein des cellules eucaryotes. Les domaines PDZ sont parmi les domaines les plus répandus et les plus étudiés. Ils reconnaissent spécifiquement les 4 à 10 acides aminés C-terminaux de leurs partenaires. Tiam1 est un facteur d'échange de GTP de la protéine Rac1 qui contrôle la migration et la prolifération cellulaire et dont le domaine PDZ lie les protéines Syndecan-1 (Sdc1), Caspr4 et Neurexine. Des petits peptides ou des molécules peptidomimétiques peuvent potentiellement inhiber ou moduler son activité et être utilisés à des fins thérapeutiques. Nous avons appliqué des approches de dessin computationnel de protéine (CPD) et de calcul d'énergie libre par simulations dynamique moléculaire (DM) pour comprendre et modifier sa spécificité. Le CPD utilise un modèle structural et une fonction d'énergie pour explorer l'espace des séquences et des structures et identifier des variants protéiques ou peptidiques stables et fonctionnels. Nous avons utilisé le programme de CPD Proteus, développé au laboratoire, pour redessiner entièrement le domaine PDZ de Tiam1. Les séquences générées sont similaires à celles des domaines PDZ naturels, avec des scores de similarité et de reconnaissance de pli comparables au programme Rosetta, un outil de CPD très utilisé. Des séquences contenant environ 60 positions mutées sur 90, ont été testées par simulations de DM et des mesures biophysiques. Quatre des cinq séquences testées expérimentalement (par nos collaborateurs) montrent un dépliement réversible autour de 50°C. Proteus a également déterminer correctement la spécificité de la liaison de quelques variants protéiques et peptidiques. Pour étudier plus finement la spécificité, nous avons paramétré un modèle d'énergie libre semi-empirique de Poisson-Boltzmann ayant la forme d'une énergie linéaire d'interaction, ou PB/LIE, appliqué à des conformations issues de simulations de DM en solvant explicite de complexes PDZ:peptide. Avec trois paramètres ajustables, le modèle reproduit correctement les affinités expérimentales de 41 variants, avec une erreur moyenne absolue de 0,4~kcal/mol, et donne des prédictions pour 10 nouveaux variants. Le modèle PB/LIE a ensuite comparé à la méthode non-empirique de calcul d'énergie libre par simulations alchimiques, qui n'a pas de paramètre ajustable et qui prédit correctement l'affinité de 12 complexes Tiam1:peptide. Ces outils et les résultats obtenus devraient nous permettre d'identifier des peptides inhibiteurs et auront d'importantes retombées pour l'ingénierie des interactions PDZ:peptide.
  • The role of a trimeric coiled coil protein in WASH complex assembly
    • Visweshwaran Sai Prasanna
    , 2017 . The Arp2/3 complex generates branched actin networks, which produces a pushing force that helps the cell to remodel its membranes. The WASH complex activates the Arp2/3 complex at the surface of endosomes and thereby, facilitates the membrane scission of the transport intermediates containing internalized receptors such as α5β1 integrins. Hence, by promoting integrin recycling, the WASH complex plays a crucial role in tumor cell invasion during cancer progression. However, how cells assemble the WASH complex at first is unknown. Here we report the identification of the first assembly factor of the WASH complex. We identified HSBP1 in a proteomics screen for proteins binding to precursor forms of subunits, but not to the fully assembled WASH complex. Through biochemical reconstitution and molecular modeling, we found that HSBP1 associates with the precursor CCDC53 trimer, dissociates it and forms a heterotrimer that will eventually contribute a single CCDC53 molecule to the assembling WASH complex. The role of HSBP1 in WASH complex assembly is well conserved since WASH is similarly destabilized upon HSBP1 knock-down in mammalian cells or upon HSBP1 knock-out in Dictyostelium amoeba. In line with the defective assembly of the WASH complex, the HSBP1 knock-out closely phenocopies WASH knock-out in amoeba. In human mammary carcinoma cells, HSBP1 depletion results in impaired integrin recycling to the plasma membrane leading to the defective development of focal adhesions and reduced invasion abilities. Moreover, HSBP1 was found to localize at the centrosome and was required for the polarization associated with the migration. On the other end, in mammary breast tumors, we found that HSBP1 was often overexpressed and that its overexpression was associated with increased levels of the WASH complex and with poor prognosis for breast cancer patients. Hence, HSBP1 is a conserved assembly factor that controls the levels of the WASH complex.
  • Study of trm112, a unique methyltransferase activator at the interface between ribosome synthesis and function
    • Tran Van Nhan
    , 2017 . Methylation is a widely distributed modification found in a variety of substrates involved in different steps of eukaryotic protein translation. Methylation reactions are catalyzed by enzymes called methyltransferases (MTases) generally using S-adenosyl-L- methionine (SAM or AdoMet) as the methyl donor. The effects of methylation on translation are perfectly illustrated by the Trm112 protein, which is an activating platform, essential for the function of four SAM-dependent MTases (Trm9, Trm11, Bud23 and Mtq2) modifying factors participated in protein synthesis. The Trm9-Trm112 and Trm11-Trm112 complexes methylate some tRNAs to form mcm5U34 and m2G10 respectively. The Bud23-Trm112 complex modifies 18S rRNA to form m7G1715 while the Mtq2-Trm112 complex methylates class I translation termination factor eRF1 at glutamine side chain of GGQ motif. Until now, the study of Trm112 network in eukaryotes has been quite clear structurally and functionally, however, little is known for corresponding proteins in Archaea.My PhD project aims to characterize the Trm112 network in archaea using Haloferax volcanii as a model organism and to decipher the mechanisms of substrate modification by Trm112-MTase complexes. This will help understanding the roles of these enzymes in protein synthesis from an evolutionary point of view.Towards this goal, I have generated several H. volcanii strains (Δtrm112, Δtrm112 Trm112-Flag, …). Co-immunoprecipitation of Trm112-Flag coupled to mass spectrometry allowed me identifying a significant number of methyltransferases (MTases), including putative orthologues of eukaryotic Trm112 partners, as potential interactors. I have next validated these new partners by biochemical approaches (co-purification, enzymatic assays, …) and determined the crystal structure for one Trm112-MTase complex. I have then convincing evidences that H. volcanii Trm12 has more MTase partners than the eukaryotic one. My work opens new routes towards the characterization of the role of Trm112 in archaea but has also led to the identification of a new MTase partner of the eukaryotic Trm112.
  • Défis algorithmiques pour les simulations biomoléculaires et la conception de protéines
    • Druart Karen
    , 2016 . Le dessin computationnel de protéine, ou CPD, est une technique qui permet de modifier les protéines pour leur conférer de nouvelles propriétés, en exploitant leurs structures 3D et une modélisation moléculaire. Pour rendre la méthode de plus en plus prédictive, les modèles employés doivent constamment progresser. Dans cette thèse, nous avons abordé le problème de la représentation explicite de la flexibilité du squelette protéique. Nous avons développé une méthode de dessin "multi-états", qui se base sur une bibliothèque discrète de conformations du squelette, établie à l'avance. Dans un contexte de simulation Monte Carlo, le paysage énergétique d'une protéine étant rugueux, les changements de squelettes ne peuvent etre acceptés que moyennant certaines précautions. Aussi, pour explorer ces conformations, en même temps que des mutations et des mouvements de chaînes latérales, nous avons introduit un nouveau type de déplacement dans une méthode Monte Carlo existante. Il s'agit d'un déplacement "hybride", où un changement de squelette est suivi d'une courte relaxation Monte Carlo des chaînes latérales seules, après laquelle un test d'acceptation est effectué. Pour respecter une distribution de Boltzmann des états, la probabilité doit avoir une forme précise, qui contient une intégrale de chemin, difficile à calculer en pratique. Deux approximations sont explorées en détail: une basée sur un seul chemin de relaxation, ou chemin "générateur" (Single Path Approximation, ou SPA), et une plus complexe basée sur un ensemble de chemins, obtenus en permutant les étapes élémentaires du chemin générateur (Permuted Path Approximation, ou PPA). Ces deux approximations sont étudiées et comparées sur deux protéines. En particulier, nous calculons les énergies relatives des conformations du squelette en utilisant trois méthodes différentes, qui passent réversiblement d'une conformation à l'autre en empruntent des chemins très différents. Le bon accord entre les méthodes, obtenu avec de nombreuses paramétrisations différentes, montre que l'énergie libre se comporte bien comme une fonction d'état, suggérant que les états sont bien échantillonnés selon la distribution de Boltzmann. La méthode d'échantillonnage est ensuite appliquée à une boucle dans le site actif de la tyrosyl-ARNt synthétase, permettant d'identifier des séquences qui favorisent une conformation, soit ouverte, soit fermée de la boucle, permettant en principe de contrôler ou redessiner sa conformation. Nous décrivons enfin un travail préliminaire visant à augmenter encore la flexibilité du squelette, en explorant un espace de conformations continu et non plus discret. Ce changement d'espace oblige à restructurer complètement le calcul des énergies et le déroulement des simulations, augmente considérable le coût des calculs, et nécessite une parallélisation beaucoup plus agressive du logiciel de simulation.
  • Mécanisme de formation du complexe de démarrage de la traduction chez les Archées
    • Monestier Auriane
    , 2016 . Une cellule est soumise à différents stimuli internes et externes. Pour remplir ses fonctions, elle doit donc s’adapter rapidement. Cela implique une régulation fine de l’expression génique. Celle-ci s’effectue au niveau transcriptionnel, mais également au niveau traductionnel. La traduction comprend trois phases : le démarrage, l’allongement et la terminaison. C’est au cours du démarrage de la traduction que s’effectue la sélection du codon de démarrage et donc le choix du cadre de lecture de l’ARNm. D’un point de vue cinétique, le démarrage de la traduction est l’étape limitante. Ainsi, il apparait comme une cible privilégiée pour le contrôle traductionnel.Chez les archées, le démarrage de la traduction met en jeu un complexe macromoléculaire formé de la petite sous-unité du ribosome, d’un ARNm, d’un ARN de transfert initiateur méthionylé (Met-ARNtiMet) et de trois facteurs de démarrage de la traduction (aIF1, aIF1A et aIF2). De manière intéressante, ces trois facteurs de démarrage ont chacun un orthologue eucaryote.Les ARNti archées et eucaryotes possèdent une paire de bases très conservée A1-U72, au sommet de la tige acceptrice. Cette paire de base a été montrée importante pour la discrimination des ARNt initiateurs et élongateurs. De plus, des travaux suggèrent l’importance de la géométrie de la paire A1-U72 pour l’identité initiatrice de ces ARNts. Cependant, au début de ma thèse, aucune donnée structurale n’était disponible pour expliquer comment les caractéristiques de la paire A1-U72 participaient à la sélection de l’ARNt initiateur. Dans un premier temps, mon travail de thèse a consisté en la construction d’une souche bactérienne d’E.coli utilisant comme seul source d’ARNti un variant d’ARNt initiateur bactérien (ARNtfMet) possédant une paire de base A1-U72 (ARNtfMetA1-U72). L’utilisation de cette souche nous a permis d’obtenir de grandes quantités d’ARNtfMetA1-U72 purifié. De plus, la structure cristallographique de cet ARNtA1-U72 a pu être déterminée à 2.8 Å de résolution. Un arrangement inhabituel des bases A1 et U72 a été observé.Tous les acteurs du démarrage de la traduction de l’archée P. abyssi étant disponibles au laboratoire, une étude du complexe de démarrage de la traduction archée par cryo-microscopie électronique a pu être réalisée. L’étude a permis d’identifier deux conformations de l’ARNti dans le complexe de démarrage, IC0-Premote (5.3 Å de résolution) et IC1-Pin (7.5 Å de résolution). Ces deux conformations permettent de proposer un modèle pour l’accommodation de l’ARNt initiateur lors de l’appariement au codon de démarrage.Finalement, je me suis également intéressée au rôle du facteur aIF1. La disponibilité de structures 3D et de modèles d’assemblage, ainsi que les alignements des séquences aIF1 d’archées ont permis de proposer des régions ou acides aminés pouvant être impliqués dans la liaison au ribosome et/ou dans la sélection des ARNt initiateurs lors de la formation du complexe de démarrage. Afin de pouvoir étudier l’implication de ces régions ou acides aminés, j’ai mis au point une méthode d’étude de la liaison d’aIF1 à la petite sous-unité du ribosome par anisotropie de fluorescence. Cette étude met en évidence deux résidus basiques d’aIF1 impliqués dans la liaison au ribosome. D’autre part, les rôles d’aIF1 dans la sélection du codon de démarrage de la traduction et dans la stabilisation du complexe de démarrage sur l’ARNm sont étudiés par la méthode d’empreinte du ribosome ou toeprint.
  • Etudes structurales et fonctionnelles de complexes entre Trm112 et différentes méthyltransférases impliquées dans la traduction
    • Létoquart Juliette
    , 2014 . La traduction représente un processus central au sein de la cellule, elle assure le transfert de l’information génétique de l’ARNm vers les protéines. De nombreux acteurs y sont impliqués directement ou indirectement et parmi eux, chez les eucaryotes, la petite protéine Trm112. Celle-ci participe à la modification de plusieurs acteurs directs en interagissant et en activant quatre MTases. Le facteur de terminaison eRF1 est méthylé par le complexe Mtq2-Trm112, l’ARNr 18S par Bud23-Trm112 et certains ARNt par les complexes Trm9-Trm112 et Trm11-Trm112. Au cours de ce travail, les structures cristallographiques de Trm9-Trm112 et de Bud23-Trm112 de levure ont été résolues. L’étude comparative structurale de ces complexes et de la structure connue de Mtq2-Trm112, a permis de mettre en évidence que dans un même organisme, les séquences des trois protéines ont évolué de manière à conserver l’interaction avec Trm112. Même si les quatre partenaires présentent moins de 20% d’identité de séquence, les résidus clés pour l’interaction avec la petite protéine activatrice sont conservés ou partagent des caractéristiques identiques. En plus de l’analyse structurale, le complexe Trm9-Trm112 a fait l’objet d’une étude fonctionnelle chez S. cerevisiae ce qui a permis de cartographier le site actif de l’enzyme et de proposer un modèle de mécanisme d’action. Enfin, les premières études in vivo réalisées chez Haloferax volcanii suggèrent que cette plateforme serait également présente chez certains organismes procaryotes.
  • Design computationnel de protéines pour la prédiction de structure
    • Sedano-Pelzer Audrey
    , 2013 . Grâce aux récents progrès technologiques et à l'arrivée des séquenceurs de nouvelle génération, la quantité de données génomiques croît exponentiellement, alors que l'écart avec le nombre de structures résolues se creuse. Dans l'idéal, on aimerait pouvoir prédire par informatique la structure 3D de n'importe quelle protéine à partir de l'information de séquence seule, même en l'absence d'homologie. En effet, en dessous de 30% d'identité de séquence, les mesures de similarité de séquences ne sont plus suffisantes pour détecter l'homologie. Il faut donc mettre en place d'autres méthodes afin de venir à bout de cette zone d'ombre. Pour une structure donnée (et donc une fonction biologique), on ne dispose souvent que d'une petite quantité de séquences natives y correspondant, et parfois assez peu identiques. Il est alors difficile de construire un profil de recherche d'homologues pour retrouver ces séquences dont on ne connaîtrait pas la structure. Alors comment disposer de bases de données de séquences plus conséquentes pour chaque structure ? Ainsi, le design computationnel de protéine (CPD) tente de répondre à cette problématique : si l'on connaît un repliement, est-il possible de retrouver l'ensemble des séquences qui lui correspondent ? Le principe du CPD consiste à identifier parmi toutes les séquences compatibles avec le repliement d'intérêt, celles qui vont conférer à la protéine, la fonction désirée. La procédure générale est réalisée en deux étapes. La première consiste à calculer une matrice d'énergie contenant les énergies d'interactions entre toutes les paires de résidus de la protéine en autorisant successivement tous les types d'acides aminés dans toutes leurs conformations possibles. La seconde étape, ou "phase d'optimisation", consiste à explorer simultanément l'espace des séquences et des conformations afin de déterminer la combinaison optimale d'acides aminés étant donné le repliement de départ. Une première phase d'analyse de covariances de positions d'alignements de séquences théoriques a été menée. Nous avons ainsi pu mettre au point une méthode statistique pour repérer des ensembles de positions qui muteraient ensemble pour une structure donnée. La construction d'un profil avec toutes ces séquences théoriques moyennant trop l'information en acides aminés, nous avons pu améliorer la recherche d'homologues en construisant plusieurs profils à partir de groupes de séquences classées grâce à des motifs sur ces positions considérées comme covariantes. Pour mieux appréhender la qualité de ces prédictions de séquences théoriques, il fallait mettre en place un protocole de sélection des meilleurs protéines mutantes afin de les tester in vivo. Mais comment déterminer qu'une séquence théorique est meilleure qu'une autre? Sur quels critères se baser pour les caractériser? Aussi, un ensemble de descripteurs a été choisi, permettant de trier sur plusieurs critères les séquences théoriques pour n'en choisir qu'une vingtaine. Ensuite, ces protéines mutantes ont été soumises à des simulations de dynamique moléculaire afin d'évaluer leur stabilité théorique. Pour quelques protéines mutantes plus prometteuses, nous avons réalisé des expériences de sur-expression, de purification et de détermination structurale, tentant d'obtenir une validation biologique du modèle de CPD. Ces protocoles d'analyse et de validation semblent être de bons moyens permettront à notre équipe de tester d'autres protéines mutantes dans l'avenir. Ils pourront ainsi modifier des paramètres lors de la génération par CPD et s'appuyer sur des résultats expérimentaux pour les ajuster.
  • Modélisation de l'évolution dirigée de la tyrosyl-ARNt synthétase in silico. Introduction d'acides aminés non naturels dans les protéines.
    • Amara Najette
    , 2011 . Les protéines sont synthétisées essentiellement à partir d'acides aminés L. Cependant, les acides aminés D sont naturellement présents dans notre organisme. Il existe plusieurs mécanismes de régulation pour limiter leur présence. Il peut y avoir un intérêt bio-technologique à introduire des acides aminés D dans les protéines pour leur conférer des fonctions chimiques nouvelles. Les protéases, chargées de dégrader les peptides, reconnaissent moins bien les protéines possédant de tels acides aminés. Dans notre cas, présenter la tyrosine sous son énantiomère D donnerait un avantage par rapport aux protéases. En effet, un peptide qui aurait des acides aminés D, resterait plus longtemps actif dans un organisme. La tyrosyl-ARNt synthétase (TyrRS) a déjà été utilisée pour l'incorporation de plus d'une trentaine d'analogues de la tyrosine dans les protéines. Cette enzyme possède déjà une activité naturelle pour la D-tyr, mais celle ci est très faible. L'objectif du présent travail est de l'améliorer par une méthode d'évolution dirigée iin silico. Cette méthode consiste à muter aléatoirement une protéine puis à sélectionner les mutants qui ont les propriétés désirées, mimant les mécanismes de l'évolution naturelle. L'évolution dirigée textit{in silico} a déjà été utilisée pour l'ingénierie d'un grand nombre de protéines. On utilise pour cette étude le programme d'évolution dirigée développé au laboratoire qui procède à une optimisation itérative de la séquence et de la structure. Des mutations ont été retenues par cette méthode et proposées aux expérimentalistes du laboratoire de biochimie pour des validations expérimentales. Ils ont conclut que plusieurs mutants présentent une activité faible mais mesurable pour la D-Tyrosine. L'étude a été étendue à d'autres résidus proches de l'ammonium de la L-Tyr. Nous avons identifié d'autres positions qui pourraient être intéressantes à muter. L'étude, faite dans un premier temps avec le ligand tyrosine, a été ensuite améliorée en considérant le ligand Tyrosyl adénylate (tyrAMP). C'est l'intermédiaire qui va interagir avec l'ARNt pour former l'ARNt-Tyr . Le L-TyrAMP et le D-TyrAMP ont tous deux été modélisés avec la TyrRS d'Escherichia coli. Toutes ces modélisations ont conduit à une liste de séquences mutantes qui ont été prédites comme favorables à la liaison du D-TyrAMP. Chacune des séquences obtenues pour les deux synthétases a ensuite fait l'objet d'une étude plus approfondie visant à déterminer la spécificité pour le ligand D-TyrAMP. Suite à cela, nous avons sélectionné une dizaine de séquences de TyrRS mutantes d'Escherichia coli afin de réaliser des calculs de dynamique moléculaire. Nous avons utilisé les ressources du super calculateur du CINES (Centre Informatique Nationale de l'Education Supérieur) pour faire des études de dynamique moléculaire. Une meilleure estimation de l'affinité de ces différents mutants pour le D-TyrAMP a été atteinte. Un autre but de la thèse était d'améliorer notre protocole de Protein Design en adoptant un champ de force tout atome et un modèle de solvant plus sophistiqué. Pour le solvant, le modèle de Born généralisé que nous avons implémenté dans le protocole est basé sur la théorie de Poisson-Boltzmann, avec un continuum diélectrique qui entoure la protéine. Les validations sur des peptides tests ont été concluantes. L'évolution dirigée de la TyrRS de Bacillus Stearothermophilus sert de validation à ce protocole car des mesures expérimentales pour une quinzaine de mutants sont disponibles.
  • Cartographie structurale et fonctionnelle de la liaison entre la peptidyl-ARNt hydrolase et son substrat
    • Laurent Giorgi
    , 2010 . La peptidyl-ARNt hydrolase est une enzyme qui hydrolyse les peptidyl-ARNt issus d'une terminaison prématurée de la traduction. Cette protéine est essentielle à la viabilité des bactéries, mais pas à celle des eucaryotes, ce qui fait d'elle une cible potentielle pour l'action d'anti-bactériens. Cela justifie également qu'on cherche à cartographier l'interaction de cette protéine avec son substrat, pour faciliter la conception d'inhibiteur. Les tentatives d'obtention de cristaux de complexes enzyme:analogue de substrat étant restées vaines, nous avons choisi d'étudier de tels complexes en solution, par RMN. Grâce à un double marquage 15N/13C, nous avons tout d'abord attribué les fréquences de résonance des atomes du squelette de la protéine et d'une grande partie des chaînes latérale. Nous avons ensuite étudié l'interaction entre la PTH d'E. coli et un analogue de son substrat synthétisé chimiquement, la diacétyl-Lys-(3'NH)-adénosine. Cette étude nous a permis de caractériser le rôle de nombreux résidus du site actif, notamment celui d'une phénylalanine (F66) interagissant via son cycle aromatique avec l'adénine 3'-terminale du substrat, celui d'une asparagine (N114) stabilisant une molécule d'eau responsable de l'hydrolyse du substrat et celui d'une autre asparagine (N10) permettant à la PTH de discriminer positivement les peptidyl-ARNt par rapport aux aminoacyl-ARNt. Nous avons aussi étudié l'interaction entre la protéine et des mini-ARNt mimant la tige acceptrice et le bras TΨC d'un ARNt. Ce travail a permis de cartographier la surface de la PTH où l'ARN s'ancre à la protéine. Il a confirmé l'importance de deux résidus basiques, la lysine K105 et l'arginine R133, pour la reconnaissance du phosphate en 5' de l'ARNt. Il a également révélé une interaction entre l'hélice C-terminale de la protéine et le bras TΨC de l'ARNt, à 30 Å du site actif. La pertinence fonctionnelle de ce dernier contact a pu être établie par mutagenèse dirigée. L'ensemble de ces résultats permet de proposer un modèle complet de l'interaction entre la PTH et un peptidyl-ARNt.
  • Protéines : Structure fonction et évolution.
    • Aleksandrov Alexey
    , 2008 . Tétracyclines (TC) sont une famille d'antibiotiques important, qui se lient SPECI ャ ... allié aux protéines du ribosome et solidaire. Le mécanisme le plus important de la résistance à la tétracycline est régie par sa reliure en Tc: Mg2 + complexe à la protéine Tet Repressor (TetR). Il est donc d'intérêt pour améliorer notre compréhension des deux Tc: TetR et Tc: liaison au ribosome. Les structures cristallines des tétracyclines dans plusieurs complexes avec les protéines et les ribosomes ont fourni des informations essentielles. Une approche complémentaire consiste à développer des modèles de simulation par ordinateur, qui peut être utilisée pour étudier la structure, la dynamique et la thermodynamique de Tc: protéines ou Tc: complexes ribosome. Malgré son importance, à la tétracycline a rarement été soumis à la modélisation informatique, en partie en raison de la nécessité de ャ> St développer un modèle de mécanique moléculaire pour le TC. Ici, nous avons développé un tel modèle, de manière à être compatible avec le ャ CHARMM27 force »ld pour les protéines et les acides nucléiques, de 12 analogues de tétracycline importants, notamment la tétracycline plaine. paramètres ld ャ forces intermoléculaires ont été dérivées de supermolécule une approche standard. Le modèle reproduit la géométrie ab initio et Fxibility ャ de chaque Tc. Comme les tests, nous avons fait des simulations d'un cristal de Tc, Tc: Mg2 + et Tc: complexes Ca2 + en solution aqueuse, et d'un complexe solvaté entre TC: Mg2 + et le TetR. Le modèle se compare bien avec un large corpus de données expérimentales. Nous ャ> St utilisé notre modèle pour l'étude Tc: reconnaissance TetR qui est un problème complexe. Nous avons utilisé des simulations d'énergie libre pour étudier les interactions électrostatiques entre la protéine et ligand et le rôle éventuel de ャ induite "en Tc contraignant. Nous avons constaté que la tétracycline préfère une étendue, l'état zwitterioniques fois en solution et en complexe avec la protéine. Tc est donc préorganisés pour la reliure. En l'absence de Tc, TetR est étroitement liée à son ADN opérateur; lors de la liaison de Tc il se dissocie de l'ADN, permettant l'expression des gènes réprimés. Son contrôle serré par Transports Canada fait TetR largement utilisables dans le génie génétique. Le Tc site de liaison est plus de 20 ヒ A partir de l'ADN, de sorte que le signal de liaison doivent se propager sur une longue distance. Nous utilisons des simulations de dynamique moléculaire et calculs continuum électrostatique pour élucider le mécanisme allostérique. Lorsque [TC: Mg] lie +, l'ion Mg2 + permet des interactions avec hélice 8 de TetR un monomère et Helix 6 de l'autre monomère, et Helix 6 est tiré en direction du noyau central de la structure. Hy- interactions drophobic avec hélice 6 puis tirez hélice 4 dans un mouvement pendulaire, avec un déplacement maximum à son extrémité N-terminale: l'interface de l'ADN. Le résidu N-terminal de l'hélice 4, Lys48, est très conservée dans l'ADN de liaison des protéines régulatrices de la classe TetR et fait la plus grande contribution de tout acide aminé à l'TetR: l'ADN d'énergie libre contraignant. Ainsi, les changements de conformation conduire à une réduction drastique de la TetR: la liaison d'un ADN lité ャハ, permettant TetR se détacher de l'ADN. Nous avons ensuite utilisé le modèle pour l'étude Tc liaison au ribosome et de facteur d'élongation Tu (EF-Tu). Les structures cristallines de Tc lié à la Thermus thermophilus 30S sous-unité montrer le même site Tc primaire obligatoire (appelé TET1), avec la plus forte densité d'électrons Tc, à proximité du site A-, compatible avec un rôle inhibiteur. Un site secondaire Tc-contraignant, TET5 appelé a également été observée dans les deux structures. Nous avons fait de la dynamique moléculaire (MD) des simulations de sous-unités 30S du ribosome pour caractériser Tc contraignant et aider à résoudre l'ambiguïté en ce qui concerne le nombre et la force de Tc sites de liaison. Nous avons présenté des preuves pour les lier à TET1 prédominante, indiquant que d'autres sites de liaison signalés sont plus faibles et pas très occupés à des concentrations physiologiques Tc. Récemment, la structure cristalline d'un complexe entre le facteur d'allongement Tu (EF-Tu) et Tc a été résolu, ce qui soulève la question de savoir si Tc 窭 冱 contraignant à EF-Tu a un rôle dans l'inhibition de la synthèse protéique. Nous montrons que la contribution directe de EF-Tu à l'énergie libre de Tc contraignant à l'EF-Tu: PIB: complexe Mg est négligeable, mais plutôt la liaison peut être attribuée uniquement à Tc interactions avec l'ion Mg et le phosphate PIB groupes . Nous montrons aussi que EF-Tu ne présente pas de préférence contraignant pour le TC sur la non-antibiotiques, 4-dedimethyl-Tc, et EF-Tu ne lie pas la tigécycline analogique Tc, qui est un antibiotique puissant. Globalement, nos résultats appuient l'idée que les EF-Tu n'est pas la cible principale de la tétracycline. Les articles présentés ci-dessous comprennent à la fois de calcul et les résultats expérimentaux. Tout le travail expérimental a été réalisé par Winfried Hinrichs et ses collabora-teurs. Tout le travail de calcul a été fait par moi-même. Les connaissances acquises dans ce travail et les techniques de modélisation employées doivent être d'intérêt pour l'amélioration des techniques antibiotiques Tc et TetR protéines améliorées pour la régulation des gènes.