TU Darmstadt / ULB / TUprints

Correlations in thermodynamics and evolution of proteins

Minning, Jonas (2012)
Correlations in thermodynamics and evolution of proteins.
Technische Universität Darmstadt
Ph.D. Thesis, Primary publication

[img]
Preview
PDF
dissertation_minning.pdf
Copyright Information: CC BY-NC-ND 2.5 Generic - Creative Commons, Attribution, NonCommercial, NoDerivs .

Download (4MB) | Preview
Item Type: Ph.D. Thesis
Type of entry: Primary publication
Title: Correlations in thermodynamics and evolution of proteins
Language: English
Referees: Porto, Dr. Markus ; Drossel, Prof. Dr. Barbara
Date: 5 June 2012
Place of Publication: Darmstadt
Date of oral examination: 4 June 2012
Abstract:

An important prerequisite for the biological function of a protein is the thermodynamic stability of its three-dimensional structure, the so-called native state. By adjusting the amino acid sequence the stability can be optimized by two different strategies. While positive design increases the stability with respect to unfolding by decreasing the free energy of the native state, negative design increases the free energy of misfolded structures in order to optimize the stability against misfolding. One stability can be optimized only at the expense of the other, thus optimal stability demands a trade-off between the two strategies.

In the first part of this work, negative design in naturally occurring proteins was investigated using a simple energy model based on contact interactions of amino acids. The calculation of the free energy of the misfolded ensemble is difficult due to the large number of misfolded structures. A widely used model to describe the free energy of the misfolded ensemble is the Random Energy Model (REM), which assumes contacts to be uncorrelated and to occur with equal frequency. This is, however, an inaccurate description, as the probability of contact decreases with increasing distance in the sequence and the formation of a contact in a misfolded structure is correlated with other contacts. The first part of the thesis investigates how contact frequency and contact correlation affect negative design. Here, the free energy of the misfolded ensemble is approximated by a cumulant expansion, where contact frequency and contact correlation are explicitly included. In addition, it is investigated how the description of optimal hydrophobicity profiles, which have maximal stability in the native state, can be enhanced by the inclusion of contact correlations. The detailed description of the misfolded ensemble can help to improve the design of sequences or allows a more accurate modeling of protein evolution.

Since protein sequences change during evolution, correlated substitutions of amino acids at different sites in the protein --- in the literature often referred to as correlated mutations --- give insight into the native structure and function of a protein. However, there was no theoretical description to quantify the effects of the physical constraints of structure and folding stability on correlated mutations in protein sequences. In the second part, a model is studied which quantitatively predicts the correlated mutations from constraints on the folding stability. The model is based on maximizing the sequence entropy, which is approximated by a cluster expansion up to second order. The model is tested using data from computer simulations and a statistical analysis of proteins from the Protein Data Bank. In particular, the determination of the model parameters allows an interpretation of the correlations in terms of both design strategies that characterize sequence evolution. The model can help to distinguish native from non-native contacts based on correlated mutations, thus improving the prediction of contacts and hence the prediction of protein structures. In addition, the model could be helpful to distinguish between correlated mutations that result from the folding stability or other selective pressures.

Alternative Abstract:
Alternative AbstractLanguage

Eine wichtige Voraussetzung für die biologische Funktion eines Proteins ist die thermodynamische Stabilität dessen dreidimensionaler Struktur, der sogenannte native Zustand. Durch Anpassung der Aminosäurensequenz lässt sich die Stabilität durch zwei verschiedene Prinzipien optimieren. Während positives Design die Stabilität gegen Entfaltung erhöht, indem es die freie Energie des nativen Zustandes erniedrigt, versucht negatives Design die freie Energie missgefalteter Strukturen zu erhöhen, um so die Stabilität gegen Missfaltung zu optimieren. Eine Stabilität kann nur auf Kosten der anderen optimiert werden, so dass ein Kompromiss zwischen beiden Prinzipien gefunden werden muss.

Im ersten Teil der Arbeit wurde anhand eines einfaches Energiemodells, das auf Kontaktwechselwirkungen von Aminosäuren beruht, negatives Design in natürlich vorkommenden Proteinen untersucht. Die Beschreibung der freie Energie des missgefalteten Ensembles ist auf Grund der großen Anzahl von missgefalteten Strukturen schwierig. Ein weit verbreitetes Modell zur Berechnung der freien Energie des missgefalteten Ensembles ist das Random Energy Model (REM), das die möglichen Kontakte zwischen Residuen als unkorreliert und mit gleicher Häufigkeit vorkommend annimmt. Dies ist jedoch nur eine ungenaue Beschreibung, vielmehr vermindert sich die Kontaktwahrscheinlichkeit mit wachsenden Abstand in der Sequenz und das Formen eines Kontakts in einer missgefalteten Struktur ist mit anderen Kontakten korreliert. Im ersten Teil der Arbeit wird untersucht, wie Kontakthäufigkeit und Kontaktkorrelationen negatives Design beeinflussen. Dabei wurde die freie Energie des missgefalteten Ensembles in einer Kumulantenentwicklung approximiert, in die explizit Kontakthäufigkeiten und Kontaktkorrelationen einbezogen werden. Zudem wird untersucht, inwiefern sich die Beschreibung optimaler Hydrophobitätsprofile, die maximale Stabilität der nativen Struktur erreichen, durch die Einbeziehung von Kontaktkorrelationen verbessern lässt. Die genauere Beschreibung des missgefalteten Ensembles kann zu einer Verbesserung von Design von Sequenzen oder einer genaueren Modellierung von Proteinevolution beitragen.

Da Proteinsequenzen sich in Laufe der Evolution verändern, liefern korrelierte Substitution von Aminosäuren an verschiedenen Plätzen im Protein -- in der Literatur oft mit korrelierten Mutationen bezeichnet -- Einsicht in die native Struktur und Funktionen eines Proteins. Jedoch gab es keine bislang noch keine theoretische Beschreibung, die die Auswirkungen der physikalischen Beschränkungen durch Struktur und Faltungsstabilität auf Korrelationen in Proteinsequenzen quantifizieren. In zweiten Teil der Arbeit wird ein Modell untersucht, das korrelierte Mutationen aus Bedingungen an die Faltungsstabilität quantitativ vorhersagt. Die Grundlage des Modells ist die Maximierung der Sequenzentropie, die durch eine Cluster-Enwicklung bis zur zweiten Ordnung approximiert wird. Das Modell wird anhand von Daten aus Computersimulationen und einer statistischen Analyse von Proteinen aus der Protein Data Bank getestet. Insbesondere erlaubt die Bestimmung der Modellparameter eine Interpretation der Korrelationen in Bezug auf die beiden Designstrategien, die die Sequenzevolution prägen. Das Modell kann Hinweise darauf liefern, wie man native von nicht-nativen Kontakten unterscheidet, und so zur Verbesserung der Vorhersage von Kontakten und damit von Proteinstrukturen beitragen. Zudem könnte das Modell dabei behilflich sein, zwischen korrelierten Mutationen zu unterscheiden, die aus der Faltungsstabilität oder von anderen Selektionsdrücken herrühren.

German
Uncontrolled Keywords: protein folding, stability against misfolding, negative design, misfolded free energy, cumulant expansion, contact frequency, contact correlations, correlated mutations, maximum entropy, cluster expansion of entropy, protein sequence evolution, structurally constraint evolution
Alternative keywords:
Alternative keywordsLanguage
protein folding, stability against misfolding, negative design, misfolded free energy, cumulant expansion, contact frequency, contact correlations, correlated mutations, maximum entropy, cluster expansion of entropy, protein sequence evolution, structurally constraint evolutionEnglish
Proteinfaltung, Stabilität gegen Missfaltung, negatives Design, missgefaltete freie Energie, Kumulantenentwicklung, Kontakthäufigkeit, Kontaktkorrelationen, korrelierte Mutationen, maximale Entropie, Klusterentwicklung der Entropie, Proteinsequenzevolution, strukturell beschränkte EvolutionGerman
URN: urn:nbn:de:tuda-tuprints-29966
Classification DDC: 500 Science and mathematics > 530 Physics
Divisions: 05 Department of Physics > Institute for condensed matter physics (2021 merged in Institute for Condensed Matter Physics) > Bio Physics
Date Deposited: 11 Jun 2012 15:24
Last Modified: 07 Dec 2012 12:05
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/2996
PPN: 386255830
Export:
Actions (login required)
View Item View Item