Modellierung und Vorhersage von Strukturen biomolekularer Assoziate auf der Basis von statistischen Datenbankanalysen

Keil, Matthias (2002)
Modellierung und Vorhersage von Strukturen biomolekularer Assoziate auf der Basis von statistischen Datenbankanalysen.
Technische Universität Darmstadt
Ph.D. Thesis, Primary publication

Preview

PDF
dissertation_keil.pdf
Copyright Information: In Copyright.
Download (2MB) | Preview

Item Type:

Ph.D. Thesis

Type of entry:

Primary publication

Title:

Modellierung und Vorhersage von Strukturen biomolekularer Assoziate auf der Basis von statistischen Datenbankanalysen

Language:

German

Referees:

Brickmann, Prof. Dr. Jürgen ; Gasteiger, Prof. Dr. Johann ; Lindner, Prof. Dr. Hans Jörg

Advisors:

Brickmann, Prof. Dr. Jürgen

Date:

11 June 2002

Place of Publication:

Darmstadt

Date of oral examination:

29 April 2002

Abstract:

Proteine sind aus einfachen chemischen Bausteinen aufgebaut, trotzdem nehmen sie teilweise hochkomplexe biologische Aufgaben, wie z.B. die Katalyse von biochemischen Prozessen, wahr. Diese biologischen Funktionen sind eng mit der dreidimensionalen Struktur und der Fähigkeit zur Komplexbildung mit anderen Molekülen verbunden. In den letzten Jahren wurden die Strukturen von mehreren tausend Proteinen und Proteinkomplexen aufgeklärt und in der öffentlich zugänglichen Protein Data Bank gespeichert. Diese Strukturen können für die Untersuchung der Bindungseigenschaften von Proteinkomplexen verwendet werden. Bei vielen Proteine sind jedoch die Bindungsbereiche und mögliche Bindungspartner nicht bekannt, so daß Methoden zur automatisierten Erkennung von möglichen Bindungsstellen, d.h. aktiven Zentren, bei der gezielten Entwicklung von Wirkstoffen wertvolle Dienste leisten können. Vor diesem Hintergrund wurde die in dieser Arbeit vorgestellte computergestützte Methode zur Vorhersage der Bindungsregionen von Proteinkomplexen entwickelt. Dazu wurden zuerst die in der Protein Data Bank enthaltenen Strukturen mit theoretischen Methoden untersucht. Dies erforderte die Entwicklung eines automatisierten Verfahrens zur Bearbeitung der über 10000 Proteinstrukturen, das sich auf das Konzept der molekularen Oberflächen stützt. Dabei wurden molekulare Eigenschaften (z.B. elektrostatisches Potential, lokale Lipophilie) berechnet und auf die molekularen Oberflächen der Proteine projiziert. Anschließend wurde die Verteilung der Eigenschaftswerte in den verschiedenen Bereichen der Oberfläche analysiert, wobei besonderes Gewicht auf der Untersuchung der bekannten Bindungsbereiche der Proteinoberfläche zu anderen Molekülen gelegt wurde. Die Ergebnisse dieser Untersuchungen wurden anschließend zum Training eines neuronalen Netzwerkes verwendet, das durch eine Mustererkennung der auf die Oberflächen projizierten Eigenschaften eine Vorhersage von Bindungsbereichen auf Proteinoberflächen ermöglicht. Das neuronale Netzwerk war nach Abschluß des Lernverfahrens in der Lage, die durch die obigen Untersuchungen bekannten Bindungsstellen aller untersuchten Proteinkomplexe zufriedenstellend zu identifizieren und als Protein-, DNA- oder Ligandbindungsbereiche zu klassifizieren. An einigen Beispielen wurde weiterhin gezeigt, daß das neuronale Netzwerk auch in der Lage ist mögliche Bindungsstellen von nicht im Trainingssatz enthaltenen Proteinen vorherzusagen.

Alternative Abstract:

Alternative Abstract

Language

Proteins consist of simple building units, but are involved in some very complex biological functions, like the catalysis of many biochemical processes. These biological functions are determined by three dimensional structure and by the ability to bind to various other molecules. Over recent years the structures of thousands of proteins and protein complexes were experimentally solved and stored in the public protein data bank. These structures can be used as the basis for the analysis of binding properties of protein complexes. Because the binding sites and complex partners of many proteins are not known, theoretical methods for the detection of possible binding sites can be very helpful in rational drug design. In this thesis, a new method to predict protein binding sites is described. All protein structures (over 10000) in the protein database were analyzed by a novel automated procedure. This analysis was based on the concept of molecular surfaces. Molecular properties (e.g. electrostatic potential, local lipophilicity) were calculated and projected onto the molecular surfaces of the proteins. The distribution of the properties was studied in various regions of the molecular surface and special attention was put into the analysis of the binding regions. With the results of these investigations a neural network was trained, which allowed the identification of binding sites by pattern recognition of the surface properties. After completion of the training phase, the neural network was capable of satisfactorily predicting the binding sites of all examined protein complexes and classifying them as protein, DNA, or ligand binding sites. Additionally it was shown with several representative protein complexes, that the neural network was capable of predicting possible binding sites of proteins, which were not in the training set and therefore unknown to the neural network.

English

URN:

urn:nbn:de:tuda-tuprints-2182

Classification DDC:

500 Science and mathematics > 540 Chemistry

Divisions:

07 Department of Chemistry

Date Deposited:

17 Oct 2008 09:21

Last Modified:

08 Jul 2020 22:43

URI: