TU Darmstadt / ULB / TUprints

Engineering Proteins by Domain Insertion

Mathony, Jan (2023)
Engineering Proteins by Domain Insertion.
Technische Universität Darmstadt
doi: 10.26083/tuprints-00023638
Ph.D. Thesis, Primary publication, Publisher's Version

[img] Text
Dissertation.mathony.pdf
Copyright Information: CC BY-SA 4.0 International - Creative Commons, Attribution ShareAlike.

Download (7MB)
Item Type: Ph.D. Thesis
Type of entry: Primary publication
Title: Engineering Proteins by Domain Insertion
Language: English
Referees: Niopek, Prof. Dr. Dominik ; Süß, Prof. Dr. Beatrix
Date: 2023
Place of Publication: Darmstadt
Collation: xviii, 167 Seiten
Date of oral examination: 23 March 2023
DOI: 10.26083/tuprints-00023638
Abstract:

Protein domains are structural and functional subunits of proteins. The recombination of existing domains is a source of evolutionary innovation, as it can result in new protein features and functions. Inspired by nature, protein engineering commonly uses domain recombination in order to create artificial proteins with tailor-made properties. Customized control over protein activity, for instance, can be achieved by harnessing switchable domains and functionally linking them to effector domains. Many natural protein domains exhibit conformational changes in response to exogenous triggers. The insertion of light-switchable receptor domains into an effector protein of choice, for instance, allows the control of effector activity with light. The resulting optogenetic proteins represent powerful tools for the investigation of dynamic cellular processes with high precision in time and space. On top, optogenetic proteins enable manifold biotechnological applications and they are even considered potential candidates for future therapeutics. In this study, we first focused on CRISPR-Cas9 genome editing and applied a domain insertion strategy to genetically encoded inhibitors of the CRISPR nuclease from Neisseria meningitidis (NmeCas9), which due to its small size and high DNA sequence-specificity is of great interest for CRISPR genome editing applications. Fusing stabilizing domains to the NmeCas9 inhibitory protein AcrIIC1 allowed us to boost its inhibitory effect, thereby yielding a potent gene editing off-switch. Furthermore, the insertion of the light-responsive LOV2 domain from Avena sativa into AcrIIC3, the most potent inhibitor of NmeCas9, enabled the optogenetic control of gene editing via light-dependent NmeCas9 inhibition. Further investigation of the engineered inhibitors revealed the potential these proteins could have with respect to safe-guarding of the CRISPR technology by selectively reducing off-target editing. The laborious optimization of the engineered CRISPR inhibitors necessary by the time motivated us to more systematically investigate possibilities and constraints of protein engineering by domain insertion using an unbiased insertion approach. Previously, single protein domains were usually introduced only at a few rationally selected sites into target proteins. Here, we inserted up to five structurally and functionally unrelated domains into several different candidate effector proteins at all possible positions. The resulting libraries of protein hybrids were screened for activity by fluorescence-activated cell sorting (FACS) and subsequent next-generation sequencing (Flow-seq). Training machine learning models on the resulting, comprehensive datasets allowed us to dissect parameters that affect domain insertion tolerance and revealed that sequence conservation statistics are the most powerful predictors for domain insertion success. Finally, extending our experimental Flow-seq pipeline towards the screening of engineered, switchable effector variants yielded two potent optogenetic derivatives of the E. coli transcription factor AraC. These novel hybrids will enable the co-regulation of bacterial gene expression by light and chemicals. Taken together, our study showcases the design of functionally diverse protein switches for the control of gene editing and gene expression in mammalian cells and E. coli, respectively. In addition, the generation of a large domain insertion datasets enabled - for the first time - the unbiased investigation of domain insertion tolerance in several evolutionary unrelated proteins. Our study showcases the manifold opportunities and remaining challenges behind the engineering of proteins with new properties and functionalities by domain recombination.

Alternative Abstract:
Alternative AbstractLanguage

Domänen sind die strukturellen und funktionalen Untereinheiten von Proteinen. Die Rekombination bestehender Domänen dient als Quelle evolutionärer Innovationen, die neue Proteinfunktionen und -eigenschaften ermöglichen kann. Inspiriert von der Natur nutzt das Protein Engineering häufig die Domänenrekombination, um künstliche Proteine mit maßgeschneiderten Eigenschaften herzustellen. Die Kontrolle über Proteinaktivität kann beispielsweise erreicht werden, indem schaltbare Domänen genutzt und funktionell mit Effektordomänen verknüpft werden. Viele natürliche Proteindomänen zeigen Konformationsänderungen als Reaktion auf exogene Auslöser. Die Insertion licht-schaltbarer Rezeptordomänen in ein beliebiges Effektorprotein ermöglicht beispielsweise die Kontrolle der Effektoraktivität mit Licht. Die resultierenden optogenetischen Proteine sind leistungsstarke Werkzeuge zur Untersuchung dynamischer zellulärer Prozesse mit hoher zeitlicher und räumlicher Präzision. Darüber hinaus ermöglichen optogenetische Proteine vielfältige biotechnologische Anwendungen und gelten sogar als potenzielle Kandidaten für zukünftige Therapeutika. In dieser Studie konzentrierten wir uns zunächst auf Geneditierung mittels CRISPR-Cas9 und wendeten eine Domäneninsertionsstrategie auf genetisch codierte Inhibitoren der CRISPR-Cas9-Nuklease aus Neisseria meningitidis (NmeCas9) an. Diese Nuklease ist aufgrund ihrer geringen Größe und hohen DNA-Sequenzspezifität von großem Interesse für Anwendungen der CRISPR-Genomeditierung. Durch die Fusion stabilisierender Domänen mit dem NmeCas9 Inhibitorprotein AcrIIC1 konnten wir dessen suppressive Wirkung verstärken und so einen effektiven Ausschalter für die Geneditierung herstellen. Darüber hinaus ermöglichte die Insertion der lichtempfindlichen LOV2-Domäne von Avena sativa in AcrIIC3, den wirksamsten NmeCas9 Inhibitor, die optogenetische Kontrolle der Geneditierung durch lichtgesteuerte NmeCas9-Hemmung. Weitere Untersuchungen der konstruierten Inhibitoren unterstrichen das Potenzial, das diese Proteine in Bezug auf die Absicherung der CRISPR-Technologie haben könnten, indem sie die Off-Target-Veränderung von DNA selektiv reduzieren. Die mühsame Optimierung der konstruierten CRISPR-Inhibitoren, die zur damaligen Zeit notwendig war, motivierte uns, Potenzial und Limitationen des Protein-Engineerings durch Domäneninsertion unter Verwendung eines randomisierten Insertionsansatzes systematischer zu untersuchen. Früher wurden einzelne Proteindomänen normalerweise nur an wenigen bewusst ausgewählten Stellen in Zielproteine eingeführt. In dieser Studie dagegen, fügten wir bis zu fünf strukturell und funktionell nicht verwandte Domänen an allen möglichen Positionen in verschiedene Kandidatenproteine ein. Die resultierenden Bibliotheken von Proteinhybriden wurden durch fluoreszenzaktivierte Zellsortierung (FACS) und anschließende Next-Generation-Sequenzierung (Flow-seq) auf Aktivität gescreent. Das Trainieren von Machine Learning Modellen auf Grundlage der den resultierenden, umfassenden Datensätzen ermöglichte es uns, Parameter zu analysieren, die sich auf die Insertionstoleranz der Proteine auswirken. Es zeigte sich, dass Parameter der Sequenzkonservierung die besten Prädiktoren für den Erfolg von Domain-Insertionen sind. Schließlich führte die Erweiterung unserer experimentellen Flow-seq-Pipeline für das Screening von engineerten, schaltbaren Effektorvarianten zu zwei potenten optogenetischen Versionen des E. coli-Transkriptionsfaktors AraC. Diese neuartigen Hybride werden die Co-Regulierung der bakteriellen Genexpression durch Licht und Chemikalien ermöglichen. Zusammenfassend zeigt unsere Studie das Design von funktionell unterschiedlichen Proteinschaltern für die Kontrolle der Geneditierung und Genexpression in Säugetierzellen bzw. E. coli. Darüber hinaus ermöglichte die Erstellung eines großen Domäneninsertionsdatensatzes erstmals die unvoreingenommene Untersuchung der Insertionstoleranz in mehreren evolutionär nicht verwandten Proteinen. Unsere Studie zeigt die vielfältigen Chancen und verbleibenden Herausforderungen hinter dem Engineering von Proteinen mit neuen Eigenschaften und Funktionalitäten durch Domänenrekombination.

German
Status: Publisher's Version
URN: urn:nbn:de:tuda-tuprints-236381
Classification DDC: 500 Science and mathematics > 570 Life sciences, biology
Divisions: Interdisziplinäre Forschungsprojekte > Centre for Synthetic Biology
Date Deposited: 04 Apr 2023 12:56
Last Modified: 06 Apr 2023 06:05
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/23638
PPN: 506585727
Export:
Actions (login required)
View Item View Item