TU Darmstadt / ULB / TUprints

Combining Simulation and Machine Learning for Materials Optimization: Polymer Compatibilization, Disinfection, and Heat Transfer

Zhou, Tianhang (2022):
Combining Simulation and Machine Learning for Materials Optimization: Polymer Compatibilization, Disinfection, and Heat Transfer. (Publisher's Version)
Darmstadt, Technische Universität,
DOI: 10.26083/tuprints-00021131,
[Ph.D. Thesis]

[img] Text
Available under: CC-BY-SA 4.0 International - Creative Commons, Attribution ShareAlike.

Download (45MB)
Item Type: Ph.D. Thesis
Status: Publisher's Version
Title: Combining Simulation and Machine Learning for Materials Optimization: Polymer Compatibilization, Disinfection, and Heat Transfer
Language: English

In the last half-century, considerable advances have been achieved in molecular simulation techniques aiming at offering a comprehensive understanding of the structure-property relationship of soft materials on several time and length scales. So far, however, the optimal design of candidates for the next-generation soft materials is still a challenging task due to the enormous chemical and configurational space. The machine learning (ML) techniques, which are utilized to extract actionable insights from big data generated from simulations, can overcome the bottlenecks in the tasks of soft materials optimization. Hence, this thesis has developed a framework based on the mutual communication between multiscale simulations (atomistic and coarse-grained) and ML toward rational investigations of soft matter. One objective of this thesis is to evaluate the detailed structure-composition-property-performance rela- tionships of soft materials in a forward way. We firstly investigate the compatibilizing performance of block copolymers (i.e., linear and graft) on the interface between two incompatible polymer phases by dissipative- particle-dynamics (DPD) simulations. A phenomenological analytical power-law fit is developed to quantify the variation of compatibilization efficiency of linear block copolymers with the polymer chemistries, the molecular architecture, and the number of copolymer molecules. However, graft copolymers have larger diversities in the space of architectural parameters as compared to linear block copolymers, which limits the traditional empirical fitting process. Accordingly, we feed DPD results to ML models and find that the combination of DPD/ML is able to accurately predict the compatibilization efficiency of graft copolymers at the molecular level. For a given graft copolymer with several descriptors (e.g., molecular architectures and chemistries), its compatibilization efficiency can be well predicted from the trained ML models. Moreover, ML techniques provide a descriptor importance measure for the correlation between descriptors and DPD predictions. We find that as the blend changes from weakly incompatible to strongly incompatible, the number of side chains of graft copolymers gradually dominates their compatibilization efficiency while the side chain length becomes unimportant. This finding can narrow the search space in further simulations and experiments. Furthermore, we attempt to understand the compatibilization mechanism of the linear and graft copolymers by characterizing the beads distributions, the number of unlike contacts between different species, and the molecular conformations. Specifically, the relative shape anisometry of copolymers, defined as the ratio of their gyration tensor elements in directions normal and parallel to the surface, is strongly correlated with their compatibilization efficiency for both linear and graft copolymers. We also evaluate the alcohol-induced changes on coronavirus membranes of different compositions with DPD models, i.e., pure dipalmitoylphosphatidylcholine, dioleoylphosphatidylcholine, and dimyristoylphos- phatidylcholine as well as their binary and ternary mixed membranes. The principal finding of this study is that a maximum ethanol concentration of 32 mol % (55 wt. % ) in alcoholic-based disinfectants is sufficient to decompose any coronavirus model membranes composed of these three lipids. However, given the wide variations in compositions and structures of mixed membranes, identifying their transitions from the intact to the disrupted state is challenging. For example, we find that the transition point cannot be quantitatively predicted based on physical descriptors such as the area per lipid molecule, the membrane thickness, and the orientational order parameter. Additionally, the visual inspection of simulation profiles is cumbersome to characterize the state of these membranes. Developing a simple and robust tool to characterize the stability of membranes against ethanolic disinfectants, can therefore accelerate the optimization process of disinfection investigations. This target is achieved by the developed DPD/deep-neural-network framework in this study, which accesses the integrity of lipid membranes in place of visual inspections. The other objective of this thesis is to design materials with optimal performance on desired properties, com- positions, and structures in the reverse direction, i.e., inverse design (performance-property-composition- structure). We employ a hybrid framework by combining the genetic algorithm and the atomistic molecular dynamics simulation, to design polyethylene-polypropylene copolymers with high thermal conductivity. We find that polyethylene-polypropylene copolymers with various sequences at the same monomer ratio have a broad distribution of thermal conductivities. This indicates that the monomer sequence has a crucial effect on the thermal energy transport of the copolymers. A non-periodic and non-intuitive optimal sequence is indeed identified by this hybrid framework, which gives the highest thermal conductivity compared with both homopolymers and any regular block copolymers, e.g., diblock, triblock, and hexablock. In comparison to bulk density, chain conformations, and vibrational density of states, the monomer sequence has the strongest impact on the efficiency of the thermal energy transport via inter- and intra-molecular interactions. The success of ML, providing property predictions of materials in both large compositional and confor- mational spaces, relies on the availability of training data from simulations. In turn, ML methods allow a robust posteriori data analysis (e.g., descriptor importance measure) for exploring correlations between descriptors and target properties in simulations, which can narrow the search space of descriptors for further investigations. In short, the computational framework of integrating multiscale simulations with ML algorithms has a significant potential for accelerating the design of soft matter. We believe our work provides efficient and practical approaches to develop the advanced hybrid framework for the material optimization.

Alternative Abstract:
Alternative AbstractLanguage

Im letzten halben Jahrhundert wurden erhebliche Fortschritte bei den molekularen Simulationstechniken erzielt, die ein umfassendes Verständnis der Struktur-Eigenschafts Beziehung weicher Materialien auf verschiedenen Zeit- und Längenskalen ermöglichen. Bislang ist jedoch das optimale Design von Kandidaten für die nächste Generation weicher Materialien aufgrund des enormen chemischen und konfigurativen Raums immer noch anspruchsvoll. Die Techniken des machine learning (ML), die eingesetzt werden, um verwertbare Erkenntnisse aus großen, durch Simulationen generierten Daten zu gewinnen, können die Engpässe bei der Optimierung weicher Materialien überwinden. Daher wurde in dieser Arbeit ein Framework entwickelt, der auf der Kommunikation zwischen wechselseitigen Multiskalensimulationen (atomistic und coarse-grained) und ML zur rationalen Untersuchung weicher Materialien basiert. Ein Ziel dieser Arbeit ist es, die detaillierten Struktur-Zusammensetzungs-Eigenschafts-Leistungs Beziehungen weicher Materialien auf Vorwärtsrichtung zu bewerten. Zunächst wird die Kompatibilitätsleistung von Blockcopolymeren (d.h. lineare und Pfropfcopolymere) an der Grenzfläche zwischen zwei inkompatiblen Polymerphasen mit Hilfe von dissipative-particle-dynamics (DPD) Simulationen untersucht. Es wird eine phänomenologische analytische Relation entwickelt, um die Abhängigkeit der Kompatibilisierungseffizienz von linearen Blockcopolymeren von der Polymerchemie, der molekularen Architektur und der Anzahl der Copolymermoleküle zu quantifizieren. Pfropfcopolymere weisen jedoch im Vergleich zu linearen Blockcopolymeren größere Unterschiede im Raum der Architekturparameter auf, was den traditionellen empirischen Anpassungsprozess einschränkt. Dementsprechend füttern wir DPD-Ergebnisse mit ML-Modellen und stellen fest, dass die Kombination von DPD und ML in der Lage ist, die Kompatibilisierungseffizienz von Pfropfcopolymeren auf molekularer Ebene genau vorherzusagen. Für ein gegebenes Pfropfcopolymer mit mehreren Deskriptoren (z. B. molekulare Architekturen und chemische Eigenschaften) kann die Kompatibilisierungseffizienz anhand der trainierten ML-Modelle gut vorhergesagt werden. Darüber hinaus bieten ML-Techniken ein Maß für die relative Bedeutung der Deskriptoren, um die Korrelation zwischen Deskriptoren und DPD-Vorhersagen aufzuzeigen. Wir stellen fest, dass die Anzahl der Seitenketten der Pfropfcopolymere allmählich ihre Kompatibilisierungseffizienz dominiert, während die Länge der Seitenketten unwichtig wird, wenn die Mischung stark inkompatibel wird. Diese Erkenntnis kann den Suchraum in weiteren Simulationen und Experimenten eingrenzen. Darüber hinaus versuchen wir, den Kompatibilisierungsmechanismus der linearen und Pfropfcopolymere zu verstehen, indem wir die Monomerverteilungen, die Anzahl der ungleichen Kontakte zwischen verschiedenen Spezies und die molekularen Konformationen charakterisieren. Insbesondere die Anisometrie der Copolymere, definiert als das Verhältnis ihrer Gyrationstensorelemente in den Richtungen senkrecht und parallel zur Oberfläche, ist sowohl für lineare als auch für Pfropfcopolymere stark mit ihrer Kompatibilisierungseffizienz korreliert. Wir untersuchen auch die alkoholinduzierten Veränderungen an Coronavirusmembranen unterschiedlicher Zusammensetzung mit DPD-Modellen, d.h. reines Dipalmitoylphosphatidylcholin, Dioleoylphosphatidylcholin und Dimyristoylphosphatidylcholin sowie deren binäre und ternäre Mischmembranen. Die wichtigste Erkenntnis dieser Studie ist, dass eine maximale Ethanolkonzentration von 32 mol % (55 Gew.%) in alkoholischen Desinfektionsmitteln ausreicht, um alle Coronavirus-Modellmembranen, die aus diesen drei Lipiden bestehen, zu zersetzen. Angesichts der großen Unterschiede in der Zusammensetzung und Struktur gemischter Membranen ist es jedoch schwierig, ihre Übergänge vom intakten zum geschädigten Zustand zu identifizieren. Wir stellen zum Beispiel fest, dass der Übergangspunkt nicht quantitativ auf der Grundlage physikalischer Deskriptoren wie der Fläche pro Lipidmolekül, der Membrandicke und der Orientierungsparameter vorhergesagt werden kann. Außerdem ist die visuelle Prüfung der Membranintegrität in Simulationen mühsam. Die Entwicklung eines einfachen und robusten Werkzeugs zur Charakterisierung der Stabilität von Membranen gegenüber ethanolischen Desinfektionsmitteln kann daher den Optimierungsprozess von Desinfektionsuntersuchungen beschleunigen. Dieses Ziel wird durch das in dieser Studie entwickelte DPD/deep-neural-network Framework erreicht, das die Integrität von Lipidmembranen anstelle von menschlicher Beobachter erfasst. Ein weiteres Ziel dieser Arbeit ist die Entwicklung von Materialien mit optimaler Leistung in Bezug auf die gewünschten Eigenschaften, Zusammensetzungen und Strukturen in umgekehrter Richtung, d. h. inverses Design (Leistung-Eigenschaft-Zusammensetzung-Struktur). Wir setzen einen hybriden Rahmen ein, indem wir einen genetischen Algorithmus und atomistische Molekulardynamiksimulation kombinieren, um Polyethylen-Polypropylen-Copolymere mit hoher Wärmeleitfähigkeit zu entwickeln. Wir stellen fest, dass Polyethylen-Polypropylen-Copolymere mit verschiedenen Sequenzen bei gleichem Monomerverhältnis sehr unterschiedliche Wärmeleitfähigkeiten aufweisen. Dies deutet darauf hin, dass die Monomersequenz einen entscheidenden Einfluss auf den Wärmetransport der Copolymere hat. Eine nicht-periodische und nicht-intuitive optimale Sequenz wird tatsächlich durch dieses Hybridmethode identifiziert. Es weist die höchste Wärmeleitfähigkeit im Vergleich zu Homopolymeren und allen regulären Blockcopolymeren, z. B. Diblock, Triblock und Hexablock, auf. Im Vergleich zur Stoffdichte, den Kettenkonformationen und der Dichte der Schwigungszustände hat die Monomersequenz den stärksten Einfluss auf die Geschwindigket des Wärmetransports gegenüber inter- und intramolekularen Wechselwirkungen. Der Erfolg der ML-Methode, die Vorhersagen über Eigenschaften von Materialien in großen Zusammensetzungs - und Konformationsräumen ermöglicht, hängt von der Verfügbarkeit von Trainingsdaten aus Simulationen ab. ML-Methoden wiederum ermöglichen eine robuste a-posteriori-Datenanalyse (z. B. Wichtigkeit einzelner Deskriptoren) zur Erforschung von Korrelationen zwischen Deskriptoren und Zieleigenschaften in Simulationen. Dadurch kann der Suchraum von Deskriptoren für weitere Untersuchungen eingegrenzt werden. Zusammenfassend lässt sich sagen, dass die Integration von Multiskalensimulationen mit ML-Algorithmen ein erhebliches Potenzial zur Beschleunigung des Designs weicher Materie bietet. Wir glauben, dass unsere Arbeit effiziente und praktische Ansätze für die Entwicklung eines Hybridrahmens für die Materialoptimierung bietet.

Place of Publication: Darmstadt
Collation: xiii, 146 Seiten
Classification DDC: 500 Naturwissenschaften und Mathematik > 540 Chemie
Divisions: 07 Department of Chemistry > Physical Chemistry
Date Deposited: 25 Apr 2022 12:33
Last Modified: 05 Aug 2022 13:32
DOI: 10.26083/tuprints-00021131
URN: urn:nbn:de:tuda-tuprints-211319
Referees: Müller-Plathe, Prof. Florian ; Vegt, Prof. Nico van der ; Theodorou, Prof. Doros
Date of oral examination: 11 April 2022
URI: https://tuprints.ulb.tu-darmstadt.de/id/eprint/21131
PPN: 494289821
Actions (login required)
View Item View Item