TU Darmstadt / ULB / tuprints

Reflective Embedding of Domain-Specific Languages

Dinkelaker, Tom :
Reflective Embedding of Domain-Specific Languages.
TU-Prints, Darmstadt, Deutschland
[Ph.D. Thesis], (2011)

[img]
Preview
Reflective Embedding of Domain-Specific Languages - PDF (Portable Document Format Datei)
dinkelaker-thesis-final.pdf
Available under Simple publication rights for ULB.

Download (2403Kb) | Preview
Item Type: Ph.D. Thesis
Title: Reflective Embedding of Domain-Specific Languages
Language: English
Abstract:

In the recent years, there is an increasing interest for new programming languages that are special for certain problem domains – so-called domain-specific languages. A domain-specific language (DSL) provides a syntax and semantics for a particular class of problems. When writing code in a DSL, its concrete syntax enables higher end-user productivity because the syntax is closer to the problem domain than the syntax of a general-purpose language (GPL). However, implementing a new programming language is expensive, because language developers need to design and develop a new syntax and semantics. Because of these high initial costs, stakeholders desist from implementing a new DSL from scratch.

To lower the initial costs of developing a DSL, there is the idea to embed a language into an existing language. The existing language—often a general-purpose language—acts as a host language for the guest language that is embedded into the host as a library. Such an embedded language reuses the general-purpose features of the host language. Consequently, this reduces the development costs of the embedded language by reusing these features and by reusing the existing host language infrastructure, i.e., its development tools, parser, compiler, and/or virtual machine. Furthermore, new language features can be incrementally added to the embedded language by “simply” extending its library. Indeed, there is a comparative study that shows that embedding requires significant lower investments to implement a new language compared to traditional non-embedded approaches.

However, existing language embedding approaches have several important limitations w.r.t. the features that are usually supported by non-embedded approaches. First and foremost, most embedding approaches and host languages lack support for designing a concrete syntax for an embedded language. Second, current approaches do not allow embedding special language semantics that the embedded language needs but that conflict the host semantics. Third, there is no support for embedding multiple languages that have interactions in their syntax and semantics. The lack of support for these features in current embedding approaches mostly stem from their restrictions to adapt constructs in embedded languages and host languages.

To address these limitations, this thesis proposes the reflective embedding architecture that embeds languages into reflective host languages. A reflective language is a special programming language with support for reflection that enables programs to reason about their structure and behavior. Specifically, there is support for introspection that allows analyzing programs, and support for intercession that allows transforming programs. Using reflection helps overcoming current limitations of language embedding, since it enables evolution of embedded languages by analyzing and transforming their libraries.

The reflective embedding architecture itself defines a process how to embed a language’s syntax and semantics as a set of artifacts. Every language is an encapsulated component that has a set of well-defined interfaces. The classes of the embedding implement these interfaces to define the details of the execution semantics for that language component. In addition, the architecture enables embedding of language compositions, scoping strategies, domain-specific analyses and transformations. What is special in the architecture is that every language component implicitly has a meta level. When necessary, the language developers can use this meta level to evolve embeddings, which enables a number of benefits.

First, in contrast to other embedded approaches, the reflective embedding architecture enables support for concrete syntax for embedded languages without high initial syntax costs. For an embedded language, developers can annotate its library with meta data for rewriting DSL programs in concrete syntax into a corresponding executable form. By using a special technique for agile grammar specification, called island grammars, developers only need to specify those parts of the embedded language’s grammar that deviate from the grammar of the host language. Island grammars help significantly reducing the initial syntax costs, while supporting the full class of context-free grammars.

Second, the meta level enables support for composition of languages with interactions in their syntax and semantics. On the one hand, the architecture provides special language combiners that analyze and compose the syntax of all embedded languages in a composition. On the other hand, there are language combiners that transform embedded languages so that they can interact at well-defined points in their evaluation logic. By allowing interacting compositions, the architecture enables embedding special language abstractions that facilitate end user programmers to implement more modular programs.

Third, the meta level enables embedding languages that interact with their host languages. The meta level uses reflective features to interact with the evaluation of host language constructs in order to change the host’s semantics. Only when the host semantics can be changed, developers can embed sophisticated DSLs.

To review the reflective embedding architecture, this thesis conducts a qualitative and quantitative evaluation of the proposed concepts. First, to qualitatively evaluate the concepts of this thesis, the evaluation reviews the support of the reflective embedding architecture for supporting a set of desirable properties and compares its support to related work. Second, to quantitatively evaluate the concepts, the evaluation compares to embedded and non-embedded approaches using benchmarks. The results show that the architecture’s flexibility only comes with moderately increased runtime costs.

Alternative Abstract:
Alternative AbstractLanguage
In den letzten Jahren gibt es ein zunehmendes Interesse an neuen Programmiersprachen, die auf bestimmte Problemdomänen spezialisiert sind, so genannte domänenspezifische Sprachen (engl. domain-specific languages, DSLs). DSLs stellen eine spezielle Syntax und Semantik zur Lösung einer bestimmten Klasse von Problemen zur Verfügung. Wenn Programme mit einer DSL entwickelt werden, erlaubt ihre konkrete Syntax eine höhere Produktivität des Endanwenders, da ihre Syntax näher an der Problemdomäne ist als die Syntax einer allgemeinen Sprache (engl. general-purpose language, GPL). Jedoch ist die Implementierung einer neuen Programmiersprache kostenintensiv, da Sprachentwickler eine Syntax und Semantik entwerfen und umsetzen müssen. Wegen dieser hohen initialen Kosten sehen viele davon ab eine neue DSL zu implementieren und einzusetzen. Um die initialen Kosten für DSLs zu minimieren, gibt es den Ansatz eine DSL in eine vorhandene Sprache einzubetten. Dabei wird die Syntax und Semantik der eingebetteten Sprache in Form einer Bibliothek in dieser Sprache beschrieben. Die vorhandene Sprache fungiert dabei als eine Wirtssprache für die DSL, die als Gastsprache in die Wirtssprache eingebettet wird. Durch die Einbettung können Gastsprachen die allgemeinen Sprachkonstrukte der Wirtssprache wieder verwenden, was Entwicklungskosten einspart. Zusätzlich erlaubt die Einbettung die Wiederverwendung der bestehenden Sprachinfrastruktur, wie z.B. den Entwicklungswerkzeugen, dem Parser, dem Compiler und der virtuellen Laufzeitumgebung. Neue Sprachkonstrukte können bei Bedarf durch Erweiterungen der entsprechenden Bibliotheken hinzugefügt werden. Eine vergleichende Studie zeigt, dass durch Einbettung die Entwicklungskosten für die Implementierung neuer Sprachen, im Vergleich zu traditionellen nicht eingebetten Sprachentwicklungsansätzen, signifikant reduziert werden können. Trotz dieser Vorteile gibt es für bestehende Ansätze zur Spracheneinbettung wichtige Einschränkungen bezüglich der Unterstützung für Spracheigenschaften, die normalerweise von nicht eingebetten Ansätzen unterstützt werden. In erster Linie gibt es bei bestehenden Ansätzen zur Einbettung in den meisten verwendeten Wirtssprachen keine Unterstützung für die freie Gestaltung der konkreten Syntax für die eingebettete Gastsprache. Beim Einbetten der Gastsprache in die Wirtssprache müssen die Ausdrücke der Gastsprache mit der Syntax der Wirtssprache übereinstimmen. Zweitens ist die Sprachsemantik, die eine Gastsprache haben kann, durch die vorgegebene Sprachsemantik der Wirtssprache eingeschränkt. Drittens gibt es keine Unterstützung für spezielle Kompositionen von mehreren DSLs, die Interaktionen in ihrer Syntax und Semantik haben. Diese Einschränkungen sind vorallem auf die mangelnde Anpassbarkeit von Konstrukten in eingebetteten Sprachen und Hostsprachen zurückzuführen. Um diese Probleme anzugehen, schlägt die vorliegende Arbeit die Reflective Embedding Architecture vor, die es ermöglicht Gastsprachen in reflexive Wirtssprachen einzubetten. Reflexive Sprachen sind Programmiersprachen, die spezielle Sprachkonstrukte besitzen, um die Struktur und das Verhalten von Programmen während ihrer Auswertung zu verändern. Die Verwendung einer reflexiven Sprache ermöglicht es die obigen Einschränkungen zu überwinden, da eingebettete Sprachen durch Analyse und Transformation ihrer Sprachbibliotheken angepasst werden können. Die Reflective Embedding Architecture definiert eine neue Vorgehensweise zum Einbetten von DSLs und beschreibt wie man für eine neue DSL die Syntax und Semantik als eine Menge von Artefakten einbetten kann. Jede Sprache ist eine eingekapselte Komponente, die eine Menge von wohldefinierter Schnittstellen festlegt. Die Klassen der Einbettung realisieren diese Schnittstellen, um die Einzelheiten der Ausführungssemantik für die Sprachkomponente festzulegen. Weiterhin unterstützt die Architektur das Einbetten von Sprachkompositionen, Scoping-Strategien, domänenspezifischen Analysen und Transformationen. Das Besondere an der Architektur zur Einbettung ist, dass jede Sprache automatisch eine Meta-Ebene besitzt, die Entwickler benutzen können, um die Einbettung anzupassen. Anpassungen auf der Meta-Ebene haben folgende Vorteile: Erstens ermöglicht die Reflective Embedding Architecture die Unterstützung von konkreter Syntax für eingebettete Sprachen. Für jede eingebettete Sprache können die Entwickler die zugehörige Bibliothek mit Annotationen versehen, um Meta-Daten für das Umwandeln von DSL Programmen mit konkreter Syntax in eine entsprechende ausführbare Form zu beschreiben. Durch die Verwendung einer speziellen Form von Agilen Grammatiken, die Insel-Grammatiken genannt werden, müssen nur die Teile der eingebetteten Sprache in einer Grammatik spezifiziert werden, die tatsächlich von der Grammatik der Wirtssprache abweichen. Insel-Grammatiken helfen dabei die initialen Kosten signifikant im Vergleich zu anderen eingebetteten Ansätzen zu reduzieren, wobei die volle Unterstützung für kontextfreie Sprachen gewährleistet bleibt. Zweitens ermöglicht die Meta-Ebene Unterstützung für Sprachkompositionen, deren Teilsprachen Interaktionen in ihrer Syntax und Semantik haben. Auf der einen Seite ermöglicht es die Meta-Ebene die Syntax mehrerer Teilsprachen zu analysieren und zu einer zusammengesetzten Sprachsyntax zu komponieren. Auf der anderen Seite ist es ermöglicht die eingebetteten Teilsprachen so anzupassen, dass sie an wohl definierten Punkten innerhalb ihrer Auswertungslogik miteinander interagieren können. In dem Sprachkompositionen mit Interaktionen unterstützt werden, ermöglicht die Architektur die Einbettung von speziellen Sprachabstraktionen, die es dem Endanwender erleichtern, modulare Programme zu entwickeln. Drittens ermöglicht die Meta-Ebene das Einbetten von Sprachen, die mit ihrer Wirtssprache interagieren, in dem sie reflexive Mechanismen verwenden, um die Auswertung der Sprachkonstrukte des Wirts zu beeinflussen. Nur wenn die Auswertung von Konstrukte der Wirtssprache geändert werden kann, können DSLs mit speziellen Modularisierungskonzepten eingebettet werden. Zur Evaluation der Reflective Embedding Architecture werden die in dieser Arbeit vorgeschlagenenKonzepte qualitativ und quantitativ überprüft. Zum einen wird eine Bewertung für die Unterstützung der Reflective Embedding Architecture für wünschenswerte Spracheigenschaften erstellt und mit verwandten Arbeiten verglichen, um die Konzepte qualitativ zu bewerten. Zum anderen wird eine Sprachimplementierung auf Basis der Reflective Embedding Architecture mit Implementierungen der selben Sprache quantitativ verglichen, die auf eingebetteten Ansätze und nicht eingebetten Ansätze aus den verwandten Arbeiten basieren. Die Evaluation zeigt im Vergleich, dass die Reflective Embedding Architecture für einbettete Sprachen erstmals eine umfassende Unterstützung der wünschenswerten Eigenschaften für eingebettete Sprachen ermöglicht und dass es dabei lediglich zu moderat erhöhten Laufzeitkosten kommt.German
Place of Publication: Darmstadt, Deutschland
Publisher: TU-Prints
Collation: 333 S.
Uncontrolled Keywords: Eingebettete Domänenspezifische Sprachen, Interne DSLs, Meta-Object Protokolle, Aspektorientierte Programmierung, Domänenspezifische Sprachen, Reflexive Programmierung, Meta-Level Architekturen, Sprachimplementierung
Alternative keywords:
Alternative keywordsLanguage
Domain-Specific Languages; Concrete Syntax; Embedded Language; Reflective Embedding Architecture; Program Transformation; Program Analysis; Language Composition; Island Grammars; Context-Free Grammars; Interaction; Syntax Conflicts; Semantic Conflicts; Reflection; Reflective Domain-Specific Languages; DSL Benchmark; Aspect-Oriented Programming; Meta-Level Architectures; Language ImplementationEnglish
Domänenspezifische Sprachen; Konkrete Syntax; Eingebettete Sprachen; Reflective Embedding Architecture; Programmtransformationen; Programmanalyse; Sprachkomposition; Insel-Grammatiken; Kontextfreie Sprachen; Interaktionen; Syntaktische Konflikte; Semantische Konflikte; Reflexion; Reflexive Domänenspezifische Sprachen; DSL Benchmark; Aspektorientierte Programmierung; Meta-Level Architekturen; SprachimplementierungGerman
Classification DDC: 000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik
Divisions: Fachbereich Informatik
Fachbereich Informatik > Softwaretechnik
Date Deposited: 06 Dec 2011 09:56
Last Modified: 07 Dec 2012 12:02
URN: urn:nbn:de:tuda-tuprints-28133
License: Simple publication rights for ULB
Referees: Mezini, Prof. Dr.- Mira and Hirschfeld, Prof. Dr.- Robert
Refereed: 10 December 2010
URI: http://tuprints.ulb.tu-darmstadt.de/id/eprint/2813
Export:

Actions (login required)

View Item View Item