Wie funktioniert ein Compiler? Mit diesem Projekt baust du dir selbst einen
Ein Compiler – oder Kompilierer – ist ein Computerprogramm, das Quellcode einer bestimmten Programmiersprache in eine Form übersetzt, die von einem Computer ausgeführt werden kann. So oder so ähnlich lautet die gängige Definition des Wortes. Was das die meisten von euch praktisch angeht? Nichts. Die Mehrheit muss sich in ihrem täglichen Job nicht damit auseinandersetzen, was ein Compiler macht. Aber: Compiler sind überall. Viele der Tools, die ihr jeden Tag verwendet, basieren auf von Compilern entlehnten Konzepten.
Compiler sind gar nicht so kompliziert
Compiler sind kompliziert? Sind sie. Das muss aber nicht unbedingt sein. In dem mit „The super tiny Compiler“ betitelten Projekt findet ihr eine detaillierte Anleitung, wie ihr euren eigenen, klitzekleinen Kompilierer bauen könnt. Mit JavaScript, eine neue Programmiersprache muss also auch keiner von euch lernen. Ganz nebenbei lernt ihr, wie ein Compiler funktioniert und was eigentlich dahintersteckt. Das Ganze ist nämlich ziemlich einfach und gar nicht so kompliziert, wie ihr vielleicht glaubt, ist Jamie Kyle, der Autor des Projekts, überzeugt.
Von Lisp zu C
Der klitzekleine Compiler, den ihr bauen werdet, kompiliert Lisp-ähnliche Funktionsaufrufe zu C-ähnlichen Funktionsaufrufen. Wer weder Lisp noch C beherrscht, muss sich davon aber nicht abschrecken lassen, für euch gibt’s im Projekt ein – zugegebenermaßen sehr – kurzes Intro dazu. Lisp und C zu lernen, ist aber auch nicht Sinn und Zweck der Übung. Um dem Tutorial zu folgen, soll es genügen, wenn ihr wisst, wie in beiden Sprachen die Syntax zur Addition und Subtraktion ganzer Zahlen lautet.
3 Schritte: Parsen, Transformieren und Code generieren
Anhand der vorgestellten – allerdings unvollständigen – Codebeispiele demonstriert Kyle die Hauptbestandteile moderner Compiler; genau diese Codebits wird euer Compiler nämlich am Ende kompilieren. Am Ende gibt es für die meisten Compiler nämlich drei Stadien: Parsen, Transformation und Code-Generation. Parsen bedeutet einfach, dass der Code zu einer abstrakteren Repräsentation seiner selbst umgewandelt wird. Im zweiten Schritt, den Kyle Transformation nennt, wird diese abstrakte Repräsentation so manipuliert, dass sie eben das macht, was der Compiler will. Im dritten Schritt, der Code-Generation, wird dieser transformierte Code in neuen Code umgewandelt, in diesem Fall zu C-ähnlichem Code. Jetzt wo ihr diese Basics verstanden habt, könnt ihr euren eigenen Compiler bauen – im Projekt auf GitHub findet ihr alles, was ihr dafür braucht.
Compiler sind wirklich nicht so schwierig zu realisieren. Den ersten habe ich mit 16 oder 17 ohne großen theoretischen Hintergrund für meinen Vater gebaut. Dieser hat mathematische Formeln in der üblichen Schreibweise in Tastenfolgen für den HP35 Taschenrechner (RPN Logik) umgesetzt. Damals noch in Turbo Pascal 1.0