Programmierregeln

Diese Seite illustriert einige der Linter-Regeln anhand von Code-Beispielen. Die Stil-Anmerkungen des Linters beinhalten neben der kurzen Beschreibung auch Informationen darüber, in welcher Datei der Verstoß gefunden wurde, und vor allem, gegen welche Regel verstoßen wurde. Im folgenden Screenshot ist der Name der Regel markiert.

Namen finden

Regeln

Bei Programmierregeln gibt es keine Kategorien wie richtig und falsch. Man kann auch gute Programme schreiben, die sich nicht an die folgenden Regeln halten. Außerdem hängt die Lesbarkeit von Programmen auch sehr von der Erfahrung der Lesenden ab. Viele dieser Regeln sorgen aber dafür, dass die Programme eine einfachere Struktur erhalten. Am Ende sollen die Regeln auch dafür sorgen, dass Programmierer*innen sich bewusst werden, dass es verschiedene Möglichkeiten gibt, ein Programm zu schreiben und man beim Programmieren reflektieren sollte, welche der Möglichkeiten am besten geeignet ist, um ein gut lesbares und wartbares Programm zu schreiben. Grundsätzlich sollte man immer Konsistenz anstreben. Das heißt, wenn es zweimal eine ähnliche Methode gibt, sollten diese auch ähnlich implementiert sein. Wenn man dagegen bei einer der Methoden eine andere Implementierung wählt, erwarten Lesende, dass dieser Unterschied einen inhaltlichen Grund hat.

FinalParameters
NoCommonCodeInIf
NoLoopBreak
PreferExpressions
ReduceScope
UseElse
UseLocalTypeInference

FinalParameters

Diese Regel prüft, dass Parameter von Methoden und Konstruktoren als final deklariert sind. Grundsätzlich können die Parameter von Methoden in Java verändert werden. Das heißt, wir können zum Beispiel die folgende Methode implementieren.

static int method(int arg) {
   arg = 23;
   ...
   return arg;
}

Das Ändern des Parameters auf einen anderen Wert kann in der restlichen Methode sehr verwirrend sein, da man normalerweise davon ausgeht, dass in der Variable arg das Argument steht, das beim Aufruf der Methode übergeben wird. Um das Verändern der Parameter zu verhindern, gibt es in einigen Java-Projekten die Konvention, dass alle Parameter als final deklariert werden müssen. Auf diese Weise erhalten wir einen Kompilierfehler, wenn wir versuchen eine Methode wie method zu verwenden.

Diese Regel wird erst in einer späteren Laboraufgabe aktiviert, um zu Beginn des Semesters den Code nicht zu überfrachten.

NoCommonCodeInIf

Wir betrachten die folgende Methode, die testet, ob eine Zahl gerade ist.

static boolean even(int i) {
    boolean result;
    if (i % 2 == 0) {
        result = true;
        return result;
    } else {
        result = false;
        return result;
    }
}

In beiden Zweigen der if-Anweisung wird am Ende der gleiche Code ausgeführt, nämlich return result. Das heißt, unabhängig davon, ob i % 2 == 0 ist oder nicht, führt unsere Methode die gleiche Anweisung aus. In diesem Fall können wir die Anweisung auch nach der if-Anweisung durchführen. Das heißt, statt die Anweisung return result in beiden Zweigen der if-Anweisung durchzuführen, führen wir die Anweisung einmal durch nachdem die if-Anweisung beendet ist. Wir erhalten damit die folgende Definition.

static boolean even(int i) {
    boolean result;
    if (i % 2 == 0) {
        result = true;
    } else {
        result = false;
    }
    return result;
}

Die gleiche Anmerkung kann auch bei einem else if auftreten. Wir betrachten die folgende Methode.

static int signum(int i) {
    int result;
    if (i == 0) {
        return 0;
    } else if (i < 0) {
        result = -1;
        return result;
    } else {
        result = 1;
        return result;
    }
}

Für diese Methode erhalten wir die Anmerkung, dass die letzten Anweisungen der beiden Zweige der if-Anweisung identisch sind. An dieser Stelle wird in beiden Zweigen die Anweisung return result durchgeführt. Wir können hier aber nicht ohne weiteres die Anweisung return result aus der if-Anweisung herausziehen, da es noch einen dritten Fall gibt. Um bei diesem Beispiel eine Umformung vorzunehmen, müssen wir das else if zuerst in zwei geschachtelte if-Anweisungen umformen. Wir erhalten dadurch die folgende Definition.

static int signum(int i) {
    int result;
    if (i == 0) {
        return 0;
    } else {
        if (i < 0) {
            result = -1;
            return result;
        } else {
            result = 1;
            return result;
        }
    }
}

In dieser Variante können wir nun die Anweisung return result aus der inneren if-Anweisung herausziehen und erhalten die folgende Definition.

static int signum(int i) {
    int result;
    if (i == 0) {
        return 0;
    } else {
        if (i < 0) {
            result = -1;
        } else {
            result = 1;
        }
        return result;
    }
}

NoLoopBreak

Diese Regel verbietet die Verwendung von return und break zum Beenden einer Schleife. Hier soll kurz dargestellt werden, warum diese Konstrukte verboten werden. Dazu betrachten wir eine Methode, die in einem Array einen Wert sucht. Wir starten mit einer Implementierung, die return nutzt.

static boolean contains1(int[] array, int v) {
    for (int i = 0; i < array.length; i++) {
        if (array[i] == v) {
            return true;
        }
    }
    return false;
}

Die Verwendung von return sorgt dafür, dass man eine Code-Zeile nicht mehr getrennt betrachten kann, sondern immer den Kontext benötigt, in dem sie verwendet wird. Wenn man ein Programm der folgenden Form liest, wobei stmt eine beliebige Anweisung ist, würde man erwarten, dass dieses Programm stmt ausführt und dann false zurückliefert.

stmt
return false;

Dies ist in der Methode contains1 aber nicht der Fall. Die Anweisung return false wird hier nur ausgeführt, falls die Schleife nicht zuvor die Methode verlassen hat. Anders ausgedrückt wird der Code, der ggf. nach einer Schleife folgt, nicht immer ausgeführt. Diese Eigenschaft ist relativ fehleranfällig, da man sie nur an dem return, das irgendwo in der Schleife vorkommt, identifizieren kann.

Aus dieser Argumentation folgt, dass die folgende Implementierung in einer imperativen Sprache zu bevorzugen ist.

static boolean contains2(int[] array, int v) {
    var found = false;
    for (int i = 0; i < array.length; i++) {
        if (array[i] == v) {
            found = true;
            break;
        }
    }
    return found;
}

Nehmen wir zum Beispiel einmal an, wir wollen ein Refactoring durchführen und die Methode zu einer Methode notContains abändern. In der Variante contains2 reicht es aus, die Zeile return found durch return !found zu ersetzen. Bei der Variante contains1 reicht es aber keineswegs aus, die Zeile return false durch return true zu ersetzen, wie man in einer komplexen Methode vielleicht erwarten würde.

Um die Variante mit break zu implementieren, benötigt man eine zusätzliche boolesche Variable, die das Ergebnis der Schleife an die Anweisung nach der Schleife weiterreicht. Da wir diese Variable in der verbesserten Variante auf jeden Fall benötigen, können wir auch gleich die folgende Implementierung nutzen.

static boolean contains3(int[] array, int v) {
    var found = false;
    for (int i = 0; i < array.length && !found; i++) {
        if (array[i] == v) {
            found = true;
        }
    }
    return found;
}

Bei dieser Implementierung sehen wir in der Schleifenbedingung bereits, wann die Schleife beendet wird. Das heißt, wir müssen nicht mehr in den Code des Schleifenrumpfes schauen, wann die Schleife abbricht, sondern können diese Information an der Stelle ablesen, an der wir sie auch erwarten würden, im Schleifenkopf.

Ggf. kommt an dieser Stelle der Einwand, dass das Verlassen einer Schleife mittels return und break in einer imperativen Sprache sehr natürlich ist. Um zu illustrieren, dass das Verlassen einer Schleife mittels return oder break nicht per se natürlich ist, betrachten wir eine Variante der Methode, die diesen Ansatz auf die Spitze treibt.

static boolean contains4(int[] array, int v) {
   for (int i = 0;; i++) {
      if (i >= array.length) {
         return false;
      }
      if (array[i] == v) {
         return true;
      }
    }
    return false;
}

Hier wird die Abbruchbedingung der Schleife gar nicht mehr im Schleifenkopf definiert sondern lediglich im Code des Rumpfes. Bei dieser Variante muss man bei komplexeren Methoden ggf. viel Code danach überprüfen, ob ein return verwendet wird, um den restlichen Code zu verstehen. Dieses Beispiel soll illustrieren, dass es durchaus einen Mehrwert hat, die Bedingung, bei der eine Schleife beendet wird, in den Schleifenkopf zu schreiben.

PreferExpressions

Bei der Programmierung in einer imperativen Programmiersprache hat man häufig die Wahl zwischen einem Programmierstil, der eher anweisungsorientiert ist und einem Stil, der eher ausdrucksorientiert ist. Diese Regel soll dafür sorgen, dass in bestimmten Fällen der ausdrucksorientierte Stil verwendet wird. Wir betrachten dazu die folgende Java-Methode.

static int addAndInc(int arg1, int arg2) {
    var result = 0;
    result = result + arg1;
    result = result + arg2;
    result++;
    return result;
}

Diese Methode addiert zwei Zahlen und erhöht das Ergebnis am Ende noch um 1. Während diese Implementierung das gewünschte Ergebnis berechnet, ist sie durch die Verwendung von Anweisungen unnötig kompliziert. Die gleiche Methode kann durch die Verwendung von Ausdrücken auch wie folgt implementiert werden.

static int addAndInc(int arg1, int arg2) {
    return arg1 + arg2 + 1;
}

Die Regel PreferExpressions sorgt dafür, dass diese ausdrucksorientierte Variante verwendet wird.

ReduceScope

Mit dem englischen Begriff Scope bezeichnet man den Bereich, in dem eine Variable sichtbar ist. In dem Bereich, in dem eine Variable sichtbar ist, kann sie grundsätzlich gelesen und geschrieben werden. Man sollte den Bereich, in dem eine Variable sichtbar ist, möglichst klein halten. Das verhindert, dass die Variable aus Versehen gelesen oder geschrieben wird. Daher sollte eine Variable erst in dem Block definiert werden, in dem sie auch verwendet wird. Wir betrachten zum Beispiel die folgende Methode.

static void main(String[] args) {
    var x = 1;
    if (args.length == 0) {
        ...
    } else {
        ...
    }
    ...
}

Falls die Variable x hier nur in einem der Zweige der if-Anweisung verwendet wird, sollte die Variable auch in dem entsprechenden Zweig deklariert sein. Falls die Variable in der if-Anweisung gar nicht verwendet wird, sollte die Variable erst nach der if-Anweisung deklariert sein. In beiden Fällen verkleinern wir den Bereich, in dem die Variable sichtbar ist.

In einer if-Anweisung, die ein else if nutzt, kann die Anmerkung etwas verwirrend sein. Wir betrachten einmal das folgende Beispiel.

static void main(String[] args) {
    var x = 1;
    if (args.length == 0) {
        ...
    } else if (arg.length == 1) {
        return x;
    } else {
        return x + 1;
    }
    ...
}

Hier erhalten wir eine Anmerkung, dass wir den Scope von x reduzieren können, da die Variable x in den Fällen arg.length == 1 und im else-Fall verwendet wird, die Variable wird aber nicht im Fall args.length == 0 verwendet. Es stellt sich bei diesem Beispiel allerdings die Frage, wie wir die Deklaration der Variable x nur in diesen beiden Fälle sichtbar machen. Um diese Anmerkung umzusetzen, muss man wissen, dass die else if-Konstruktion nur eine Kurzform von zwei geschachtelten if-Anweisungen ist. Wir können die obige Methode auch wie folgt definieren.

static void main(String[] args) {
    var x = 1;
    if (args.length == 0) {
        ...
    } else {
        if (arg.length == 1) {
            return x;
        } else {
            return x + 1;
        }
    }
    ...
}

Das else if ist nur eine Kurzform, die es erlaubt, die Einrückung der zweiten if-Anweisung zu verhindern. In dieser Variante der Methode können wir jetzt einfach den Scope der Variable x verringern.

Die Tatsache, dass die Variable x gar nicht in allen Fällen verwendet wird, ist auch ein Zeichen dafür, dass die drei Fälle gar nicht auf der gleichen Ebene sein sollten. Manchmal sind zwei geschachtelte if-Anweisungen sinnvoller, da sie ausdrücken, dass zwei Bedingungen überprüft werden, die unterschiedliche Eigenschaften erfüllen.

UseElse

Diese Regel schlägt in zwei Fällen an. Im ersten Fall sorgt sie dafür, dass bei einer if-Anweisung ein else verwendet wird, wenn die if-Anweisung die Methode verlässt. Wir betrachten einmal das folgende Beispiel.

static int min(int x, int y) {
    if (x < y) {
        return x;
    }
    return y;
}

Wenn wir diesen Code betrachten, wissen wir, dass die Methode niemals den Code im then-Zweig der if-Anweisung (also return x) und den Code nach der if-Anweisung (also return y) ausführen wird. Stattdessen wir die Methode nur entweder den Code im then-Zweig der if-Anweisung (also return x) oder den Code nach der if-Anweisung (also return y) ausführen. Das heißt, wir konstruieren in diesem Beispiel zwei unabhängige Code-Pfade. Diese Information ist aber in der Definition der Methode sehr implizit. Bei komplexeren Methoden ist diese Tatsache sehr schnell schlecht zu erkennen. Mit diesem Umstand geht einher, dass wir nicht direkt sehen, dass im Code nach der if-Anweisung immer x >= y gilt. Man nennt Eigenschaften wie “in diesem Stück Code gilt immer x >= y” Invarianten und diese sind bei der Programmierung sehr wichtig. Diese Invariante ist für die Korrektheit des Codes, der nach der if-Anweisung folgt, unerlässlich.

Daher sollte man bei Methoden, die im then-Zweig einer if-Anweisung die Methode verlassen, ein else nutzen. Das heißt, wir sollten die Methode min stattdessen wie folgt definieren.

static int min(int x, int y) {
    if (x < y) {
        return x;
    } else {
        return y;
    }
}

Bei dieser Variante ist für den Leser sofort offensichtlich, dass die Methode zwei logische Pfade hat, die voneinander unabhängig sind. Wir sehen sofort, dass der Code entweder den einen Pfad oder den anderen Pfad nehmen wird.

Die Regel UseElse schlägt außerdem an, wenn nach einer if-Anweisung, welche die Methode verlässt, weitere Anweisungen folgen. Wir betrachten einmal das folgende Beispiel.

static int min(int x, int y) {
    int result;
    if (x < y) {
        return x;
    } else {
        result = y;
    }
    return result;
}

In diesem Beispiel wird nun, wie von der Regel gewünscht, ein else verwendet, um die beiden Code-Pfade klar voneinander zu trennen. In diesem Beispiel werden nun allerdings nach der if-Anweisung weitere Anweisungen ausgeführt, in diesem Fall das return result. Falls die Bedingung x < y erfüllt ist, werden die Anweisungen nach der if-Anweisung, also hier return result nie ausgeführt. Daher sollten auf die if-Anweisung keine weiteren Anweisungen folgen. Stattdessen sollten wir den Code, der nach der if-Anweisung folgt, in den else-Zweig der if-Anweisung verschieben. Das heißt, wir erhalten die folgende Definition.

static int min(int x, int y) {
    int result;
    if (x < y) {
        return x;
    } else {
        result = y;
        return result;
    }
}

Nach dieser Änderung des Codes können andere Regeln angewendet werden, um die Struktur weiter zu verbessern. Zum Beispiel wird die Variable result in diesem Beispiel jetzt nur noch im else-Zweig der if-Anweisung genutzt und sollte somit auch dort deklariert werden.

UseLocalTypeInference

Java stellt seit Version 10 eine lokale Typinferenz zur Verfügung. Statt eine Zeile der Form

int i = 23;

zu schreiben, ist es daher möglich

var i = 23;

zu nutzen. Der Java-Compiler ist in der Lage aus dem Wert, der der Variable zugewiesen wird, abzuleiten, welchen Typ die Variable hat.

Im Kontext einer Lehrveranstaltung kann es durchaus sinnvoll sein, die Typen von Variablen immer zu annotieren. Dies hilft noch einmal darüber nachzudenken, welche Art von Wert überhaupt in einer Variable stehen kann. Auf der anderen Seite haben statisch getypte Programmiersprachen manchmal einen schlechten Ruf, da man in Sprachen wie Java sehr viele Typen angeben muss. So erscheint eine Zeile der Form

ArrayList<Integer> list = new ArrayList<Integer>();

zu Recht sehr redundant. An sich ist es in statisch getypen Sprachen aber gar nicht notwendig, so viel Typinformation anzugeben. Die Sprache Java ist schlichtweg ein schlechtes Beispiel. In anderen statisch getypten Programmiersprachen sind durch das Konzept einer Typinferenz gar keine Typangaben notwendig.

Um zu illustrieren, dass statisch getypte Sprachen gar nicht so viele Typangaben erfordern müssen, wird dieses Sprachfeature in der Vorlesung, wo möglich, verwendet.