Redundanter Code

Redundanter Code ist in der Programmierung der Begriff für den Quelltext eines Computerprogramms bzw. Teile davon, die redundant (‚überflüssig‘) sind.[1][2]

Besonders in der Technik werden mit ‚redundant‘ im Allgemeinen mehrfach vorhandene Komponenten bezeichnet.[3][4] Auf Programmcode bezogen bedeutet redundanter Code mehrfach identisch vorhandene Quellcodeteile (Quelltextklone).

In der Regel werden unter „redundantem Code“ Textkopien im Anweisungsteil eines Programms verstanden, grundsätzlich sind Redundanzen (wie auch toter Code) auch in den Datendefinitionen eines Programms möglich.

Coderedundanz kann auch über unterschiedliche Programme hinweg auftreten – wenn beispielsweise identische Funktionsteile in mehreren Programmen jeweils individuell programmiert/codiert werden, anstatt sie als Unterprogramm aufzurufen oder durch eine Include-Anweisung einzubinden.

Unterschiedliche Bedeutung/Abgrenzung:
Auch toter Code wird, weil er formal ‚überflüssig‘ scheint, zum Teil als redundanter Code bezeichnet, ist jedoch nicht redundant i. S. von ‚mehrfach vorhanden‘.

Bedeutung

Alle Formen redundanten Codes gelten aus verschiedenen Gründen als unerwünscht bzw. Mangel in der Softwarequalität. So vergeudet redundanter Code CPU-Zeit, die anderen Threads fehlt. Darüber hinaus vergeudet mehrfach vorhandener Code Speicherplatz und kann zu unnötigem Caching von Befehlen im Befehlscache der CPU führen. Redundanter Code reduziert die Wartbarkeit, erhöht den Aufwand, Code zu dokumentieren und führt zu mehr Fehlern.[5] Er wirkt sich auch oft negativ auf Metriken aus und erschwert die Programmverifikation.

Je nach Situation kann redundanter Code jedoch auch bewusst entstehen: Er soll beispielsweise einen vorläufigen oder ehemaligen Quelltextteil konservieren, wird aus bestimmten Gründen mehrfach gehalten (siehe Quelltextklon), hat bei gegebenen Vorteilen keine nachteilige Bedeutung (z. B. bei sehr kleinen Codefragmenten) – oder es liegt ein Programmfehler vor (besonders toter/unerreichbarer Code), dessen Entdeckung ein Ziel beim Softwaretest ist.

Beispiel

int foo (int x) {
    int y = 100 / x;  // Code löst bei x = 0 eine Exception aus und beendet das Programm
    int z = x * x;    // Berechnung, die zwei Zeilen weiter unten noch Mal ausgeführt wird
    if (z >= 0)
        return x * x; // redundante Berechnung, optimieren Compiler heraus, nennt sich Common Subexpression Elimination
    return -1;        // Code wird erreicht für Inputs 46341…65535, 80265…92681, 103622…113511, 122607…131071, ... (Annahme: 32 bit int)
}
  • Toter Code – Im Beispiel wird in Zeile 2 die Zahl 100 durch x dividiert, das Ergebnis aber nie verwendet. Es handelt sich somit um toten Code. Ist allerdings x Null, wird eine Ausnahme ausgelöst. Eine Entfernung dieses Codes führt somit zu einer Änderung der Funktionalität. Da Ausnahmen auszulösen aber niemals ein Teil der Funktionalität sein sollte, handelt es sich dabei um eine fehlerhafte Funktionalität, die zu entfernen ist.
  • Redundanter Code – Im Beispiel wird x in Zeile 3 und 5 quadriert, ohne dass x dazwischen geändert wird. Das Ergebnis ist somit immer dasselbe, damit ist der Code redundant. return z wäre somit in Zeile 5 angebracht.
  • Unerreichbarer Code – Im Beispiel wird die Zeile 7 niemals erreicht, da die Abfrage z >= 0 in Zeile 4 immer wahr ist und in Zeile 5 die Methode verlassen wird. Somit handelt es sich bei Zeile 7 um unerreichbaren Code.
  • Unnötiger Code – Nachdem die Abfrage z >= 0 in Zeile 4 immer wahr ist, ist sie sinnlos und kann ebenso entfernt werden. Unnötiger Code fällt zwar in keine der drei genannten Kategorien, wird aber landläufig oft auch als toter Code bezeichnet.

Gründe

Redundanter Code entsteht unter anderem durch

  • Programmierfehler in komplexen bedingten Verzweigungen;
  • eine Folge von internen Umwandlungen, die von einem optimierenden Übersetzer durchgeführt werden;
  • unvollständiges Testen eines neuen oder veränderten Programms
  • unvollständige Wartung, wie etwa nachträglicher Rückbau temporärer Sonderregelungen ohne Verständnis der alten Funktionen.

Analyse

Redundanten Code zu entdecken ist eine Form von statischer Codeanalyse und benötigt eine genaue Analyse der Ablaufsteuerung, um den Code unabhängig von den Variablen und anderen Laufzeitbedingungen zu finden. Mit Hilfe geeigneter Analysewerkzeuge können redundante Codeteile gefunden werden.

Einzelnachweise

  1. Saumya K. Debray, William Evans, Robert Muth, Bjorn De Sutter: Compiler techniques for code compaction. In: ACM Transactions on Programming Languages and Systems (TOPLAS). Band 22, Nr. 2, März 2000, S. 378–415, doi:10.1145/349214.349233 (englisch).
  2. computerlexikon.com 2012: Öfter vorhanden als eigentlich gebraucht
  3. neueswort.de Beispiele mit Bedeutung ‚mehrfach‘
  4. linguee.de alle Beispiele bedeuten ‚mehrfach‘
  5. David Noel Card, Victor E Church, William W. Agresti: An empirical study of software design practices. In: IEEE Transactions on Software Engineering. Band 12, Nr. 2, Februar 1986, ISSN 0098-5589, S. 264–271 (englisch). “Table X further implies that a high proportion of unreferenced local and calling sequence variables signifies sloppy workmanship leading to high cost and fault rates.”