Lines of Code

Lines of Code (kurz LOC; englisch für Code-Zeilen i. S. v. Anzahl der Programmzeilen; engl. source lines of code, SLOC) ist ein Begriff aus der Softwaretechnik. Es handelt sich dabei um eine Softwaremetrik, d. h. eine Maßzahl, um die Größe einer Codebasis eines Computerprogramms oder seines Wachstums zu beschreiben. Die Lines of Code sind im einfachsten Fall die Anzahl der Zeilen des Quelltextes, aus denen das Programm besteht.

Diese Metrik erlaubt keine direkten Aussagen über die Effizienz der Programmierer, denn die Anzahl der Zeilen hängt von unterschiedlichsten Faktoren ab: gewählte Architektur, Erfahrung des Programmierers, gewählte Lösung, Formatierung des Quellcodes, verwendete Programmiersprache usw. Zudem besagt die 80/20-Regel, dass 80 % der Zeilen in 20 % der Zeit geschrieben werden. So kann das gründliche Testen eines Programms sehr viel Zeit in Anspruch nehmen, während die Anzahl geänderter oder ergänzter Programmzeilen nur gering ist.

Üblicherweise rechnet man mit einer Produktivität – inklusive aller Projekttätigkeiten – von 10 bis 50 Codezeilen je Mitarbeiter und Tag. Ein Softwareentwicklungsprojekt mit einem gesamten Aufwand von 1.000 Personentagen (ca. 5 Personenjahre) sollte also zwischen 10.000 und 50.000 Lines of Code produziert haben.[1]

Berechnungsarten

Bei Lines of Code gibt es einige gängige Ausprägungen, die anhand des folgenden Beispiels in der Programmiersprache Java erläutert werden:

/* Wie viele Zeilen sind das? */
public void ausgabeEinsBisHundert() {

  for (int i = 1; i <= 100; i++) {
    System.out.print(" " + i); //hier die Ausgabe der Zahlen aus der Schleife
  }
}
Lines of Code (LOC)
Auch physische Lines of Code genannt. Anzahl Zeilen inklusive Leerzeilen und Kommentare. In obigem Beispiel 7. Wird oft stellvertretend für eine der anderen Berechnungsarten genannt.
Source Lines of Code (SLOC)
Anzahl der Codezeilen ohne Leerzeilen und Kommentare. In obigem Beispiel 5.
Comment Lines of Code (CLOC)
Anzahl Kommentarzeilen, wobei nicht definiert ist, ob auch Zeilen mit Code und Kommentare eingerechnet werden. In obigem Beispiel somit 1 oder 2.
Non-Comment Lines of Code (NCLOC)
Auch Non-Comment Source Lines (NCSL) oder Effective Lines of Code (ELOC) genannt. Anzahl der Codezeilen ohne Leerzeilen und Kommentare ohne Header und Footer. Header und Footer sind insbesondere die äußeren öffnenden und schließenden Klammern sowie (auf Klassenebene) Import/Include-Statements und (auf Methodenebene) Methodendeklarationen. Obiges Beispiel hat auf Methodenebene 3, auf Klassenebene 5 NCLOC.
Logical Lines of Code (LLOC)
Auch Number of Statements (NOS) genannt. Zählt die Anzahl der Anweisungen. Wird bspw. bei COCOMO verwendet. In obigem Beispiel 2. In der Programmiersprache C gelten allerdings die Instruktionen in for-Schleifen als eigenständige Anweisung. In C hätte obiges Beispiel also 4 LLOC.

Verwendung

Die meisten Vergleiche von Programmen über die LOC betrachten nur die Größenordnungen der Anzahl Zeilen verschiedener Projekte. Computerprogramme können aus nur wenigen Dutzend bis zu hunderten von Millionen Programmzeilen bestehen. Der Umfang eines Programmes in Codezeilen muss nicht zwangsläufig Rückschlüsse auf die Komplexität oder Funktionalität des Programms erlauben, da die Verwendung externer Frameworks und Programmbibliotheken, die verwendete Programmiersprache und auch die Formatierung des Quelltextes großen Einfluss auf die Codezeilen haben. Insbesondere sind Rückschlüsse auf die investierte Arbeitszeit meistens sinnfrei.

Auch bei Verwendung von Logical Lines of Code (LLOC) hängt das Verständnis, was unter einer Anweisung zu verstehen ist und wie die Komplexität derselben zu beurteilen ist, von der verwendeten Programmiersprache ab. So kann etwa in einem mehrere Bildschirmseiten umfassenden Assembler-Quelltext letztlich das gleiche Programm formuliert sein, wie in einigen wenigen Zeilen einer höheren Programmiersprache.

Abhängig vom Programmierer und den verwendeten Formatierungsrichtlinien kann das obige Beispiel in folgenden, programmtechnisch gesehen vollkommen gleichwertigen Quelltext umformuliert werden:

/* Wie viele Zeilen sind das? */
public void ausgabeEinsBisHundert() {
  for (int i = 1; i <= 100; i++) System.out.print(" " + i); // hier die Ausgabe der Zahlen aus der Schleife
}

Nun besteht der Quelltext aus vier physischen Codezeilen (LOC), drei SLOC, je nach Berechnung ein bis zwei Comment Lines of Code (CLOC), einem Non-Comment Line of Code (auf Methodenebene) und weiterhin zwei logischen Programmzeilen (LLOC).

Da die hier getätigte Reduktion der Codezeilen die Lesbarkeit reduziert hat, ist die Komplexität des Programmes erhöht worden, was wiederum auf die Produktivität einen negativen Einfluss hat. Weniger Zeilen Code kann somit durchaus höhere Aufwände verursachen.

Die Größe Lines of Code wird u. a. auch zur Berechnung der Fehlerdichte eines Programms verwendet: Je nach Einsatzzweck sollte, auch abhängig von der Programmiersprache,[2] ein bestimmtes Maß an Programmfehlern nicht überschritten werden, z. B. max. 0,5 Fehler je KLOC (= Kilo = 1000 LOC) in militärischen oder Krankenhaussystemen.

Beispiele

Hier sind einige Beispiele für die Anzahl der Zeilen von Programmcode in verschiedenen Betriebssystemen und Anwendungsprogrammen.

Anzahl der Zeilen Programmcode in verschiedenen Betriebssystemen und Programmen
JahrSystemSLOC in Mio.
Betriebssystem-Kernel
1983Multics-Kernel[3]0,25
1994Linux-Kernel 1.0 (nur i386)< 0,2
1996Linux-Kernel 2.0 (IA-32, Alpha, MIPS, SPARC)0,72
1999Linux-Kernel 2.21,7
2001Linux-Kernel 2.43,2
2003Linux-Kernel 2.6.08,1
2005XNU 792.x (Darwin 8.x bzw. Mac OS X 10.4)[4]2
2011Linux-Kernel 2.6.39 und 3.014,5
2012Linux-Kernel 3.2 LTS[5]15
2012Linux-Kernel 3.6[6]15,9
2015Linux-Kernel 4.2[7]> 20
2018Linux-Kernel 4.15[8]25,3
Komplette Betriebssysteme
FreeBSD8,8
OpenSolaris9,7
1993Windows NT 3.1[9]4–5
1994Windows NT 3.5[9]7–8
1996Windows NT 4.0[9]11–12
2000Debian GNU/Linux 2.2[10][11]55–59
2000Windows 2000[9]> 29
2001Windows XP[9]40
2002Debian GNU/Linux 3.0[11]104
2003Windows Server 2003[9]50
2005Debian GNU/Linux 3.1[11]215
2005Mac OS X Tiger (10.4)[12]86
2007Debian GNU/Linux 4.0[11]283
2007Windows Vista[13]50
2009Debian GNU/Linux 5.0[11]324
2009Windows 7[13]40
Andere Software
1983Lotus 1-2-3 1.0[14]0,02
1989Lotus 1-2-3 3.0[14]0,4
2007SAP NetWeaver 2007[15]238
2020Mozilla Firefox[16]22,3
2020Chromium (Basis für Google Chrome)[17]34,9

Literatur

  • Stephen H. Kan: Metrics and Models in Software Quality Engineering. 2. Auflage. Addison-Wesley, Boston MA 2002, ISBN 0-201-72915-6.
  • Harry Sneed, Richard Seidl, Manfred Baumgartner: Software in Zahlen – Die Vermessung von Applikationen. 1. Auflage. Carl Hanser Verlag, München 2010, ISBN 978-3-446-42175-2.

Einzelnachweise

  1. Steve McConnell: Code Complete A Practical Handbook of Software Construction. 2. Auflage. Microsoft Press, 2004, ISBN 978-0-7356-1967-8, 20.5 The General Principle of Software Quality, S. 514 (englisch): “The industry-average productivity for a software product is about 10 to 50 of lines of delivered code per person per day (including all non coding overhead).”
  2. Prechelt: SWT2 Kap. 1.5 Messen und Maße. FU Berlin, 1. Oktober 2012, abgerufen am 19. März 2020.
  3. Tom Van Vleck, John Gintell, Joachim Pense, Monte Davidoff, Andi Kleen, Doug Quebbeman, Jerry Saltzer: Multics Myths. (Wiki) In: Multicians. Abgerufen am 21. Mai 2020 (englisch).
  4. Amit Singh: Mac OS X Internals: A Systems Approach. Addison-Wesley Professional, 2006, ISBN 978-0-13-270226-3, 2.4 (online): „The Darwin xnu package consists of roughly a million lines of code, of which about half could be categorized under BSD and a third under Mach. The various kernel extensions, not all of which are needed (or loaded) on a given system, together constitute another million lines of code.“
  5. Greg Kroah-Hartman, Jonathan Corbet, Amanda McPherson: Linux Kernel Development: How Fast it is Going, Who is Doing It, What They are Doing, and Who is Sponsoring It. (PDF; 0,6 MB) (Nicht mehr online verfügbar.) Linux Foundation, März 2012, archiviert vom Original am 12. September 2019; abgerufen am 8. Januar 2013 (englisch).  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/go.linuxfoundation.org
  6. Thorsten Leemhuis: Die Neuerungen von Linux 3.6. In: Heise online. 1. Oktober 2012. Abgerufen am 2. Mai 2013.
  7. Thorsten Leemhuis: Linux-Kernel durchbricht die 20-Millionen-Zeilen-Marke. In: Heise online. 30. Juni 2015. Abgerufen am 1. Juli 2015.
  8. Thorsten Leemhuis: Die Neuerungen von Linux 4.15. In: Heise online. 12. Februar 2018. S. 9: Ausblick auf 4.16, Umfang der Änderungen & Changelog. Abgerufen am 27. Mai 2020.
  9. a b c d e f How Many Lines of Code in Windows? (Nicht mehr online verfügbar.) Knowing.NET, 6. Dezember 2005, archiviert vom Original am 18. Mai 2014; abgerufen am 14. Mai 2014 (englisch).  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.knowing.net
  10. Jesús M. González-Barahona, Miguel A. Ortuño Pérez, Pedro de las Heras Quirós, José Centeno González, Vicente Matellán Olivera: Counting potatoes: the size of Debian 2.2. (Nicht mehr online verfügbar.) 3. Januar 2002, archiviert vom Original am 4. Juli 2008; (englisch).
  11. a b c d e Gregorio Robles: Debian Counting. (Nicht mehr online verfügbar.) Archiviert vom Original am 14. März 2013; (englisch).
  12. Steve Jobs: Live from WWDC 2006: Steve Jobs Keynote. 7. August 2006, abgerufen am 16. Februar 2007 (englisch, Enthält vermutlich auch ein paar Anwendungsprogramme.): „86 million lines of source code that was ported to run on an entirely new architecture with zero hiccups“
  13. a b Mark Wilson: Infographic: How Many Lines Of Code Is Your Favorite App? In: Fast Company magazine online. 7. November 2013, abgerufen am 29. Mai 2020 (englisch): „Windows Vista (2007), for instance, had 50 million lines of code, while Windows 7 shaved that figure down to 40 million.“
  14. a b Detlef Borchers: Vor 30 Jahren: Die erste Killeranwendung. In: Heise online. 28. Januar 2013. Abgerufen am 14. Juni 2020.; Zitat: „Hatte das erste 1-2-3 noch weniger als 20.000 Codezeilen, so kam Version 3 mit 400.000 Zeilen.“.
  15. What SAP says about ABAP’s future. Abgerufen am 20. November 2011 (englisch).
  16. The Mozilla Firefox Open Source Project on Open Hub. Abgerufen am 14. November 2020.
  17. The Chromium (Google Chrome) Open Source Project on Open Hub: Languages Page. Abgerufen am 14. November 2020.