Apache POI

Apache POI

Basisdaten

EntwicklerApache Software Foundation
Erscheinungsjahr26. Januar 2006[1]
Aktuelle Version5.2.5[2]
(25. November 2023)
Betriebssystemplattformübergreifend
Programmier­spracheJava[3][1]
LizenzApache-Lizenz, Version 2.0
poi.apache.org

POI ist eine freie Java-Programmbibliothek zum Lesen und Schreiben von Dateien im Dateiformat von Microsoft Office wie z. B. Word und Excel. Die Software startete als Teil des Jakarta-Projekts und ist nun ein Apache-Top-Level-Projekt.

Namensherkunft

Der Name war ursprünglich ein Akronym für „Poor Obfuscation Implementation“.

Softwarekomponenten

Das Apache-POI-Projekt enthält die folgenden Teilkomponenten:

  • POIFS (Poor Obfuscation Implementation File System): Diese Komponente liest und schreibt Dateien in Microsofts OLE-2-Compound-Document-Format. Beim OLE-2-Compound-Document-Format handelt es sich um ein Dateisystem, in dem die Daten eines Microsoft-Office-Dokuments in Form von Dateien abgelegt werden. Das Wort Obfuscation spielt darauf an, dass dieses Dateisystem etwas verschleiert ist.
  • HSSF (Horrible Spreadsheet Format) und XSSF: Diese Komponente liest und schreibt Dateien im Excel-Format (Excel-97, Excel-XP, Excel-2003, Excel-2007, Excel-2008).
  • HPSF (Horrible Property Set Format): Diese Komponente liest und schreibt Informationen über die Dokumenteigenschaften einer Datei im Microsoft-Office-Format (»Datei → Eigenschaften«).
  • HWPF (Horrible Word Processor Format) und XWPF: Diese Komponente liest und schreibt Dateien im Word-Format (Word-97, Word-XP, Word-2003, Word-2007). Die Komponente befindet sich im Scratchpad (siehe unten).
  • HSLF (Horrible Slide Format) und XSLF: Diese Komponente liest und schreibt Dateien im Powerpoint-Format (PowerPoint-97, Powerpoint-XP, Powerpoint-2003). Sie befindet sich im Scratchpad (siehe unten).
  • HDGF (Horrible DiaGram Format): Diese Komponente liest Dateien im Visio-Format (Visio-97, Visio-XP, Visio-2003, Visio-2007). Ein Beschreiben der Dateien ist nicht möglich. Die Komponente befindet sich im Scratchpad (siehe unten).
  • HPBF (Horrible PuBlisher Format): Diese Komponente liest Dateien im Publisher-Format. Die Komponente befindet sich im Scratchpad (siehe unten).
  • HSMF (Horrible Stupid Mail Format): Liest Dateien im Outlook-Format.

Es gibt externe Module für Big-Data-Plattformen (z. B. Apache Hive/Apache Flink/Apache Spark), welche gewisse Funktionen von Apache POI, wie die Verarbeitung von Exceldateien, zur Verfügung stellen[4][5].

Versionshistorie

Legende:Ältere Version; nicht mehr unterstütztÄltere Version; noch unterstütztAktuelle VersionAktuelle VorabversionZukünftige Version

Versionsnummer

Freigabedatum
Aktuelle Version: 5.2.014. Januar 2022
Ältere Version; nicht mehr unterstützt: 5.1.001. November 2021
Ältere Version; nicht mehr unterstützt: 5.0.020. Januar 2021
Ältere Version; nicht mehr unterstützt: 4.1.217. Februar 2020
Ältere Version; nicht mehr unterstützt: 4.1.120. Oktober 2019
Ältere Version; nicht mehr unterstützt: 4.1.09. April 2019
Ältere Version; nicht mehr unterstützt: 4.0.13. Dezember 2018
Ältere Version; nicht mehr unterstützt: 4.0.07. September 2018
Ältere Version; nicht mehr unterstützt: 3.1715. September 2017
Ältere Version; nicht mehr unterstützt: 3.1619. April 2017
Ältere Version; nicht mehr unterstützt: 3.1521. September 2016
Ältere Version; nicht mehr unterstützt: 3.147. März 2016
Ältere Version; nicht mehr unterstützt: 3.1329. September 2015
Ältere Version; nicht mehr unterstützt: 3.1211. Mai 2015
Ältere Version; nicht mehr unterstützt: 3.1121. Dezember 2014
Ältere Version; nicht mehr unterstützt: 3.10.118. August 2014
Ältere Version; nicht mehr unterstützt: 3.108. Februar 2014
Ältere Version; nicht mehr unterstützt: 3.93. Dezember 2012
Ältere Version; nicht mehr unterstützt: 3.826. März 2012
Ältere Version; nicht mehr unterstützt: 3.729. Oktober 2010
Ältere Version; nicht mehr unterstützt: 3.614. Dezember 2009
Ältere Version; nicht mehr unterstützt: 3.528. September 2009
Ältere Version; nicht mehr unterstützt: 3.219. Oktober 2008
Ältere Version; nicht mehr unterstützt: 3.129. Juni 2008
Ältere Version; nicht mehr unterstützt: 3.0.24. Februar 2008
Ältere Version; nicht mehr unterstützt: 3.0.15. Juli 2007
Ältere Version; nicht mehr unterstützt: 3.018. Mai 2007
Ältere Version; nicht mehr unterstützt: 2.5.129. Februar 2004
Ältere Version; nicht mehr unterstützt: 2.529. Februar 2004
Ältere Version; nicht mehr unterstützt: 2.026. Januar 2004
Ältere Version; nicht mehr unterstützt: 1.5.116. Juni 2002
Ältere Version; nicht mehr unterstützt: 1.56. Mai 2002
Ältere Version; nicht mehr unterstützt: 1.2.019. Januar 2002
Ältere Version; nicht mehr unterstützt: 1.1.04. Januar 2002
Ältere Version; nicht mehr unterstützt: 1.0.211. Januar 2002
Ältere Version; nicht mehr unterstützt: 1.0.14. Januar 2002
Ältere Version; nicht mehr unterstützt: 1.0.030. Dezember 2001

Die POI-Entwicklerversion befindet sich als Java-Quellcode in einem Subversion-Repository.

Scratchpad

Noch nicht alle POI-Komponenten sind in einem Zustand, den die POI-Entwickler für ausgereift halten. Diese Komponenten können in der weiteren Entwicklung größere Änderungen erfahren. Um dies den Anwendern gegenüber deutlich zu machen, befinden sie sich im sogenannten Scratchpad, einem Bereich, der als Spielwiese und für Unausgereiftes vorgesehen ist.

Einzelnachweise

  1. a b projects.apache.org. (abgerufen am 8. April 2020).
  2. poi.apache.org. (abgerufen am 12. Januar 2023).
  3. The poi Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 26. September 2018).
  4. HadoopOffice für Hive/Flink/Spark
  5. Spark Excel

Auf dieser Seite verwendete Medien

Apache POI project logo (2018).svg
Autor/Urheber: Nikhil Karmokar, Andreas Beeker, Lizenz: Apache License 2.0
Logo of The Apache POI project, published August 2018