pandas (Software)

pandas

Basisdaten

EntwicklerWes McKinney, J. Brock Mendel, Joris Van den Bossche, Jeff Reback[1]
Erscheinungsjahr11. Januar 2008
Aktuelle Version2.1.0[2]
(30. August 2023)
BetriebssystemPlattformunabhängig
ProgrammiersprachePython[3]
Lizenz3-Klausel-BSD-Lizenz
pandas.pydata.org

pandas ist eine Programmbibliothek für Python zur Verarbeitung, Analyse und Darstellung von Daten. Insbesondere enthält sie Datenstrukturen und Operatoren für den Zugriff auf numerische Tabellen und Zeitreihen. pandas ist Freie Software, veröffentlicht unter der 3-Klausel-BSD-Lizenz. Der Name leitet sich von dem englischen Begriff panel data (Paneldaten) ab, einer ökonometrischen Bezeichnung für Datensätze, die Beobachtungen über mehrere Zeiträume für dieselbe Untersuchungseinheit enthalten.

Der Softwareentwickler Wes McKinney startete mit der Entwicklung 2008, als er ein Werkzeug für die Analyse von Finanzdaten bei AQR Capital brauchte. Bevor er die Firma verließ, überzeugte er seine Vorgesetzten, die Software quelloffen machen zu dürfen. Chang She, ein anderer AQR-Mitarbeiter, wurde 2012 Mitwirkender. Seit 2015 wird das Community-Projekt von NumFOCUS gesponsert und unterstützt.

Beispiele

Kurven

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()

Bar charts

df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()

Box plot

df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()

Histogram

data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()

Siehe auch

Weblinks

Einzelnachweise

  1. www.youtube.com.
  2. Release 2.1.0. 30. August 2023 (abgerufen am 18. September 2023).
  3. The py-pandas Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 14. Juli 2018).

Auf dieser Seite verwendete Medien

Pandas lineplot.png
Autor/Urheber: DieserGorilla, Lizenz: CC BY-SA 4.0
Lineplot with pandas
Pandas candelstick.png
Autor/Urheber: DieserGorilla, Lizenz: CC BY-SA 4.0
Candlestick diagram with pandas
Pandas logo.svg
Autor/Urheber: Marc Garcia, Lizenz: BSD
pandas logo, used since version 1.0 (2020)
Pandas histogram.png
Autor/Urheber: DieserGorilla, Lizenz: CC BY-SA 4.0
Histogram diagram with pandas
Pandas bargraf.png
Autor/Urheber: DieserGorilla, Lizenz: CC BY-SA 4.0
Bargraph diagram with pandas