Datenanalyse mit Python
29.04, 10:45–11:30 (Europe/Berlin), Raum B

Einführung in die Benutzung des pandas-Pakets


Beim Umstieg zu Linux bietet sich zur Datenanalyse und -manipulation zunächst die Tabellenkalkulationskomponente Calc aus dem Office-Paket LibreOffice an. Für diejenigen mit etwas Python-Programmiererfahrung lohnt es sich jedoch, die Verwendung des pandas-Pakets in Betracht zu ziehen. Hiermit lassen sich Daten, die in den verschiedensten Formaten vorliegen können, in ein Python-Programm importieren und verarbeiten sowie graphisch darstellen. Damit stehen alle Möglichkeiten des Python-Universums offen, unter anderem die Datenanalyse in Jupyter-Notebooks. Der Vortrag wird am Beispiel der Analyse von Daten aus dem Open-Data-Portal der Deutschen Bahn AG eine Einführung in die Benutzung des pandas-Pakets geben und die explorative Analyse von Daten in einem Jupyter-Notebook demonstrieren.

Das Jupyter-Notebook zum Vortrag ist unter github.com/gertingold/lit2023 verfügbar.

Siehe auch: PDF-Version des Jupyter-Notebooks zum Vortrag (3,9 MB)

Gert-Ludwig Ingold ist als theoretischer Physiker an der Universität Augsburg tätig und arbeitete bereits im letzten Jahrhundert mit Linux. Für Programmieraufgaben verwendet er fast immer Python und hat gelegentlich zu OpenSource-Projekten wie SciPy oder den SciPy Lecture Notes beigetragen.