Python hat sich als Skriptsprache für verschiedene Open Source-Projekte bewährt, darunter etwa Apache OpenOffice oder Blender. Dabei sind die Möglichkeiten von Python vielfältig, wie das vorliegende Buch beweisen möchte. So lässt sich die Sprache einsetzen, um strukturierte Daten zu verarbeiten, zu bereinigen oder zu manipulieren.
Hierfür werden in erster Linie die Standard-Bibliotheken NumPy, IPython und Pandas genutzt. Diese erläutert der Autor Wes McKinney zunächst in ihrer Bedeutung, Funktionalität und dem funktionalen Zusammenspiel, sodass bereits frühzeitig eine interaktive Rechen- und Entwicklungsumgebung zur Verfügung steht, die dann auf ihren Einsatz im Rahmen der Datenanalyse wartet.
Aufgrund des Ziels wissenschaftlichen Rechnens fallen die Themen im Buch entsprechend anspruchsvoll aus, bieten aber durchaus interessante Anregungen für die Analyse unternehmensinterner Daten. Der Autor führt den Leser dabei im Laufe des Buches (oder der jeweiligen Bibliothek) von einfachen Techniken hin zu fortgeschrittenen Features. Dies erweist sich als praktisch, da der Leser so auch über den Index gesuchte Themen finden und wiederaufgreifen kann. Das Plotten und die Visualisierung der Daten (matplotlib) werden ebenso beschrieben wie der lesenswerte Umgang mit Zeitreihen. Dabei liefert McKinney Anregungen für die Webanalyse, die aber auch für andere Einsatzbereiche bis hin zur Vorbereitung von Kalkulationen genutzt werden können.
Anhand des Titels vermutet der Leser möglicherweise keineswegs Inhalte, die sowohl für Python-Einsteiger wie auch bereits erfahrene Programmierer von großem Interesse sein können. Der Aufbau und die Struktur werden diesen Ansprüchen aber gerecht, da die konkreten Fallbeispiele Lösungen für typische Datenanalyse-Probleme aufzeigen. Eventuell benötigen Admins ohne Programmierkenntnisse noch ein Programmier-Einsteigerbuch zum Thema
...Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.