Ziel ist die Gewinnung von Erkenntnissen, die in Hinsicht auf die Unternehmensziele bessere operative oder strategische Entscheidungen ermöglichen. Dies geschieht mit Hilfe von analytischen Konzepten und IT-Systemen, die Daten über das eigene Unternehmen, die Mitbewerber oder Marktentwicklung im Hinblick auf den gewünschten Erkenntnisgewinn auswerten.
In wirtschaftlich turbulenten Zeiten wird gewohnheitsmäßig der Ruf nach Transparenz, Effizienz und besserer Führung laut: Das Management soll das Unternehmen trotz schärferen Wettbewerbs und kürzerer Reaktionszeiten auf Kurs halten und die richtigen Entscheidungen treffen. Unternehmensdaten und -informationen als Grundlage für derartige Entscheidungen müssen in solchen Zeiten besonders aussagekräftig sein.
Einen Boom erlebt daher derzeit Software für Business Intelligence. Unter dem Begriff werden gemeinhin Prozesse und Verfahren zur systematischen Sammlung, Auswertung und Präsentation von Unternehmensdaten verstanden. Die Gründe für den Einsatz von BI-Software sind vielfältig und beinhalten unter anderem den Wunsch, Kosten zu senken, Geschäftsabläufe zu optimieren, Risiken zu minimieren, Kundenbeziehungen profitabler zu gestalten und allgemein die Wertschöpfung zu vergrößern.
Business Intelligence mit Open Source
BI-Projekte sind stark multidisziplinär geprägt. Neben Technologien, die Daten aus operativen Systemen extrahieren, kommen meist auch Werkzeuge zur analytischen Aufbereitung der Daten sowie Tools für die Gestaltung von Berichten und Auswertungen zum Einsatz. Um die Thematik Business Intelligence herum hat sich so ein profitabler Softwaremarkt entwickelt.
Neben Big Playern wie IBM, SAP und Oracle haben sich in den letzten beiden Jahren einige Open-Source-Anbieter im wachstumsstarken Markt für Business-Intelligence-Software etabliert. Besonders erwähnenswert aufgrund der professionellen Qualität ihrer Produkte und Dienstleistungen sind der deutsche Anbieter Jedox [1] sowie die beiden amerikanischen Unternehmen Jaspersoft [2] und Pentaho [3].
Diesen drei Anbietern ist ein Geschäftsmodell gemein, das sie selbst als „Commercial Open Source“ bezeichnen. Es umfasst eine kostenfreie Community-Version und eine kostenpflichtige Enterprise-Version mit Herstellersupport und speziellen Features. Dennoch unterscheiden sich die drei Open-Source-Probanden voneinander: Jaspersoft und Pentaho bieten einen plattformorientierten Ansatz, der die komplette Bandbreite an BI-Funktionalität mittels modularer Werkzeuge abdeckt. Palo richtet sich hingegen an den Fachanwender mit einem mächtigen, multidimensionalen Analyseinstrument über ein Excel-Frontend [4]. Im Folgenden geht es um die Unterschiede der Lösungen in den Themenbereichen Datenintegration, Analyse und Reporting.
Datenintegration im Data Warehouse
Eine zentrale Aufgabenstellung im BI-Umfeld ist die Definition von Extraktions-, Transformations- und Ladeprozessen (ETL), um die Daten aus den unterschiedlichsten Quellen im Unternehmen aufbereitet in einem Data Warehouse zusammenzuführen. Das Data Warehouse entspricht dem zentralen Datenlager eines Unternehmens, in dem die steuerungsrelevanten Informationen standardisiert für Analyse und Berichtswesen aufbewahrt werden.
Jedox bietet für diese Aufgabenstellung den Palo ETL-Server an. Der Server besteht aus einer Java-Anwendung, die als Webdienst bereitgestellt wird und die Befüllung der Palo-Datenbank durch ETL-Prozesse ermöglicht. Die notwendigen Verarbeitungsschritte werden in einer Baumstruktur gepflegt. In der Enterprise-Version von Palo ist auch eine Anbindung an SAP möglich.
Sowohl Jaspersoft als auch Pentaho verfolgen bei der Datenintegration einen anderen Ansatz: Die ETL-Anwendungen JasperETL beziehungsweise Pentaho Data Integration haben eine Oberfläche, auf der ETL-Prozesse per Drag & Drop zusammengestellt werden können. JasperETL besteht im Wesentlichen aus dem Talend Open Studio, während Pentaho Data Integration auf Kettle basiert. Kettle ist ein gut bedienbares Tool mit ebenso vielen Konnektoren und Features wie Jasper-ETL. Positiv anzumerken ist, dass es eine Reihe – teilweise kostenpflichtiger – Plugins und Bibliotheken gibt, sodass sich beispielsweise auch SAP problemlos über Kettle oder Talend anbinden lässt.
Datenanalyse mit OLAP-Cubes
Sind die heterogenen Datenquellen in ein Data Warehouse integriert, gilt es, die Daten für die Analyse aufzubereiten. Dazu baut man so genannte OLAP-Würfel, die verschiedene Dimensionen und Kennzahlen enthalten. Mit Navigationsfunktionen lassen sich die Daten aus unterschiedlichen Perspektiven innerhalb eines Würfels betrachten.
Palo setzt zum einen auf multidimensionales OLAP (MOLAP) und zum anderen auf eine In-memory-Technologie. Das bedeutet, dass die Daten in einem speziellen Datenbankformat und im Arbeitsspeicher für die Analyse gehalten werden. Dieser Ansatz hat zwei Vorteile: Zum einen ist die Abfragegeschwindigkeit sehr hoch, zum anderen lassen sich die Daten direkt über das Frontend in die Datenbank zurückschreiben.
Palo bietet auch ein Excel-Add-in, wovon die Hauptzielgruppe – nämlich Mitarbeiter aus Controlling und anderen Fachabteilungen – besonders profitiert, da sie oftmals ohnehin mit Excel arbeitet. Der Anwender greift über das Add-in auf den Palo-Server zu, um in Excel durch den multidimensionalen Datenraum zu navigieren. Der Worksheet-Server macht Excel webfähig, sodass man die Daten auch über Intra- und Internet erreichen kann.
Jaspersoft und Pentaho verwenden in den Community Versionen für die Datenanalyse das Mondrian Project. Im Gegensatz zum MOLAP-Ansatz von Palo kommt bei ihnen relationales OLAP (ROLAP) zum Einsatz. Hier werden die Daten in relationalen Datenbanken gehalten und durch spezielle Schemata (Snowflake oder Star) aufbereitet. Die Weboberfläche bietet bei beiden Lösungen solide OLAP-Funktionalität: Der Anwender kann die Daten nach Belieben filtern, sortieren und in unterschiedlichen Detaillierungsgraden betrachten. Eine alternative Oberfläche bietet Pentaho in der Enterprise-Version mit dem Pentaho Analyzer. Sie überzeugt durch sehr gute, intuitive Bedienbarkeit und erweiterte Export- und Darstellungsmöglichkeiten. Möchte man als Pentaho-Anwender nicht auf die Auswertungsmöglichkeiten in Excel verzichten, hilft der Drittanbieter Simba weiter: Mit seiner kostenpflichtigen ODBO-Schnittstelle kann man aus Excel-Pivottabellen heraus auf die Daten im OLAP-Cube von Pentaho zugreifen.






Newsletter
Abonniere unseren Newsletter und erhalte t3n-News per E-Mail.
Twitter
Folge t3n auf Twitter. Wir informieren dich über die wichtigsten Tech-News.
Jetzt t3n auf Twitter folgenFacebook
Werde jetzt Fan von t3n auf Facebook.
Jetzt Fan werdenVimeo
Unser neuestes Video auf Vimeo:
TechnikLOAD 2 – Videos dynamisch einbinden per Vimeo-API
RSS
Verpasse nichts mit unseren RSS-Feeds:
- Aktuelle News
- Die neuesten Artikel
- Die neuesten Fragen
- Aktuelle SocialNews
- Neue Startups
- Neue Open Source Projekte
- Die neuesten Marktplatzeinträge
- Aktuelle Jobangebote
weitere Feeds