SAP Analytics Cloud (SAC) Hands-On: Datenmodelle kombinieren

Autor: Stefan Rehm | Veröffentlicht: 19.07.2019

Seit Jahresbeginn ist es in der Analytics Cloud erstmals möglich Daten auf Modellebene zu kombinieren. Mit dem Release 2019.01 lieferte SAP eine Funktion nach, die in Lumira Discovery schon lange möglich war: Konnte man bisher lediglich Daten in Visualisierungen verlinken, ist es nun möglich das ganze schon auf Modellebene zu tun.

Dieses kombinieren von Daten aus mehreren Quellen bietet entscheidende Vorteile.

  • Es kann an zentraler Stelle gejoint werden und dieses erweiterte Datenmodell kann für beliebige Stories genutzt werden. Ein verlinken von Dimensionen musste in jeder Story wieder neu definiert werden.

  • Data-Wrangling Funktionen funktionieren nur auf Datenmodellebene und es war vorher nicht möglich gelinkte Dimensionen zu bereinigen oder anderweitig zu transformieren.

Damit die Daten in einem Datenmodell kombiniert werden können, müssen sie in die SAC importiert werden. Sobald also mindestens ein Datenmodell aus einer Live-Verbindung gefüttert werden soll, muss wie bisher auch auf das Linken von Dimensionen im Chart zurückgegriffen werden. Weitere Restriktionen ist eine Beschränkung auf 30 Millionen Datenzellen und eine generelle Limitierung auf fünf kombinierbare Datensets.

Weil sich noch wenig bis überhaupt keine Dokumentation über das Kombinieren von Datensets finden lässt, möchte ich diese Funktion anhand eines kleinen, zugänglichen Beispiels demonstrieren.

Ausgangspunkt sind mehre Datensets von Lego. Diese stehen unter CC0 Public Domain, sind also frei verfügbar und verwendbar und auf der Plattform Kaggle zu finden.

Abbildung 01

Dieses Schema verdeutlicht die Beziehungen zu den verschiedenen Daten. In meinem Beispiel interessiert mich das eigentliche Lego Set (sets). Das Set hat einen Namen, ein Erscheinungsjahr und die Anzahl an Bausteinen darin. Nahezu jedes Lego Set gehört außerdem zu einem Thema. Man denke zum Beispiel an Lego Technik oder Star Wars. Diese Themen sind außerdem in einer Hierarchie organisiert.

Was ich mit der Analytics Cloud nun visualisieren möchte ist die Anzahl an Bausteinen in jedem Thema. Hierzu werde ich nun die neue Funktion der Kombination von Datensets nutzen um die Daten der Tabellen „sets“ und „themes“ zu joinen.

Zunächst beginne ich also mit den „sets“ uns lade dieses csv Datei als neues Datenmodell in die SAC.

Abbildung 02

Alle Spalten wurden richtig erkannt. Die einzige Kennzahl ist die Anzahl der Bausteine. Nun führe ich den Join mit dem zweiten Datenset durch. In diesem ist die Information der Themen und deren Hierarchie abgelegt.

Abbildung 03

Abbildung 04

In diesem Dialog bestimme ich nun den gemeinsamen Schlüssel auf beiden Datensets. In unserem Fall die theme_id aus den Legosets mit der id aus den Themen. Ich den Einstellungen bestimme ich den Join typ. Aktuell habe ich nur die Möglichkeit eines Left-outer-Joins und eines Inner Joins. Seit Version 2019.06 lassen sich die Schlüssel für den Join auch auf bis zu drei erweitern. Sobald ein Schlüssel gewählt wurde wird mir eine Vorschau auf die kombinierten Daten geliefert.

Abbildung 05

Im Ergebnis sind nun die Informationen aus dem Themen Datenset in das vorher angelegte Datenset integriert worden. Namensgleiche Dimensionen können nun noch umbenannt werden. Außerdem kann mit der Parent_ID eine Parent/Child Hierarchie auf dem Themen ID erstellt werden. Diese Schritte habe ich durchgeführt und kann nun in einer Story z.b. die Frage beantworten in welchem Thema bisher die meisten Steine ausgeliefert wurden.

Abbildung 06

Zurück zum Blog

Fragen zur SAP Analytics Cloud?

Stefan Rehm, unser Senior Consultant Analytics, berät Sie gerne.

Jetzt Kontakt aufnehmen

Fragen zur SAP Analytics Cloud?

Stefan Rehm, unser Senior Consultant Analytics, berät Sie gerne.

Jetzt Kontakt aufnehmen