thinkBI #026 - Zwischen Sternschema und semantischem Modell

Im thinkBI Podcast ging es zuletzt um Datenmodellierung. Der eigentliche Punkt daran ist nicht technisch, sondern konzeptionell: Zwischen vorbereiteten Tabellen und belastbarer Analyse liegt mehr als ein weiterer Implementierungsschritt.

Datenmodellierung wirkt auf den ersten Blick oft wie eine Fleißaufgabe nach der Datenaufbereitung. Tabellen sind bereinigt, Fakten und Dimensionen angelegt, die Struktur ist sauber. Damit scheint die analytische Arbeit fast abgeschlossen zu sein. Genau hier beginnt aber der eigentliche Unterschied zwischen einem geordneten Datenbestand und einem Modell, das Analyse wirklich trägt.

Ein Sternschema schafft Ordnung. Es bringt messbare Ereignisse und beschreibende Merkmale in eine Form, die fachlich verständlich und technisch nutzbar ist. Das ist wichtig. Ohne diese Struktur bleibt Analyse oft roh, widersprüchlich oder unnötig kompliziert. Aber ein Sternschema beantwortet noch nicht, wie Daten später gemeinsam gelesen werden sollen.

Es sagt noch nicht, welche Beziehungen analytisch aktiv sein müssen. Es sagt noch nicht, wie Filter durch das Modell laufen sollen. Und es sagt noch nicht, welche Kennzahlen überhaupt erst in dem Moment sinnvoll entstehen, in dem jemand eine bestimmte Sicht auf die Daten wählt.

Hier klicken, um den Inhalt von Spotify anzuzeigen.
Erfahre mehr in der Datenschutzerklärung von Spotify.

Inhalt von Spotify immer anzeigen

Struktur allein erzeugt noch keinen analytischen Kontext

Viele Datenmodelle scheitern nicht daran, dass Tabellen fehlen. Sie scheitern daran, dass die Nutzung implizit bleibt. Dann gibt es zwar Fakten und Dimensionen, aber keine sauber ausformulierte Logik dafür, wie diese Bausteine in der Analyse zusammenwirken.

Genau dort beginnt die semantische Ebene. Zwischen vorbereiteten Tabellen und nutzbarer Analyse liegt häufig ein weiteres Modell, etwa in Form einer analytischen Datenbank oder eines semantischen Layers. Diese Schicht bringt nicht einfach zusätzliche Technik ins Spiel. Sie bringt Bedeutung in die Nutzung.

Beziehungen werden dort nicht nur dokumentiert, sondern wirksam gemacht. Filter werden gezielt weitergegeben. Manche Verknüpfungen sind standardmäßig aktiv, andere nur für bestimmte Berechnungen sinnvoll. Damit entsteht ein Ordnungsrahmen, der festlegt, welche analytischen Wege offen sind und welche bewusst nur situativ genutzt werden.

Das ist keine Nebensache. Es ist der Unterschied zwischen Daten, die irgendwo liegen, und einem Modell, das fachliche Lesbarkeit erzeugt.

Ein Modell muss den Auswertungskontext mitdenken

Besonders sichtbar wird das bei Kennzahlen. Viele Organisationen behandeln Measures noch so, als wären sie bloß Zahlen mit einer hinterlegten Formel. Diese Sicht greift zu kurz. Kennzahlen sind in vielen Fällen vom Kontext abhängig, in dem sie gelesen werden.

Ein Prozentwert ist dafür ein einfaches Beispiel. Wer einen Umsatzanteil berechnet, braucht nicht nur einen Zähler, sondern auch die passende Gesamtmenge. Diese Gesamtmenge ist nicht allgemein gültig. Sie hängt davon ab, welche Filter gesetzt wurden, auf welcher Hierarchiestufe gearbeitet wird und welchen Ausschnitt jemand gerade betrachtet.

Dasselbe gilt für Zeitlogiken wie month-to-date (MTD), quarter-to-date (QTD) oder year-to-date (YTD). Solche Werte leben nicht von einer statischen Vorabberechnung, sondern davon, dass das Modell den jeweils aktiven Kontext sauber auflösen kann. Genau deshalb lassen sich viele Kennzahlen nicht sinnvoll vollständig vorberechnen, ohne dabei Flexibilität einzubüßen oder Variantenlogik zu vervielfachen.

Die tiefere Ursache liegt also nicht in einer fehlenden Formel, sondern in einem falschen Modellverständnis. Wer Kennzahlen nur als Ergebniswerte denkt, unterschätzt die Rolle des Modells als Berechnungsraum.

Gute Modelle denken nicht Berichte vor

In vielen BI-Umgebungen wird diese Lücke durch Sonderlogik im Bericht kompensiert. Einzelne Visualisierungen tragen dann ihre eigenen Regeln. Beziehungen bleiben implizit. Kennzahlen werden für feste Sichten vorbereitet. Das wirkt kurzfristig pragmatisch, erzeugt aber langfristig Starre.

Dann entsteht keine Analysefreiheit, sondern eine Sammlung vorverdrahteter Antworten.

Ein belastbares Modell folgt einer anderen Logik. Es versucht nicht, jeden Bericht vorwegzunehmen. Es organisiert Dimensionen, Beziehungen und Measures so, dass unterschiedliche Fragen auf demselben Fundament beantwortet werden können. Der Vorteil einer analytischen Datenbank oder eines semantischen Modells liegt genau darin: Nicht jede Sicht muss einzeln gebaut werden, wenn das zugrunde liegende Modell flexibel und fachlich sauber genug ist.

Damit verschiebt sich auch der Begriff von Freiheit. Freiheit in BI heißt nicht, beliebig Visuals zusammenzuklicken. Freiheit heißt, auf einem belastbaren Modell neue fachliche Fragen stellen zu können, ohne jedes Mal die Datenlogik neu zu erfinden.

Zwischen Sternschema und semantischem Modell entscheidet sich die Nutzbarkeit

Datenmodellierung ist deshalb nicht die dekorative Vorstufe des Dashboards. Sie ist der Ort, an dem sich entscheidet, ob Analyse später beweglich oder spröde wird. Das Sternschema schafft die fachliche Zielstruktur. Das semantische Modell macht diese Struktur analytisch lesbar und berechenbar.

Erst im Zusammenspiel beider Ebenen entsteht ein System, das nicht nur Daten bereitstellt, sondern unterschiedliche Sichten fachlich sauber tragen kann. Genau dort liegt die eigentliche Aufgabe von Datenmodellierung: nicht bloß Ordnung herzustellen, sondern Erkenntnisfähigkeit vorzubereiten.

thinkBI Essentials

Kernaussagen

Datenmodellierung endet nicht beim Sternschema, sondern wird erst mit semantischer Logik analytisch nutzbar.
Ein semantisches Modell organisiert nicht nur Tabellen, sondern Filterwege, aktive Beziehungen und fachlichen Kontext.
Measures sind keine bloßen Formeln, sondern kontextabhängige Berechnungen, die oft erst zur Laufzeit korrekt entstehen.
Gute BI-Modelle denken nicht jeden Bericht vor, sondern schaffen ein belastbares Fundament für unterschiedliche Fragen und Sichten.
Analysefreiheit entsteht nicht durch mehr Visualisierungen, sondern durch ein Modell, das fachliche Flexibilität sauber trägt.

Begriffe aus diesem Beitrag

Sternschema
Ein Sternschema ist eine analytische Zielstruktur, in der messbare Ereignisse in Faktentabellen und beschreibende Merkmale in Dimensionstabellen organisiert werden. Für BI ist es wichtig, weil es Daten fachlich ordnet, aber allein noch nicht den vollständigen Nutzungskontext der Analyse festlegt.

Semantisches Modell
Ein semantisches Modell ergänzt vorbereitete Tabellen um Beziehungen, Filterlogik und Kennzahlen. Es macht aus einem geordneten Datenbestand ein analytisch nutzbares Modell, das unterschiedliche Fragen und Sichten fachlich korrekt unterstützen kann.

Measure
Ein Measure ist eine Kennzahl, die auf dem Datenmodell berechnet wird und oft vom aktuellen Filter- und Auswertungskontext abhängt. In BI ist das entscheidend, weil viele Verhältnisse, Anteile oder Zeitlogiken nicht sinnvoll als starre Vorabberechnung gespeichert werden können.

Filterkontext
Der Filterkontext beschreibt, welcher Ausschnitt der Daten durch Auswahl, Hierarchie oder Berichtssicht gerade aktiv ist. Er entscheidet darüber, welche Werte eine Kennzahl tatsächlich berechnet und warum dieselbe Formel je nach Analyseausschnitt zu einem anderen sinnvollen Ergebnis führt.

Weiterdenken

Welche Kennzahlen gehören in eine vorbereitete Datenstruktur und welche bewusst in die Laufzeitlogik des Modells?
Woran erkennt man, dass ein Bericht eigentlich kein gutes Datenmodell, sondern nur fest verdrahtete Einzelsichten kaschiert?
Verwandtes Thema: Self-Service beginnt im semantischen Fundament
Verwandtes Thema: Datenaufbereitung, Sternschema und analytische Nutzbarkeit

🎧 Die komplette Folge findest du im thinkBI Podcast.

Sternschema braucht semantischen Kontext

Musik: Great Podcast Intro (short & long) von Lundstroem
Quelle: freemusicarchive.org (Creative Commons) – https://freemusicarchive.org/music/lundstroem/songs-for-leona/great-podcast-intro-both-short-and-long-version-included/

thinkBI #026 – Zwischen Sternschema und semantischem Modell

Struktur allein erzeugt noch keinen analytischen Kontext

Ein Modell muss den Auswertungskontext mitdenken

Gute Modelle denken nicht Berichte vor

Zwischen Sternschema und semantischem Modell entscheidet sich die Nutzbarkeit

Veröffentlicht von

Marcus Wegener

Schreibe einen Kommentar Antwort abbrechen