Im thinkBI Podcast ging es zuletzt um Datenmodellierung. Der eigentliche Punkt daran ist nicht technisch, sondern konzeptionell: Zwischen vorbereiteten Tabellen und belastbarer Analyse liegt mehr als ein weiterer Implementierungsschritt.
Datenmodellierung wirkt auf den ersten Blick oft wie eine Fleißaufgabe nach der Datenaufbereitung. Tabellen sind bereinigt, Fakten und Dimensionen angelegt, die Struktur ist sauber. Damit scheint die analytische Arbeit fast abgeschlossen zu sein. Genau hier beginnt aber der eigentliche Unterschied zwischen einem geordneten Datenbestand und einem Modell, das Analyse wirklich trägt.
Ein Sternschema schafft Ordnung. Es bringt messbare Ereignisse und beschreibende Merkmale in eine Form, die fachlich verständlich und technisch nutzbar ist. Das ist wichtig. Ohne diese Struktur bleibt Analyse oft roh, widersprüchlich oder unnötig kompliziert. Aber ein Sternschema beantwortet noch nicht, wie Daten später gemeinsam gelesen werden sollen.
Es sagt noch nicht, welche Beziehungen analytisch aktiv sein müssen. Es sagt noch nicht, wie Filter durch das Modell laufen sollen. Und es sagt noch nicht, welche Kennzahlen überhaupt erst in dem Moment sinnvoll entstehen, in dem jemand eine bestimmte Sicht auf die Daten wählt.
Struktur allein erzeugt noch keinen analytischen Kontext
Viele Datenmodelle scheitern nicht daran, dass Tabellen fehlen. Sie scheitern daran, dass die Nutzung implizit bleibt. Dann gibt es zwar Fakten und Dimensionen, aber keine sauber ausformulierte Logik dafür, wie diese Bausteine in der Analyse zusammenwirken.
Genau dort beginnt die semantische Ebene. Zwischen vorbereiteten Tabellen und nutzbarer Analyse liegt häufig ein weiteres Modell, etwa in Form einer analytischen Datenbank oder eines semantischen Layers. Diese Schicht bringt nicht einfach zusätzliche Technik ins Spiel. Sie bringt Bedeutung in die Nutzung.
Beziehungen werden dort nicht nur dokumentiert, sondern wirksam gemacht. Filter werden gezielt weitergegeben. Manche Verknüpfungen sind standardmäßig aktiv, andere nur für bestimmte Berechnungen sinnvoll. Damit entsteht ein Ordnungsrahmen, der festlegt, welche analytischen Wege offen sind und welche bewusst nur situativ genutzt werden.
Das ist keine Nebensache. Es ist der Unterschied zwischen Daten, die irgendwo liegen, und einem Modell, das fachliche Lesbarkeit erzeugt.
Ein Modell muss den Auswertungskontext mitdenken
Besonders sichtbar wird das bei Kennzahlen. Viele Organisationen behandeln Measures noch so, als wären sie bloß Zahlen mit einer hinterlegten Formel. Diese Sicht greift zu kurz. Kennzahlen sind in vielen Fällen vom Kontext abhängig, in dem sie gelesen werden.
Ein Prozentwert ist dafür ein einfaches Beispiel. Wer einen Umsatzanteil berechnet, braucht nicht nur einen Zähler, sondern auch die passende Gesamtmenge. Diese Gesamtmenge ist nicht allgemein gültig. Sie hängt davon ab, welche Filter gesetzt wurden, auf welcher Hierarchiestufe gearbeitet wird und welchen Ausschnitt jemand gerade betrachtet.
Dasselbe gilt für Zeitlogiken wie month-to-date (MTD), quarter-to-date (QTD) oder year-to-date (YTD). Solche Werte leben nicht von einer statischen Vorabberechnung, sondern davon, dass das Modell den jeweils aktiven Kontext sauber auflösen kann. Genau deshalb lassen sich viele Kennzahlen nicht sinnvoll vollständig vorberechnen, ohne dabei Flexibilität einzubüßen oder Variantenlogik zu vervielfachen.
Die tiefere Ursache liegt also nicht in einer fehlenden Formel, sondern in einem falschen Modellverständnis. Wer Kennzahlen nur als Ergebniswerte denkt, unterschätzt die Rolle des Modells als Berechnungsraum.
Gute Modelle denken nicht Berichte vor
In vielen BI-Umgebungen wird diese Lücke durch Sonderlogik im Bericht kompensiert. Einzelne Visualisierungen tragen dann ihre eigenen Regeln. Beziehungen bleiben implizit. Kennzahlen werden für feste Sichten vorbereitet. Das wirkt kurzfristig pragmatisch, erzeugt aber langfristig Starre.
Dann entsteht keine Analysefreiheit, sondern eine Sammlung vorverdrahteter Antworten.
Ein belastbares Modell folgt einer anderen Logik. Es versucht nicht, jeden Bericht vorwegzunehmen. Es organisiert Dimensionen, Beziehungen und Measures so, dass unterschiedliche Fragen auf demselben Fundament beantwortet werden können. Der Vorteil einer analytischen Datenbank oder eines semantischen Modells liegt genau darin: Nicht jede Sicht muss einzeln gebaut werden, wenn das zugrunde liegende Modell flexibel und fachlich sauber genug ist.
Damit verschiebt sich auch der Begriff von Freiheit. Freiheit in BI heißt nicht, beliebig Visuals zusammenzuklicken. Freiheit heißt, auf einem belastbaren Modell neue fachliche Fragen stellen zu können, ohne jedes Mal die Datenlogik neu zu erfinden.
Zwischen Sternschema und semantischem Modell entscheidet sich die Nutzbarkeit
Datenmodellierung ist deshalb nicht die dekorative Vorstufe des Dashboards. Sie ist der Ort, an dem sich entscheidet, ob Analyse später beweglich oder spröde wird. Das Sternschema schafft die fachliche Zielstruktur. Das semantische Modell macht diese Struktur analytisch lesbar und berechenbar.
Erst im Zusammenspiel beider Ebenen entsteht ein System, das nicht nur Daten bereitstellt, sondern unterschiedliche Sichten fachlich sauber tragen kann. Genau dort liegt die eigentliche Aufgabe von Datenmodellierung: nicht bloß Ordnung herzustellen, sondern Erkenntnisfähigkeit vorzubereiten.
🎧 Die komplette Folge findest du im thinkBI Podcast.

Musik: Great Podcast Intro (short & long) von Lundstroem
Quelle: freemusicarchive.org (Creative Commons) – https://freemusicarchive.org/music/lundstroem/songs-for-leona/great-podcast-intro-both-short-and-long-version-included/

