Datenprofilerstellung in Power Query

Es kann schwierig sein, Probleme mit der Datenqualität, wie Fehler, leere Werte und Ausreißer zu bestimmen.
Mit der Datenprofilerstellung in Power Query, können solche Probleme auf einfache Weise identifiziert werden.

Im Power Query Editor befindet sich unter den Spaltenüberschriften die Qualitätsleiste, die angibt, ob Fehlerwerte oder leere Werte gefunden wurden.

Datenqualitätsleiste in Power Query

Über das Register Ansicht können Sie weitere Datenprofilinformationen für die Datenprofilerstellung aktivieren. Wenn Sie die Option Spaltenqualität aktivieren, wird Ihnen die Anzahl der Fehler, der gültigen oder leeren Werte angezeigt.
Darüber hinaus können Sie Aktion direkt aus dem Flyout-Menü ausführen, um Fehler zu entfernen.

Spaltenqualität in Power Query

Eine weitere Funktion ist die Spaltenverteilung, die Sie auch auf der Registerkarte Ansicht aktivieren können. Mithilfe der Spaltenverteilung können Sie einen Eindruck von der Gesamtverteilung der Werte in einer Spalte (in Ihrer Datenvorschau) erhalten, einschließlich der Anzahl der unterschiedlichen Werte und der eindeutigen Werte.

Spaltenverteilung in Power Query

Auch in dieser Ansicht können Sie über das Flyout-Menü Maßnahmen ergreifen, um Duplikate zu entfernen.

Maßnahme Spaltenverteilung in Power Query

Zusätzlich zu den Inline-Grafiken für die Spaltenqualität und der Werteverteilung, kann über die Funktion Spaltenprofil ein detailliertere Profilerstellung für eine bestimmte Spalte aktiviert werden.

Die Spaltenstatistik zeigt die Anzahl der Fehler, leere, gültige, duplizierte und eindeutige Werte. So wie Wertverteilungsmaße wie Min / Max / Average / Median usw.

Die Werteverteilung ist die größere Version des Inline-Werteverteilungshistogramms, einschließlich der Möglichkeit, über ein Flyout-Menü Werte beizubehalten oder zu entfernen, wodurch der entsprechende Filter-Schritt in Ihrer Abfrage generiert wird.

Spaltenprofil in Power Query

In der Werteverteilung können Sie die Werte je nach Spaltentyp gruppieren.

Spaltenprofil Gruppierung der Werteverteilung

Weiter ist es möglich von der Spaltenprofilerstellung basierend auf obersten 1000 Zeilen (Datenvorschauf) auf die Spaltenprofilerstellung basierend auf gesamtem Dataset zu wechseln. Diese Option kann in der Statusleiste unten links geändert werden.

Datenbasis für Datenprofilerstellung

Quellen:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

I accept that my given data and my IP address is sent to a server in the USA only for the purpose of spam prevention through the Akismet program.More information on Akismet and GDPR.