Data Cleaning: Fallstricke und Lösungen

Mit dem stetig wachsenden Interesse an Machine Learning und Künstlicher Intelligenz sehen sich Unternehmen auch immer häufiger mit der unbefriedigenden Qualität ihrer Daten konfrontiert. Diese Erkenntnis wird entweder frühzeitig mit einem strukturierten Ansatz gewonnen oder zu spät, wenn die schlechte Datenqualität bereits die Ursache für schlecht funktionierende Datenmodelle ist. In beiden Fällen sollte der nächste Schritt eine methodische Untersuchung der verfügbaren Daten sein, gefolgt von einer Reihe von Schritten zur Behebung der identifizierten Probleme. In diesem Artikel möchte ich Ihnen einen Überblick über häufige Datenqualitätsprobleme und Strategien zu deren Behebung [...]