Datenbankanalysetools helfen Datenbankadministratoren bei der Identifizierungdie Diskrepanzen und unlogischen Verbindungen zwischen Datensätzen, damit sie aus der Datenbank entfernt werden können. Die Funktionen von Datenbankanalysetools hängen jedoch von der Plattform ab, auf der die Datenbank aufgebaut ist. Beispielsweise benötigt eine kleine relationale Datenbank, die mit MS Access erstellt wurde, ein ganz anderes Dienstprogramm für die DB-Analyse als eine mit MySQL erstellte Datenbank. Wenn Sie nach einem All-in-One-Datenbankanalysetool suchen, mit dem Sie redundante Einträge aus der Datenbank identifizieren und bereinigen können, ist die Wahrscheinlichkeit groß, dass Sie auf ein kostenpflichtiges Dienstprogramm stoßen. Heute haben wir ein Java-basiertes Open-Source-Dienstprogramm namens entdeckt DataCleaner das implementiert eine Vielzahl von Datenbankanalyse und Reinigungskonzepten einschließlich Datenqualität, Stammdatenverwaltung, Datenprofilerstellung, und Datenqualitätsüberwachung, um alle überflüssigen Datensätze zu entfernenangegebener Datenspeicher. Die Anwendung unterstützt eine Vielzahl von Datenbankplattformen und Datendateien, einschließlich CSV, MS Excel (XLS und XLSX), MS Access, SAS-Bibliothek, DBase-Datenbank, Datei mit fester Breite, XML, OpenOffice-Datenbank, MonoDB, MySQL, Oracle und MS SQL Server .
Zusätzlich bietet es eine BeispielverbindungZeichenfolgen und andere Optionen, mit denen Sie schnell Verbindungen mit Ihrer Datenbank herstellen können. Sobald die Datenbank verbunden ist oder Datensätze aus der angegebenen Datenbank abgerufen wurden, können Sie sie vollständig anzeigen Metadaten Informationen zu DB-Tabellen, mit denen Sie die erforderlichen Felder und Zeilen einfach ändern können. Darüber hinaus enthält es eine umfangreiche Filter Funktion, mit der Sie möglicherweise nur den erforderlichen Teil der Datenbank anzeigen können. Sie können zahlreiche bedingte Filter auf die Datenbank anwenden, einschließlich Gleich, Max. Zeilen, Null-Check, Zahlenbereich, Einzelwort, String-Musterübereinstimmung, und String-Wertebereich. Sie haben auch die Freiheit, mit ausgewählten Filtern Anpassungen vorzunehmen, um die Data Mining-Anforderungen zu erfüllen.
DataCleaner wird mit einem Transformator Funktion, mit der Sie die Daten vorverarbeiten können, um separate Werte zu extrahieren, zu kombinieren und zu generieren. Das eingebaute Analyzer bietet umfassende Datenqualität und Datenprofilerstellung Operationen, die Sie bei der Analyse des Inhalts der ausgewählten Datenbank unterstützen. Es enthält eine Reihe von Analysefunktionen wie z Boolescher Analysator, Zeichensatzverteilung, Datenlücken-Analysator, Matching-Analysator, Pattern-Finder, String-Analysator, Wochentags- und Werteverteilung und mehr.
Die Hauptschnittstelle zeigt den unterstützten DatenspeicherTypen. Sie müssen lediglich den Datenbanktyp auswählen und die Verbindungsdetails konfigurieren. Wenn Sie beispielsweise die MySQL-Datenbank bereinigen und analysieren möchten, geben Sie den Datenbanknamen, den Laufwerksklassennamen, die Verbindungszeichenfolge sowie den Benutzernamen und das Kennwort ein. Sie können eine Excel- oder Access-Datenbankdatei öffnen, indem Sie nur den vollständigen Pfad angeben. Sobald die Verbindung hergestellt ist, wird die Datenbank zur Liste hinzugefügt. Überprüfen Sie nun die Datenbank, die Sie analysieren möchten, und klicken Sie auf Analysieren.

Die linke Seitenleiste enthält Datenbanken von ausgewähltenDatenspeicher, mit dem Sie die Datasets durchsuchen können. Sie müssen die Felder auswählen, um die Analyse durchzuführen. Doppelklicken Sie einfach auf die Felder, die Sie einschließen möchten. Daraufhin werden sie aufgelistet Quelle Tab. Sie können die Datasets und ihren Typ überprüfen und alle unnötigen Felder entfernen.

Unter Metadaten Auf dieser Registerkarte finden Sie alle Metadateninformationen, einschließlich Tabelle, Spalte, Typfamilie (basierend auf gespeicherten Daten), Typ, Eingeborener Typ, Größe, Nullwertbedingung und Indexstatus.

Das Filter Auf der Registerkarte können Sie alle oben genannten Filter einfügenum bestimmte Informationen aus Spalten zu extrahieren. Sie können der Liste mehrere Filtertypen hinzufügen, sodass Sie die erforderlichen Datensätze problemlos herausfiltern können. Wenn Sie einen Filter hinzugefügt haben, reduzieren Sie das Filterfenster und klicken Sie auf Filter hinzufügen um den Filtertyp auszuwählen, den Sie verwenden möchten.

Analyzer ist wahrscheinlich das nützlichste Merkmal derAnwendung. Wie bereits erwähnt, können Sie zahlreiche Arten von Analysen auswählen. Sie erhalten nicht nur einen detaillierten Analysebericht, sondern können auch Analysediagramme erstellen. Wählen Sie einfach den gewünschten Analysetyp aus und geben Sie die erforderlichen Informationen ein. Sobald Sie fertig sind, klicken Sie auf Führen Sie die Analyse durch.

Nach dem Klicken wird ein Analysebericht erstellt. Das Fortschritt Die Registerkarte Informationen zeigt alle Prozesse an, die während der Erstellung der Analyse ausgeführt wurden.

Sie können auf das Symbol doppelklicken Graph Schaltfläche im ersten Feld zum Zeichnen der Datender Graph. Mit DataCleaner können Sie die Jobs speichern. Es wird eine XML-Datei erstellt, die den Analysebericht enthält. Analyseauftragsdateien können angezeigt werden, indem Sie die XML-Datei von öffnen Datei -> Analyse öffnen Job.

DataCleaner bietet die Option zum Schreiben von Daten währendverschiedene Stadien der Datenanalyse. Zum Beispiel. Mit der Filterfunktion können Sie bereinigte Daten in eine separate Datei schreiben. Sie können die gefilterten Daten in eine CSV-Datei exportieren, eine Excel-Tabelle erstellen, eine Staging-Tabelle erstellen oder die Daten direkt in eine Tabelle einfügen.

DataCleaner ist eine massive Datenanalyse undReinigungsprogramm, das Windows, Linux und Mac OS X unterstützt. Wir haben versucht, die hervorstechendsten Funktionen der Anwendung zu beschreiben, und möglicherweise einige nützliche Tools und Optionen verpasst. Auf der Produktseite finden Sie ausführliche Handbücher und Bedienungsanleitungen. Es muss beachtet werden, dass es die neueste JRE (Java Runtime Environment) erfordert, um zu funktionieren.
Laden Sie DataCleaner herunter
Bemerkungen