Les outils d’analyse de base de données aident les DBA à identifierles divergences et les connexions illogiques entre les ensembles de données, de sorte qu'ils puissent être supprimés de la base de données. Cependant, la capacité des outils d'analyse de base de données dépend de la plateforme sur laquelle la base de données est construite. Par exemple, une base de données relationnelle à petite échelle créée sur MS Access nécessite de nombreux utilitaires d'analyse de base de données différents de ceux créés avec MySQL. Si vous recherchez un outil d'analyse de base de données tout-en-un qui puisse vous aider à identifier et à nettoyer les entrées redondantes de la base de données, vos chances de tomber sur un utilitaire payant sont élevées. Aujourd'hui, nous avons découvert un utilitaire open source basé sur Java, appelé DataCleaner qui met en œuvre une variété de concepts d'analyse de base de données et de nettoyage, y compris Qualité des données, Gestion des données de référence, Profilage des données, et Surveillance de la qualité des données, supprimer toutes les données superflues de lamagasin de données spécifié. L'application prend en charge un large éventail de plates-formes de bases de données et de fichiers de données, notamment CSV, MS Excel (XLS et XLSX), MS Access, bibliothèque SAS, base de données DBase, fichier à largeur fixe, XML, base de données OpenOffice, MonoDB, MySQL, Oracle et MS SQL Server. .
De plus, il fournit un exemple de connexiondes chaînes et d'autres options pour vous aider à créer rapidement des connexions avec votre base de données. Une fois la base de données connectée ou les fichiers récupérés à partir de la base de données spécifiée, vous pouvez visualiser Métadonnées informations sur les tables de base de données, vous permettant de modifier facilement les champs et les lignes obligatoires. De plus, il comprend une vaste Les filtres fonctionnalité qui peut vous aider à afficher uniquement la partie requise de la base de données. Vous pouvez appliquer de nombreux filtres conditionnels à la base de données, notamment Égal, nombre maximal de lignes, contrôle nul, plage de nombres, mot unique, correspondance de modèle de chaîne, et Chaîne de valeur de chaîne. Vous avez également la liberté de modifier les filtres sélectionnés pour répondre aux exigences de l'exploration de données.
DataCleaner est livré avec un transformateur fonctionnalité qui vous permet de pré-traiter les données pour extraire, combiner et générer des valeurs séparées. Le intégré Analyseur fournit complète Qualité des données et Profilage des données opérations pour vous aider à analyser le contenu de la base de données sélectionnée. Il inclut un certain nombre de fonctionnalités d'analyse telles que Analyseur booléen, Distribution de jeux de caractères, Analyseur d'écart de données, Analyseur d'appariement, Recherche de modèle, Analyseur de chaînes, Distribution en semaine et Valeur et plus.
L'interface principale affiche le magasin de données pris en chargeles types. Tout ce dont vous avez besoin est de choisir le type de base de données et de configurer les détails de la connexion. Par exemple, si vous souhaitez nettoyer et analyser la base de données MySQL, entrez le nom de la base de données, le nom de la classe de lecteur, la chaîne de connexion, le nom d'utilisateur et le mot de passe. Vous pouvez ouvrir le fichier de base de données Excel ou Access en spécifiant simplement le chemin complet. Une fois la connexion établie, la base de données est ajoutée à la liste. Maintenant, cochez la base de données que vous souhaitez analyser, puis cliquez sur Analyser.

La barre latérale gauche contient les bases de données debanque de données, vous permettant d’explorer les jeux de données. Vous devez sélectionner les champs pour effectuer l'analyse. Il suffit de double-cliquer sur les champs que vous souhaitez inclure et ils seront listés dans La source languette. Vous pouvez vérifier les jeux de données et leur type, et supprimer tous les champs inutiles.

Sous Métadonnées onglet, vous trouverez toutes les informations de métadonnées, y compris les tables, colonnes, familles de types (basées sur les données stockées), type, type natif, taille, condition Nullable, statut d’index.

le Les filtres l'onglet vous permet d'inclure tous les filtres susmentionnésextraire des informations spécifiques des colonnes. Il vous permet d'ajouter plusieurs types de filtres à la liste, de sorte que vous puissiez facilement filtrer les ensembles de données requis. Une fois que vous avez ajouté un filtre, réduisez la fenêtre du filtre, puis cliquez sur Ajouter un filtre choisir le type de filtre que vous souhaitez utiliser.

Analyseur est probablement la caractéristique la plus utile de laapplication. Comme mentionné précédemment, il vous permet de sélectionner de nombreux types d’analyses. Cela vous donne non seulement un rapport d'analyse détaillé, mais vous permet également de créer des graphiques d'analyse. Il suffit de sélectionner le type d'analyse requis et de renseigner les informations requises. Une fois terminé, cliquez sur Analyse d'exécution.

Au clic, il commencera à créer un rapport d'analyse. le Le progrès L'onglet Informations affiche tous les processus qu'il exécute lors de la génération de l'analyse.

Vous pouvez double-cliquer sur le graphique bouton présent dans le premier champ pour tracer les données surle graphique. DataCleaner vous permet de sauvegarder les travaux. Il crée un fichier XML contenant le rapport d'analyse. Les fichiers de travail d'analyse peuvent être visualisés en ouvrant le fichier XML à partir de Fichier -> Ouvrir l'analyse emploi.

DataCleaner offre l'option d'écriture de données pendantdifférentes étapes de l'analyse des données. Par exemple. la fonction Filtres vous permet d'écrire des données nettoyées dans un fichier séparé. Vous pouvez exporter les données filtrées dans un fichier CSV, créer une feuille de calcul Excel, créer un tableau intermédiaire ou insérer les données directement dans un tableau.

DataCleaner est une analyse de données massive etutilitaire de nettoyage prenant en charge Windows, Linux et Mac OS X. Nous avons essayé de couvrir les fonctionnalités les plus importantes de l’application et avons peut-être oublié quelques outils et options utiles. Vous pouvez trouver des manuels d'aide détaillés et des guides d'utilisation à partir de la page du produit. Il est à noter que le bon fonctionnement de JRE (Java Runtime Environment) est nécessaire.
Télécharger DataCleaner
commentaires