データベース分析ツールは、DBAの識別に役立ちますデータベースから削除できるように、データセット間の不一致および非論理的な接続。ただし、データベース分析ツールの機能は、データベースが構築されるプラットフォームに依存します。たとえば、MS Accessで作成された小規模なリレーショナルデータベースには、MySQLを使用して作成されたものとはまったく異なる多くのDB分析ユーティリティが必要です。データベースの冗長エントリを特定してクリーンアップするのに役立つオールインワンのデータベース分析ツールを探している場合、有料のユーティリティに出くわす可能性が高くなります。今日、私たちはオープンソースのJavaベースのユーティリティを発見しました DataCleaner さまざまなデータベース分析とクリーニングの概念を実装します データ品質, マスターデータ管理, データプロファイリング、そして データ品質監視、すべての余分なデータセットを削除するには指定されたデータストア。アプリケーションは、CSV、MS Excel(XLSおよびXLSX)、MS Access、SASライブラリ、DBaseデータベース、固定幅ファイル、XML、OpenOfficeデータベース、MonoDB、MySQL、OracleおよびMS SQL Serverを含む幅広いデータベースプラットフォームとデータファイルをサポートします。 。
さらに、サンプル接続を提供しますデータベースとの接続をすばやく作成するのに役立つ文字列およびその他のオプション。データベースが接続されるか、指定されたDBからデータセットが取得されると、完全なビューを表示できます メタデータ DBテーブルの情報。必要なフィールドと行を簡単に変更できます。さらに、それは大規模な フィルター データベースの必要な部分のみを表示するのに役立つ機能。データベースには、次のような多数の条件フィルターを適用できます。 等しい、最大行、Nullチェック、数値範囲、単一単語、文字列パターン一致、 そして 文字列値の範囲。データマイニング要件を満たすために、選択したフィルターを微調整する自由もあります。
DataCleanerには 変成器 データを前処理して個別の値を抽出、結合、生成できる機能。組み込み アナライザ 包括的な提供 データ品質 そして データプロファイリング 選択したデータベースのコンテンツの分析を支援する操作。以下のような多くの分析機能が含まれています。 ブールアナライザー、キャラクターセット分布、データギャップアナライザー、マッチングアナライザー、パターンファインダー、ストリングアナライザー、曜日および値の分布 もっと。
メインインターフェイスには、サポートされているデータストアが表示されますタイプ。必要なのは、データベースの種類を選択し、接続の詳細を構成することです。たとえば、MySQLデータベースを削除して分析する場合は、データベース名、ドライブクラス名、接続文字列、ユーザー名とパスワードを入力します。完全なパスを指定するだけで、ExcelまたはAccessデータベースファイルを開くことができます。接続が確立されると、データベースがリストに追加されます。次に、分析するデータベースをチェックして、クリックします 分析する.
左側のサイドバーには、選択したデータベースデータストア。データセットを探索できます。分析を実行するには、フィールドを選択する必要があります。含めるフィールドをダブルクリックするだけで、リストに表示されます ソース タブ。データセットとそのタイプを確認し、不要なフィールドを削除できます。
下 メタデータ タブには、テーブル、列、タイプファミリー(保存データに基づく)、タイプ、ネイティブタイプ、サイズ、Nullable条件、インデックスステータスなど、すべてのメタデータ情報があります。
の フィルター タブでは、前述のフィルターを含めることができます列から特定の情報を抽出します。リストに複数のタイプのフィルターを追加できるため、必要なデータセットを簡単にフィルターできます。フィルターを追加したら、フィルターウィンドウを折りたたみ、クリックします フィルターを追加 使用するフィルターのタイプを選択します。
アナライザ おそらく最も便利な機能です応用。前に述べたように、これにより、さまざまな種類の分析を選択できます。詳細な分析レポートを提供するだけでなく、分析グラフを作成することもできます。必要な分析タイプを選択して、必要な情報を入力してください。完了したら、クリックします 分析を実行する.
クリックすると、分析レポートの作成が開始されます。の 進捗 情報タブには、分析の生成中に実行されるすべてのプロセスが表示されます。
ダブルクリックできます グラフ データをプロットする最初のフィールドにあるボタングラフ。 DataCleanerでは、ジョブを保存できます。分析レポートを保持するXMLファイルを作成します。分析ジョブファイルは、XMLファイルを開いて表示できます。 ファイル->分析を開く ジョブ。
DataCleanerは、データ書き込みオプションを提供しますデータ分析のさまざまな段階。例えば。フィルタ機能を使用すると、クレンジングされたデータを別のファイルに書き込むことができます。フィルター処理したデータをCSVファイルにエクスポートしたり、Excelスプレッドシートを作成したり、ステージングテーブルを作成したり、データをテーブルに直接挿入したりできます。
DataCleanerは大規模なデータ分析であり、Windows、Linux、およびMac OS Xをサポートするクリーニングユーティリティです。アプリケーションの最も顕著な機能をカバーしようとしましたが、いくつかの便利なツールやオプションを見逃していた可能性があります。製品ページから詳細なヘルプマニュアルと使用ガイドを見つけることができます。動作するには最新のJRE(Java Runtime Environment)が必要であることに注意する必要があります。
ダウンロードDataCleaner
コメント