- - DataCleaner é um software completo para análise de dados e limpeza de banco de dados

DataCleaner é um software completo para análise de dados e limpeza de banco de dados

As ferramentas de análise de banco de dados ajudam os DBAs a identificaras discrepâncias e conexões ilógicas entre conjuntos de dados, para que possam ser removidos do banco de dados. No entanto, a capacidade das ferramentas de análise de banco de dados depende da plataforma na qual o banco de dados é construído. Por exemplo, o banco de dados relacional em pequena escala criado no MS Access precisa de muitos utilitários de análise de banco de dados diferentes dos criados com o MySQL. Se você procura uma ferramenta de análise de banco de dados tudo em um que possa ajudá-lo a identificar e limpar entradas redundantes do banco de dados, as chances de você encontrar um utilitário pago são altas. Hoje, descobrimos um utilitário de código aberto baseado em java chamado DataCleaner que implementa uma variedade de conceitos de análise e limpeza de banco de dados, incluindo Qualidade dos dados, Gerenciamento de dados mestre, Criação de perfil de dadose Monitoramento da qualidade dos dados, para remover todos os conjuntos de dados supérfluos doarmazenamento de dados especificado. O aplicativo suporta uma ampla gama de plataformas de banco de dados e arquivos de dados, incluindo CSV, MS Excel (XLS e XLSX), MS Access, biblioteca SAS, banco de dados DBase, arquivo de largura fixa, XML, banco de dados OpenOffice, MonoDB, MySQL, Oracle e MS SQL Server .

Além disso, ele fornece conexão de amostrastrings e outras opções para ajudá-lo a criar conexões rapidamente com seu banco de dados. Depois que o banco de dados é conectado ou os conjuntos de dados são recuperados do banco de dados especificado, ele permite visualizar Metadados informações de tabelas de banco de dados, permitindo modificar facilmente os campos e linhas necessários. Além disso, inclui uma extensa Filtros recurso que pode ajudá-lo a exibir apenas a parte necessária do banco de dados. Você pode aplicar vários filtros condicionais no banco de dados, incluindo Igual a, Máximo de linhas, Verificação nula, Intervalo de números, Palavra única, Correspondência de padrão de sequência, e Intervalo de valor da string. Você também tem a liberdade de ajustar os filtros selecionados para atender aos requisitos de mineração de dados.

O DataCleaner vem com um transformador recurso que permite pré-processar os dados para extrair, combinar e gerar valores separados. O built-in Analisador fornece abrangente Qualidade dos dados e Criação de perfil de dados operações para ajudá-lo a analisar o conteúdo do banco de dados selecionado. Inclui vários recursos de análise, como Analisador booleano, Distribuição de conjuntos de caracteres, Analisador de lacunas de dados, Analisador de correspondência, Localizador de padrões, Analisador de cordas, Distribuição por dia da semana e Valor e mais.

A interface principal mostra o armazenamento de dados suportadotipos. Tudo que você precisa é escolher o tipo de banco de dados e configurar os detalhes da conexão. Por exemplo, se você deseja limpar e analisar o banco de dados MySQL, insira Nome do banco de dados, Nome da classe do Drive, cadeia de conexão e nome de usuário e senha. Você pode abrir o arquivo de banco de dados do Excel ou Access, especificando apenas o caminho completo. Depois que a conexão é estabelecida, ele adiciona o banco de dados à lista. Agora, verifique o banco de dados que deseja analisar e clique em Analisar.

janela principal analisar

A barra lateral esquerda contém bancos de dados dosarmazenamento de dados, permitindo explorar os conjuntos de dados. Você precisa selecionar os campos para realizar a análise. Basta clicar duas vezes nos campos que deseja incluir e eles serão listados em Fonte aba. Você pode verificar os conjuntos de dados e seu tipo e remover quaisquer campos desnecessários.

fonte do datacleaner

Sob Metadados Na guia, você encontrará todas as informações de metadados, incluindo Tabela, Coluna, Família de tipos (com base nos dados armazenados), Tipo, Tipo nativo, Tamanho, Condição anulável, Status do índice.

metadados

o Filtros A guia permite incluir os filtros mencionados acimaextrair informações específicas de colunas. Permite adicionar vários tipos de filtros à lista, para que você possa filtrar facilmente os conjuntos de dados necessários. Depois de adicionar um filtro, feche a janela do filtro e clique em Adicionar filtro para escolher o tipo de filtro que você deseja usar.

filtros

Analisador é provavelmente o recurso mais útil doinscrição. Como mencionado anteriormente, ele permite selecionar vários tipos de análise. Além de fornecer um relatório de análise detalhado, também permite criar gráficos de análise. Basta selecionar o tipo de análise necessário e preencher as informações necessárias. Depois de concluído, clique em Executar análise.

executar análise

Ao clicar, ele começará a criar um relatório de análise. o Progresso A guia Informações mostra todos os processos executados ao gerar a análise.

novo 3

Você pode clicar duas vezes no gráfico presente no primeiro campo para plotar os dadoso gráfico. O DataCleaner permite salvar os trabalhos. Ele cria um arquivo XML que contém o relatório de análise. Os arquivos de trabalho de análise podem ser visualizados abrindo o arquivo XML em Arquivo -> Análise aberta trabalho.

Novo

O DataCleaner oferece opção de gravação de dados durantediferentes estágios da análise dos dados. Por exemplo. o recurso Filtros permite gravar dados limpos em um arquivo separado. Você pode exportar os dados filtrados para o arquivo CSV, criar planilha do Excel, criar tabela de preparo ou inserir os dados diretamente em uma tabela.

arquivo csv

O DataCleaner é uma análise massiva de dados eutilitário de limpeza que suporta Windows, Linux e Mac OS X. Tentamos abordar os recursos mais importantes do aplicativo e podemos ter perdido algumas ferramentas e opções úteis. Você pode encontrar manuais de ajuda detalhados e guias de uso na página do produto. Deve-se notar que ele requer que o JRE (Java Runtime Environment) mais recente funcione.

Baixar DataCleaner

Comentários