Las herramientas de análisis de bases de datos ayudan a los DBA a identificarLas discrepancias y las conexiones ilógicas entre los conjuntos de datos, para que puedan eliminarse de la base de datos. Sin embargo, la capacidad de las herramientas de análisis de bases de datos depende de la plataforma en la que se construye la base de datos. Por ejemplo, la base de datos relacional a pequeña escala creada en MS Access necesita muchas utilidades de análisis de bases de datos diferentes a las creadas con MySQL. Si está buscando una herramienta de análisis de base de datos todo en uno que pueda ayudarlo a identificar y limpiar entradas redundantes de la base de datos, es muy probable que encuentre una utilidad paga. Hoy descubrimos una utilidad de código abierto basada en Java llamada DataCleaner que implementa una variedad de análisis de bases de datos y conceptos de limpieza que incluyen Calidad de datos, Gestión de datos maestros, Perfiles de datosy Monitoreo de calidad de datos, para eliminar todos los conjuntos de datos superfluos delalmacén de datos especificado La aplicación admite una amplia gama de plataformas de bases de datos y archivos de datos, incluidos CSV, MS Excel (XLS y XLSX), MS Access, biblioteca SAS, base de datos DBase, archivo de ancho fijo, XML, base de datos OpenOffice, MonoDB, MySQL, Oracle y MS SQL Server .
Además, proporciona una conexión de muestracadenas y otras opciones para ayudarlo a crear rápidamente conexiones con su base de datos. Una vez que la base de datos está conectada o los conjuntos de datos se recuperan de la base de datos especificada, le permite ver completa Metadatos información de las tablas de bases de datos, lo que le permite modificar fácilmente los campos y filas requeridos. Además, incluye un extenso Filtros característica que puede ayudarlo a ver solo la parte requerida de la base de datos. Puede aplicar numerosos filtros condicionales en la base de datos, incluidos Iguales, filas máximas, verificación nula, rango de números, palabra única, coincidencia de patrón de cadena, y Rango de valor de cadena. También tiene la libertad de ajustar con filtros seleccionados para cumplir con los requisitos de minería de datos.
DataCleaner viene con un transformador característica que le permite preprocesar los datos para extraer, combinar y generar valores separados. El incorporado Analizador proporciona integral Calidad de datos y Perfiles de datos operaciones para ayudarlo a analizar el contenido de la base de datos seleccionada. Incluye una serie de características de análisis como Analizador booleano, distribución de juego de caracteres, analizador de brecha de datos, analizador de coincidencia, buscador de patrones, analizador de cadenas, día de la semana y distribución de valores y más.
La interfaz principal muestra el almacén de datos compatible.tipos. Todo lo que necesita es elegir el tipo de base de datos y configurar los detalles de la conexión. Por ejemplo, si desea limpiar y analizar la base de datos MySQL, ingrese el nombre de la base de datos, el nombre de la clase de unidad, la cadena de conexión y el nombre de usuario y contraseña. Puede abrir el archivo de base de datos de Excel o Access simplemente especificando la ruta completa. Una vez que se establece la conexión, agrega la base de datos a la lista. Ahora, verifique la base de datos que desea analizar y haga clic en Analizar.

La barra lateral izquierda contiene bases de datos de seleccionadosalmacén de datos, lo que le permite explorar los conjuntos de datos. Debe seleccionar los campos para realizar el análisis. Simplemente haga doble clic en los campos que desea incluir y los enumerará en Fuente lengüeta. Puede verificar los conjuntos de datos y su tipo, y eliminar los campos innecesarios.

Debajo Metadatos pestaña, encontrará toda la información de metadatos, incluida la tabla, la columna, la familia de tipos (en función de los datos almacenados), el tipo, el tipo nativo, el tamaño, la condición anulable y el estado del índice.

los Filtros La pestaña le permite incluir los filtros mencionados anteriormentepara extraer información específica de las columnas. Le permite agregar múltiples tipos de filtros a la lista, para que pueda filtrar fácilmente los conjuntos de datos requeridos. Una vez que haya agregado un filtro, contraiga la ventana del filtro y luego haga clic en Añadir filtro para elegir el tipo de filtro que desea usar.

Analizador es probablemente la característica más útil de lasolicitud. Como se mencionó anteriormente, le permite seleccionar numerosos tipos de análisis. No solo le proporciona un informe de análisis detallado, sino que también le permite crear gráficos de análisis. Simplemente seleccione el tipo de análisis requerido y complete la información requerida. Una vez hecho esto, haga clic en Ejecutar análisis.

Al hacer clic, comenzará a crear un informe de análisis. los Progreso La pestaña de información muestra todos los procesos que ejecuta mientras genera el análisis.

Puede hacer doble clic en el grafico botón presente en el primer campo para trazar los datos enla gráfica. DataCleaner le permite guardar los trabajos. Crea un archivo XML que contiene el informe de análisis. Los archivos de trabajo de análisis se pueden ver abriendo el archivo XML de Archivo -> Análisis abierto trabajo.

DataCleaner ofrece la opción de escribir datos durantediferentes etapas del análisis de datos. Por ejemplo. La función Filtros le permite escribir datos limpios en un archivo separado. Puede exportar los datos filtrados a un archivo CSV, crear una hoja de cálculo de Excel, crear una tabla de etapas o insertar los datos directamente en una tabla.

DataCleaner es un análisis de datos masivo yutilidad de limpieza que admite Windows, Linux y Mac OS X. Hemos intentado cubrir las características más destacadas de la aplicación, y podríamos haber perdido algunas herramientas y opciones útiles. Puede encontrar manuales de ayuda detallados y guías de uso en la página del producto. Cabe señalar que requiere el último JRE (Java Runtime Environment) para funcionar.
Descargar DataCleaner
Comentarios