- - Програмне забезпечення DataCleaner - це все-в-одному програмне забезпечення аналізу даних та очищення баз даних

DataCleaner - це все-в-одному програмне забезпечення для аналізу даних та баз даних

Інструменти аналізу баз даних допомагають DBA у визначенніневідповідності та нелогічні зв’язки між наборами даних, щоб їх можна було видалити з бази даних. Однак можливості інструментів аналізу баз даних залежать від платформи, на якій будується база даних. Наприклад, для дрібномасштабної реляційної бази даних, створеної в MS Access, потрібна велика кількість різних утиліт аналізу DB, ніж одна, створена за допомогою MySQL. Якщо ви шукаєте інструмент аналізу баз даних "все в одному", який допоможе вам визначити та очистити зайві записи з бази даних, шанси на те, що ви потрапляєте на платну утиліту, є високою. Сьогодні ми відкрили утиліту з відкритим кодом, утиліта на базі Java, яка називається DataCleaner що реалізує різноманітні аналізи та очищення баз даних, в тому числі Якість даних, Головне управління даними, Профілювання даних, і Моніторинг якості даних, щоб видалити всі зайві набори данихвказаний сховище даних. Додаток підтримує широкий спектр платформ баз даних і файлів даних, включаючи CSV, MS Excel (XLS і XLSX), MS Access, бібліотеку SAS, базу даних DBase, файл з фіксованою шириною, XML, базу даних OpenOffice, MonoDB, MySQL, Oracle і MS SQL Server .

Крім того, він забезпечує зразкове з'єднаннярядки та інші параметри, які допоможуть вам швидко створити з'єднання зі своєю базою даних. Після підключення бази даних або отримання набору даних із заданої БД вона дозволяє переглядати завершені Метадані інформація таблиць БД, що дозволяє легко змінювати необхідні поля та рядки. Більше того, вона включає велику Фільтри функція, яка може допомогти вам переглянути лише необхідну частину бази даних. Ви можете застосувати до бази даних численні умовні фільтри, зокрема Дорівнює, Макс. Рядків, Нульова перевірка, Діапазон чисел, Одне слово, Рядок узор збігається, і Діапазон значень рядків. Ви також можете налаштувати вибрані фільтри, щоб відповідати вимогам вилучення даних.

DataCleaner поставляється з трансформатор функція, яка дозволяє попередньо обробити дані для вилучення, об'єднання та генерації окремих значень. Вбудований Аналізатор забезпечує всебічну Якість даних і Профілювання даних операції, які допоможуть вам проаналізувати вміст вибраної бази даних. Він включає ряд особливостей аналізу, таких як Булевий аналізатор, Розподіл наборів символів, Аналізатор розривів даних, Аналізатор відповідності, Шукальник візерунків, Аналізатор струн, Розподіл тижня та значення і більше.

Основний інтерфейс показує підтримуваний сховище данихтипи. Все, що вам потрібно, це вибрати тип бази даних та налаштувати деталі з'єднання. Наприклад, якщо ви хочете очистити та проаналізувати базу даних MySQL, введіть ім’я бази даних, назву класу Drive, рядок з'єднання та ім’я користувача та пароль. Ви можете відкрити файл бази даних Excel або Access, просто вказавши повний шлях. Після встановлення з'єднання він додає базу даних до списку. Тепер перевірте базу даних, яку ви хочете проаналізувати, і натисніть Проаналізуйте.

аналіз головного вікна

У лівій бічній панелі зберігаються вибрані бази данихсховище даних, що дозволяє вивчити набори даних. Для аналізу потрібно вибрати поля. Просто двічі клацніть поля, які ви хочете включити, і вони перерахують їх Джерело вкладка. Ви можете перевірити набори даних та їх тип та видалити непотрібні поля.

джерело очищення даних

Під Метадані на вкладці ви знайдете всю інформацію метаданих, включаючи таблицю, стовпець, сімейство типів (на основі збережених даних), тип, рідний тип, розмір, стан нульового стану, статус індексу.

метадані

The Фільтри вкладка дозволяє включати будь-які вищезгадані фільтридля отримання конкретної інформації з стовпців. Це дозволяє додавати до списку кілька типів фільтрів, щоб ви могли легко відфільтрувати необхідні набори даних. Щойно ви додали фільтр, згорніть вікно фільтра та натисніть кнопку Додати фільтр вибрати тип фільтра, який ви хочете використовувати.

фільтри

Аналізатор це, мабуть, найбільш корисна особливістьзастосування. Як було сказано раніше, це дозволяє вибирати численні види аналізу. Він не тільки дає детальний звіт про аналіз, але також дозволяє створювати графіки аналізу. Просто виберіть необхідний тип аналізу та заповніть необхідну інформацію. Після завершення натисніть Виконати аналіз.

запустити аналіз

Після натискання він почне створювати звіт про аналіз. The Прогрес на інформаційній вкладці відображаються всі процеси, які вона виконується під час генерації аналізу.

нові 3

Можна двічі клацнути на графік кнопка присутня в першому полі для побудови даних награфік. DataCleaner дозволяє зберегти завдання. Він створює XML-файл, який містить звіт про аналіз. Файли завдань аналізу можна переглянути, відкривши файл XML з Файл -> Відкритий аналіз робота.

нові

DataCleaner пропонує опцію запису даних протягомрізні етапи аналізу даних. Наприклад. Функція Фільтри дозволяє записувати очищені дані в окремий файл. Ви можете експортувати відфільтровані дані у файл CSV, створити таблицю Excel, скласти таблицю постановки або вставити дані безпосередньо в таблицю.

файл CSV

DataCleaner - це масштабний аналіз даних таутиліта для чищення, яка підтримує Windows, Linux та Mac OS X. Ми намагалися охопити найважливіші функції програми і, можливо, пропустили кілька корисних інструментів та варіантів. Ви можете знайти докладні посібники з довідки та посібники з використання на сторінці продукту. Слід зазначити, що для роботи потрібен останній JRE (Java Runtime Environment).

Завантажте DataCleaner

Коментарі