- - DataCleaner je software pro analýzu dat a čištění databází typu vše v jednom

DataCleaner je software pro analýzu dat a čištění databází typu vše v jednom

Nástroje pro analýzu databází pomáhají DBA při identifikacinesrovnalosti a nelogické souvislosti mezi datovými sadami, aby mohly být odstraněny z databáze. Schopnost nástrojů pro analýzu databáze však závisí na platformě, na které je databáze postavena. Například malá relační databáze vytvořená v MS Access potřebuje spoustu různých nástrojů pro analýzu DB, než která byla vytvořena pomocí MySQL. Pokud hledáte nástroj pro analýzu databáze typu all-in-one, který vám pomůže identifikovat a vyčistit nadbytečné položky z databáze, šance, že narazíte na placený nástroj, jsou vysoké. Dnes jsme objevili otevřený zdrojový program s názvem java DataCleaner který implementuje celou řadu databázových analýz a konceptů čištění, včetně Kvalita dat, Správa hlavních dat, Profilování dat, a Monitorování kvality dat, odstranit všechny nadbytečné datové sady z internetuzadané úložiště dat. Aplikace podporuje širokou škálu databázových platforem a datových souborů včetně CSV, MS Excel (XLS a XLSX), MS Access, knihovny SAS, databáze DBase, souboru s pevnou šířkou, XML, databáze OpenOffice, MonoDB, MySQL, Oracle a MS SQL Server .

Navíc poskytuje ukázkové připojenířetězce a další možnosti, které vám pomohou rychle vytvořit připojení k vaší databázi. Jakmile je databáze připojena nebo jsou datové sady načteny ze zadané DB, umožňuje zobrazit kompletní Metadata informace o tabulkách DB, což vám umožní snadno upravit požadovaná pole a řádky. Navíc zahrnuje rozsáhlé Filtry funkce, která vám může pomoci zobrazit pouze požadovanou část databáze. V databázi můžete použít řadu podmíněných filtrů Rovná se, Max. Řádky, Kontrola nulových hodnot, Rozsah čísel, Jedno slovo, Shoda vzorů řetězců, a Rozsah hodnot řetězce. Máte také možnost vyladit vybrané filtry tak, aby splňovaly požadavky na dolování dat.

DataCleaner přichází s transformátor funkce, která vám umožní předem zpracovat data pro extrahování, kombinování a generování samostatných hodnot. Vestavěný Analyzátor poskytuje komplexní Kvalita dat a Profilování dat operace, které vám pomohou při analýze obsahu vybrané databáze. Obsahuje řadu analytických funkcí, jako je Booleovský analyzátor, distribuce znakových sad, analyzátor datových mezer, porovnávací analyzátor, vyhledávač vzorků, Stringový analyzátor, den v týdnu a distribuce hodnot a více.

Hlavní rozhraní zobrazuje podporované datové úložištětypy. Vše, co potřebujete, je vybrat typ databáze a nakonfigurovat podrobnosti připojení. Pokud například chcete vyčistit a analyzovat databázi MySQL, zadejte Název databáze, Název třídy Drive, připojovací řetězec a uživatelské jméno a heslo. Soubor databáze Excel nebo Access můžete otevřít pouhým zadáním úplné cesty. Po navázání připojení přidá databázi do seznamu. Nyní zkontrolujte databázi, kterou chcete analyzovat, a klikněte na Analyzovat.

analýza hlavního okna

Levý postranní panel obsahuje databáze z vybranýchdatastore, což vám umožní prozkoumat datové sady. Chcete-li provést analýzu, musíte vybrat pole. Stačí dvakrát kliknout na pole, která chcete zahrnout, a zobrazí je v seznamu Zdroj tab. Můžete zkontrolovat datové sady a jejich typ a odstranit všechna nepotřebná pole.

zdroj datacleaner

Pod Metadata Na této kartě najdete všechny informace o metadatech, včetně tabulky, sloupce, rodiny typů (na základě uložených dat), typu, nativního typu, velikosti, nulovatelné podmínky, stavu indexu.

metadata

The Filtry karta umožňuje zahrnout všechny výše uvedené filtryextrahovat konkrétní informace ze sloupců. Umožňuje vám přidat do seznamu více typů filtrů, abyste mohli snadno odfiltrovat požadované sady dat. Po přidání filtru rozbalte okno filtru a potom klikněte na Přidat filtr vyberte typ filtru, který chcete použít.

filtry

Analyzátor je pravděpodobně nejužitečnější vlastnostíaplikace. Jak již bylo zmíněno, umožňuje vám vybrat četné druhy analýz. Nejenže vám poskytuje podrobnou zprávu o analýze, ale také umožňuje vytvářet analytické grafy. Stačí vybrat požadovaný typ analýzy a vyplnit požadované informace. Po dokončení klikněte na Spusťte analýzu.

spustit analýzu

Po kliknutí začne vytvářet analytickou zprávu. Pokrok karta Informace zobrazuje všechny procesy, které běží při generování analýzy.

nový 3

Můžete poklepat na ikonu graf tlačítko v prvním poli pro vykreslení datgraf. DataCleaner umožňuje ukládat úlohy. Vytvoří soubor XML, který obsahuje analytickou zprávu. Soubory analytických úloh lze zobrazit otevřením souboru XML z Soubor -> Otevřít analýzu práce.

Nový

DataCleaner nabízí možnost zápisu dat běhemrůzné fáze analýzy dat. Například. funkce Filtry umožňuje zapsat vyčištěná data do samostatného souboru. Filtrovaná data můžete exportovat do souboru CSV, vytvořit tabulku Excel, vytvořit pracovní tabulku nebo vložit data přímo do tabulky.

csv soubor

DataCleaner je masivní analýza dat aobslužný program pro čištění, který podporuje Windows, Linux a Mac OS X. Pokusili jsme se pokrýt nejdůležitější funkce aplikace a možná jsme zmeškali několik užitečných nástrojů a možností. Podrobné manuály a návody k použití najdete na stránce produktu. Je třeba poznamenat, že to vyžaduje nejnovější JRE (Java Runtime Environment), aby fungovalo.

Stáhněte si DataCleaner

Komentáře