Nástroje na analýzu databázy pomáhajú DBA pri identifikáciinezrovnalosti a nelogické prepojenia medzi súbormi údajov, aby sa dali odstrániť z databázy. Schopnosť nástrojov na analýzu databázy však závisí od platformy, na ktorej je databáza postavená. Napríklad, relačná databáza malého rozsahu vytvorená v MS Access potrebuje veľa rôznych obslužných programov na analýzu DB, ako bola vytvorená pomocou MySQL. Ak hľadáte nástroj na analýzu databázy typu všetko v jednom, ktorý vám pomôže identifikovať a vyčistiť nadbytočné položky z databázy, šance, že narazíte na platený nástroj, sú vysoké. Dnes sme objavili open source program s názvom java DataCleaner ktoré implementujú rôzne koncepty analýzy databáz a čistenia vrátane Kvalita údajov, Správa kmeňových dát, Profilovanie údajova Monitorovanie kvality údajov, odstrániť všetky nadbytočné množiny údajov z internetuzadané úložisko údajov. Aplikácia podporuje širokú škálu databázových platforiem a dátových súborov vrátane CSV, MS Excel (XLS a XLSX), MS Access, knižnice SAS, databázy DBase, súboru s pevnou šírkou, XML, databázy OpenOffice, MonoDB, MySQL, Oracle a MS SQL Server. ,
Okrem toho poskytuje vzorové pripojeniereťazce a ďalšie možnosti, ktoré vám pomôžu rýchlo vytvoriť pripojenia k vašej databáze. Akonáhle je databáza pripojená alebo sú súbory údajov načítané zo špecifikovanej databázy, umožňuje zobraziť kompletné údaje metadáta informácie o tabuľkách DB, čo vám umožní ľahko modifikovať požadované polia a riadky. Okrem toho zahŕňa rozsiahle filtre funkcia, ktorá vám môže pomôcť zobraziť iba požadovanú časť databázy. V databáze môžete použiť množstvo podmienených filtrov vrátane Rovná sa, Maximálny počet riadkov, Kontrola nulovej hodnoty, Rozsah čísel, Jedno slovo, Zhoda vzoru reťazca, a Rozsah hodnôt reťazca, Máte tiež možnosť vyladiť vybrané filtre, aby ste splnili požiadavky na získavanie údajov.
DataCleaner prichádza s transformátor funkcia, ktorá umožňuje predbežne spracovať údaje na extrahovanie, kombinovanie a vygenerovanie samostatných hodnôt. Vstavaný Analyzer poskytuje komplexné Kvalita údajov a Profilovanie údajov operácie, ktoré vám pomôžu pri analýze obsahu vybratej databázy. Zahŕňa množstvo analytických funkcií, ako napr Booleovský analyzátor, distribúcia znakovej sady, analyzátor dátových medzier, porovnávací analyzátor, vyhľadávač vzorov, Stringový analyzátor, deň v týždni a distribúcia hodnôt a viac.
Hlavné rozhranie zobrazuje podporované dátové úložiskoTypy. Všetko, čo potrebujete, je vybrať typ databázy a nakonfigurovať podrobnosti pripojenia. Napríklad, ak chcete vyčistiť a analyzovať databázu MySQL, zadajte Názov databázy, Názov triedy disku, pripájací reťazec a užívateľské meno a heslo. Súbor databázy Excel alebo Access môžete otvoriť zadaním úplnej cesty. Po nadviazaní spojenia pridá databázu do zoznamu. Teraz skontrolujte databázu, ktorú chcete analyzovať, a kliknite na tlačidlo OK analyzovať.

Ľavý bočný panel obsahuje databázy z vybranýchdatastore, čo vám umožní preskúmať súbory údajov. Musíte vykonať výber polí na vykonanie analýzy. Stačí dvakrát kliknúť na polia, ktoré chcete zahrnúť, a zobrazí sa ich zoznam zdroj tab. Môžete skontrolovať súbory údajov a ich typ a odstrániť všetky nepotrebné polia.

pod metadáta Na karte nájdete všetky informácie o metaúdajoch vrátane tabuľky, stĺpca, rodiny typov (na základe uložených údajov), typu, natívneho typu, veľkosti, podmienky možného zrušenia, stavu indexu.

Na filtre karta umožňuje zahrnúť všetky vyššie uvedené filtreextrahovať konkrétne informácie zo stĺpcov. Umožňuje vám pridať do zoznamu viac typov filtrov, aby ste mohli ľahko odfiltrovať požadované súbory údajov. Po pridaní filtra rozbaľte okno filtra a potom kliknite na tlačidlo OK Pridajte filter vyberte typ filtra, ktorý chcete použiť.

Analyzer je pravdepodobne najužitočnejšou vlastnosťou systémuaplikácie. Ako už bolo spomenuté vyššie, umožňuje vám výber mnohých druhov analýz. Nielenže vám poskytuje podrobnú správu o analýze, ale tiež umožňuje vytvárať analytické grafy. Stačí vybrať požadovaný typ analýzy a vyplniť požadované informácie. Po dokončení kliknite na tlačidlo OK Spustiť analýzu.

Po kliknutí začne vytvárať správu o analýze. pokrok karta Informácie zobrazuje všetky procesy, ktoré sa spúšťajú pri generovaní analýzy.

Môžete dvakrát kliknúť na ikonu graf tlačidlo v prvom poli, na ktorom sa majú údaje vykresliťgraf. DataCleaner vám umožňuje ukladať úlohy. Vytvára súbor XML, ktorý obsahuje správu o analýze. Súbory analytických úloh môžete zobraziť otvorením súboru XML z Súbor -> Otvorená analýza práce.

DataCleaner ponúka možnosť zápisu dát počasrôzne fázy analýzy údajov. Napríklad. funkcia Filtre umožňuje zapisovať vyčistené údaje do samostatného súboru. Filtrované údaje môžete exportovať do súboru CSV, vytvoriť tabuľku Excel, vytvoriť pracovnú tabuľku alebo vložiť údaje priamo do tabuľky.

DataCleaner je rozsiahla analýza údajov aobslužný program na čistenie, ktorý podporuje systémy Windows, Linux a Mac OS X. Pokúsili sme sa pokryť najdôležitejšie funkcie aplikácie a možno sme vynechali niekoľko užitočných nástrojov a možností. Podrobné návody na použitie a návody na použitie nájdete na stránke produktu. Je potrebné poznamenať, že to vyžaduje, aby fungovalo najnovšie JRE (Java Runtime Environment).
Stiahnite si DataCleaner
Komentáre