DBA가 식별하는 데 도움이되는 데이터베이스 분석 도구데이터베이스에서 데이터 세트를 제거 할 수 있도록 데이터 세트 간의 불일치 및 비논리적 연결. 그러나 데이터베이스 분석 도구의 기능은 데이터베이스가 구축 된 플랫폼에 따라 다릅니다. 예를 들어, MS Access에서 작성된 소규모 관계형 데이터베이스에는 MySQL을 사용하여 작성된 것과는 다른 DB 분석 유틸리티가 많이 필요합니다. 데이터베이스에서 중복 항목을 식별하고 정리할 수있는 올인원 데이터베이스 분석 도구를 찾고 있다면 유료 유틸리티를 접할 가능성이 높습니다. 오늘, 우리는 오픈 소스 자바 기반 유틸리티를 발견했습니다. DataCleaner 다양한 데이터베이스 분석 및 정리 개념을 구현합니다. 데이터 품질, 마스터 데이터 관리, 데이터 프로파일 링, 데이터 품질 모니터링, 불필요한 데이터 세트를 모두 제거하려면지정된 데이터 저장소. 이 응용 프로그램은 CSV, MS Excel (XLS 및 XLSX), MS Access, SAS 라이브러리, DBase 데이터베이스, 고정 너비 파일, XML, OpenOffice 데이터베이스, MonoDB, MySQL, Oracle 및 MS SQL Server를 포함한 다양한 데이터베이스 플랫폼 및 데이터 파일을 지원합니다. .
또한 샘플 연결을 제공합니다데이터베이스와의 연결을 빠르게 만드는 데 도움이되는 문자열 및 기타 옵션 데이터베이스가 연결되거나 지정된 DB에서 데이터 세트가 검색되면 전체를 볼 수 있습니다. 메타 데이터 필요한 필드와 행을 쉽게 수정할 수있는 DB 테이블 정보. 또한 광범위한 필터 데이터베이스의 필요한 부분 만 보는 데 도움이되는 기능입니다. 다음을 포함하여 데이터베이스에 수많은 조건부 필터를 적용 할 수 있습니다. 같음, 최대 행 수, null 검사, 숫자 범위, 한 단어, 문자열 패턴 일치, 과 문자열 값 범위. 또한 데이터 마이닝 요구 사항을 충족하기 위해 선택한 필터를 조정할 수있는 자유가 있습니다.
DataCleaner는 변신 로봇 데이터를 사전 처리하여 별도의 값을 추출, 결합 및 생성 할 수있는 기능입니다. 내장 분석기 포괄적 인 제공 데이터 품질 과 데이터 프로파일 링 선택한 데이터베이스의 내용을 분석하는 데 도움이되는 작업 여기에는 다음과 같은 다양한 분석 기능이 포함됩니다 부울 분석기, 문자 세트 분포, 데이터 갭 분석기, 매칭 분석기, 패턴 파인더, 문자열 분석기, 요일 및 값 분포 그리고 더.
기본 인터페이스는 지원되는 데이터 스토어를 보여줍니다유형. 데이터베이스 유형을 선택하고 연결 세부 사항을 구성하기 만하면됩니다. 예를 들어, MySQL 데이터베이스를 정리하고 분석하려면 데이터베이스 이름, 드라이브 클래스 이름, 연결 문자열 및 사용자 이름 및 비밀번호를 입력하십시오. 전체 경로 만 지정하여 Excel 또는 Access 데이터베이스 파일을 열 수 있습니다. 연결이 설정되면 데이터베이스가 목록에 추가됩니다. 이제 분석하려는 데이터베이스를 확인하고 클릭하십시오 분석.

왼쪽 사이드 바는 선택된 데이터베이스를 보유데이터 저장소를 탐색 할 수 있습니다. 분석을 수행 할 필드를 선택해야합니다. 포함하려는 필드를 두 번 클릭하면 필드가 나열됩니다. 출처 탭. 데이터 세트와 유형을 확인하고 불필요한 필드를 제거 할 수 있습니다.

아래에 메타 데이터 탭에는 테이블, 열, 유형 군 (저장된 데이터 기반), 유형, 기본 유형, 크기, 널 입력 가능 조건, 색인 상태를 포함한 모든 메타 데이터 정보가 있습니다.

그만큼 필터 탭을 사용하면 위에서 언급 한 필터를 포함 할 수 있습니다열에서 특정 정보를 추출합니다. 목록에 여러 유형의 필터를 추가 할 수 있으므로 필요한 데이터 세트를 쉽게 필터링 할 수 있습니다. 필터를 추가 한 후 필터 창을 축소 한 다음 필터 추가 사용하려는 필터 유형을 선택하십시오.

분석기 아마도 가장 유용한 기능 일 것입니다신청. 앞에서 언급했듯이 다양한 종류의 분석을 선택할 수 있습니다. 자세한 분석 보고서를 제공 할뿐만 아니라 분석 그래프를 작성할 수도 있습니다. 필요한 분석 유형을 선택하고 필요한 정보를 입력하십시오. 완료되면 클릭 분석 실행.

클릭하면 분석 보고서 작성이 시작됩니다. 그만큼 진행 정보 탭에는 분석을 생성하는 동안 실행되는 모든 프로세스가 표시됩니다.

두 번 클릭하면 그래프 첫 번째 필드에 버튼을 표시하여 데이터를 플로팅합니다.그래프. DataCleaner를 사용하면 작업을 저장할 수 있습니다. 분석 보고서를 보유하는 XML 파일을 작성합니다. XML 파일을 열어서 분석 작업 파일을 볼 수 있습니다. 파일 –> 분석 열기 일.

DataCleaner는 데이터 쓰기 옵션을 제공합니다데이터 분석의 다른 단계. 예를 들어. 필터 기능을 사용하면 정리 된 데이터를 별도의 파일에 쓸 수 있습니다. 필터링 된 데이터를 CSV 파일로 내보내고, Excel 스프레드 시트를 만들거나, 준비 테이블을 만들거나, 데이터를 테이블에 직접 삽입 할 수 있습니다.

DataCleaner는 대규모 데이터 분석 및Windows, Linux 및 Mac OS X를 지원하는 정리 유틸리티입니다. 우리는 응용 프로그램의 가장 두드러진 기능을 다루려고 시도했지만 유용한 도구와 옵션이 거의 누락되었을 수 있습니다. 제품 페이지에서 자세한 도움말 매뉴얼 및 사용 안내서를 찾을 수 있습니다. 최신 JRE (Java Runtime Environment)가 작동해야합니다.
DataCleaner 다운로드
코멘트