본문 바로가기
ML , DL/etc

데이터 마이닝

by 바다가좋아서 2021. 10. 30.

<1> 데이터에 대한 이해

- 명목 데이터 : 사물의 기호나 이름과 같은 데이터

- 이진 데이터 : 0과 1로 이루어진 데이터

- 순서 데이터 : 상중하처럼 등급이나 계급이 있는 데이터

- 숫자 데이터 : 절대영점을 가지고 있으면 비율척도 데이터, 없으면 등간척도 데이터

정수형이냐 연속형이냐에 따라 이산/연속형 데이터

<2> 데이터에 전처리 기술

- 데이터 정제 : 결측치 제거 또는 대치, 노이즈 제거

- 데이터 통합 : 중복 데이터 처리, 복사, 단위 통합

- 데이터 축소 : 주성분 분석, 속성 선택법, 샘플링

- 데이터 변환 : 데이터 정규화, 비닝

<3> 데이터 분석 알고리즘

- 연관관계 분석, 상관관계 분석, 빈발 패턴 분석, 클래스 분류 분석, 클러스터 분석, 회귀 분석, 아웃라이어 분석 등

클래스 분류 분석의 예 :

의사 결정 나무, 서포트 벡터 머신, 베이즈 분류, 랜덤 포레스트, 배깅, 부스팅, KNN, 피드포워드 신경망, 퍼지 세트 등