<1> 데이터에 대한 이해
- 명목 데이터 : 사물의 기호나 이름과 같은 데이터
- 이진 데이터 : 0과 1로 이루어진 데이터
- 순서 데이터 : 상중하처럼 등급이나 계급이 있는 데이터
- 숫자 데이터 : 절대영점을 가지고 있으면 비율척도 데이터, 없으면 등간척도 데이터
정수형이냐 연속형이냐에 따라 이산/연속형 데이터
<2> 데이터에 전처리 기술
- 데이터 정제 : 결측치 제거 또는 대치, 노이즈 제거
- 데이터 통합 : 중복 데이터 처리, 복사, 단위 통합
- 데이터 축소 : 주성분 분석, 속성 선택법, 샘플링
- 데이터 변환 : 데이터 정규화, 비닝
<3> 데이터 분석 알고리즘
- 연관관계 분석, 상관관계 분석, 빈발 패턴 분석, 클래스 분류 분석, 클러스터 분석, 회귀 분석, 아웃라이어 분석 등
클래스 분류 분석의 예 :
의사 결정 나무, 서포트 벡터 머신, 베이즈 분류, 랜덤 포레스트, 배깅, 부스팅, KNN, 피드포워드 신경망, 퍼지 세트 등
'ML , DL > etc' 카테고리의 다른 글
논문 읽는 방법 (0) | 2021.10.30 |
---|---|
AI 빅데이터 분석 관련 기술들 (0) | 2021.10.30 |
빅데이터 관련 추천 책, 강의, 자격증, 저널 (0) | 2021.10.30 |
4차 산업혁명 (0) | 2021.10.28 |
데이터 과학자(데이터 사이언티스트)의 관련 분야 (0) | 2021.10.28 |