EDA (2) 썸네일형 리스트형 빅데이터 분석기사 준비 - 2. 빅데이터 탐색 :: 데이터 탐색 2과목 빅데이터 탐색 키워드 정리 제2장 데이터 탐색 데이터 탐색(EDA : Explorartory Data Analysis) 쌓여 있는 데이터를 기반으로 연구 목적에 맞는 가설을 세우고 데이터를 분석하는 작업으로 데이터의 구조와 특징을 파악하고 분석을 통해 얻은 정보를 토대로 통계적 분석 모형을 만듦 목적 : 데이터 이해, 연구목적에 맞는 데이터 탐색, 시각화를 통해 다음 단계 필요한 데이터 생성, 데이터에 포함된 변동성 유형 파악, 변수들 사이 공통 변동 파악, 이상점 파악 및 분석 EDA 절차 데이터 속성 파악 -> 데이터 결측치 확인 -> 데이터 이상치 확인 상관관계 분석 두 변수 사이에 얼마나 선형적인 관계가 있는지를 파악하기 위해서 사용되는 통계적 방법 산점도(산포도) 두 개의 변수가 짝을 이.. 비즈니스 데이터 분석 입문 2. 현실 세계의 데이터 모델링 Chapter2. 현실 세계의 데이터 모델링 데이터 사이언스 프로세스란? 데이터 사이언스 프로세스는 우리가 속한 현실 세계를 어떻게 데이터로 표현해낼 것인가에서부터 시작한다. 여기서 현실 세계를 데이터화 하는 일을 데이터 모델링 과정으로 표현할 수 있다. 데이터 모델링 이후 단계는 데이터 취합인데, 확보하려는 목표 데이터를 설정하고, 데이터 수집을 진행하는 단계이다. 주로 서베이라고 부르는 설문조사를 통해 데이터를 확보하거나 웹에 있는 데이터를 가져오는 등의 방법을 활용한다. 다음은 확보한 데이터를 가공하는 데이터 전처리 단계다. 전처리란 빈 데이터를 결측치로, 이상한 데이터를 이상치로 분류하고 확보한 전체 데이터에 발생하는 문제를 바로잡는 일을 가리킨다. 데이터 전처리 단계를 거친 깨끗한 데이터 셋을 .. 이전 1 다음