본문 바로가기

전체 글

(20)
빅데이터 분석기사 준비 - 3. 빅데이터 모델링 :: 분석기법 적용 3과목 빅데이터 모델링 키워드 정리 제2장 분석기법 적용 회귀 분석(Regression Analysis) 변수들 사이에 함수적인 관계를 알아보기 위해서 수행하는 통계적 기법으로 독립변수와 종속변수 사이의 함수식 유도, 독립변수들 값을 이용해서 종속변수의 값을 예측 단순 회귀 분석 : 독립변수와 종속변수가 각각 1개인 경우 다중회귀 분석 : 독립변수의 수가 2개 이상, 종속변수가 1개인 경우 결정계수(Coefficient of Determination) : 총 변동 중에서 회귀식에 의하여 설명되는 변동의 비율로 회귀모형의 설명력 나타냄, 단순 회귀 분석모형의 경우 결정계수의 값이 1에 가까울수록 점들이 직선 주위에 밀집되어 나타나게 되어 회귀에 의한 설명이 잘 됨을 뜻함 단순 회귀 분석모형의 가정 : 선형..
빅데이터 분석기사 준비 - 3. 빅데이터 모델링 :: 분석모형 설계 3과목 빅데이터 모델링 키워드 정리 제1장 분석모형 설계 분석모형 선정 통계 분석 : 객관적인 근거에 기반을 두고 데이터 수집, 처리, 분류, 분석하여 의사결정 지원, 모집단에서 표본을 추출하고 추론 및 가설 검정 실시 데이터 마이닝 : 수학이나 통계적 기술을 활용하여 데이터 분석, 새로운 상관관계나 추세를 파악하고 예측 및 분류 등에 활용 데이터 유형, 변수, 속성을 파악하고 연구 목적에 맞게 데이터 분석모형 선정 빅데이터 분석 프로세스의 핵심 업무 적합한 분석모형 선정, 분석모형 적용, 성능 및 적합성 평가, 안정성 평가 빅데이터 분석 방법(분석대상과 분석방법의 유무에 따른 분류) 최적화(Optimization) : 목적함수, 제약조건 정의 후 문제해결 솔루션(Solution) : 분석 대상은 알면서..
빅데이터 분석기사 준비 - 2. 빅데이터 탐색 :: 통계기법 이해 2과목 빅데이터 탐색 키워드 정리 제3장 통계기법 이해 데이터 요약 값 데이터 분석을 위해 간단한 기초 통계량을 중심으로 제시된 값 표본 추출 모집단의 부분 집합을 추출한 것 추출된 표본(Sample)은 모집단과 같은 대표성을 가진다고 가정 모집단 전체에 대한 분석이 사실상 불가능한 제약으로 표본 이용 전체 대상의 특성을 대표할 수 있는지의 여부 확인 표본의 대표성이 중요 확률적 표본 추출 방법 단순 무작위 추출 : 표본이 추출될 확률이 동일한 경우 층화 표본 추출 : 두 개 이상의 층으로 나누고 각 층마다 독립적으로 단순 임의 추출 집락(군집) 표본 추출 : 이질적인 군집으로 구분, 무작위로 몇 개의 군집을 표본 추출 계통 표본 추출 : 모집단 목록에서 일정한 순서에 따라 요소 추출 비확률적 표본추출 ..