본문 바로가기

데이터분석

빅데이터분석기사 준비 - 1. 빅데이터 분석 기획 :: 빅데이터의 이해

1과목 빅데이터 분석 기획 키워드 정리 

제1장. 빅데이터의 이해

빅데이터(Big Data) 

 기존 데이터베이스 관리 도구의 능력을 넘어서는 대량의 정형 또는 심지어 데이터베이스 형태가 아닌 비정형의 데이터 집합까지 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술(빅데이터 분석 및 시각화 기술도 포함한 개념으로 이해)

 

빅데이터의 주요 특징

 Volume(규모), Variety(다양성), Velocity(처리속도), Value(가치), Veracity(정확성), Validity(유효성), Volatility(휘발성)

 

빅데이터의 유형

  • 정형 (Structured) : 정해진 규칙에 맞게 저장된 데이터, 구조화되어 있음
  • 반정형 (Semi-structured) : 어의적 요소(단어, 말)를 분리시키고 태그나 다른 마커를 포함
  • 비정형 (Unstructured) : 데이터의 구조와 형태가 데이터마다 다르고 정형화되지 않음

 

빅데이터의 가치

 사회경제적 가치, 비즈니스 모델 혁신, 비용 절감, 수익 증대, 사회적 비용 감소(의료 및 보건 분야 등), 산업 생산성 및 효율성 향상

 

빅데이터 산업

 인프라(단말, 장비, 소프트웨어 공급자) 및 서비스(빅데이터 서비스 공급업자, 유무선 통신 서비스 업자)

 

빅데이터 분석 직무

 NCS의 정의 : 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형, 비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업무 

 

빅데이터 요소 기술

 데이터 수집, 저장, 공유, 처리, 분석 및 시각화 

 

빅데이터 플랫폼

 다양한 데이터 소스에서 수집된 데이터를 처리하고 분석해서 지식을 추출하고 지능화된 서비스를 제공하는 데 필요한 IT 환경

 

데이터베이스(Database)

 여러 사람에 의해 공유되어 사용될 목적으로 통합하여 관리되는 데이터의 집합(Stored, Integrated, Shared)

 

데이터베이스 관리 시스템(DBMS : Database Management System) 

 다수의 컴퓨터 사용자들이 컴퓨터에 수록된 많은 자료들을 쉽고 빠르게 조회, 추가, 수정, 삭제할 수 있도록 해주는 소프트웨어 

 

인공지능(AI : Artificial Intelligence) 

  • 컴퓨터를 사용하여 인간의 지능을 모델링하는 기술
  • 핵심 요소 : 하드웨어, 소프트웨어, 프로그래밍 언어, 모델 형태, 응용 분야 

데이터 마이닝(Data Mining) 

 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기법으로 분류, 군집화 연관성 분석, 연속성 분석 및 예측 분야에 활용

 

머신러닝(기계학습, Machine Learning)

  • 인공지능의 한 분야로서 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술 개발
  • 지도 학습 : 입력과 출력을 연관시키는 관계 학습(분류, 회귀분석)
  • 비지도 학습 : 출력 값 없이 입력값만으로 스스로 규칙성을 찾아냄 (클러스터링, 차원 축소)
  • 강화 학습 : 보상을 이용하여 학습(실시간 의사결정, 인공지능 게임) 

딥러닝 (Deep Learning) 

 머신러닝과 신경망의 한 분야로서 여러 개의 은닉층을 가진 심층 신경망을 기반으로 하는 학습 방법

 

개인정보

  • 이름, 주민등록 번호에서 DNA에 이르기까지 그것을 이용해 특정 개인을 식별할 가능성을 내포한 데이터 
  • 관련 법령 : 정보통신망 이용촉진 및 정보보호 등에 관한 법률, 위치정보의 보호 및 이용 등에 관한 법률, 정보통신 기반 보호법, 국가정보화 기본법, 전자정부 법, 개인정보보호법 등 

 

개인정보 활용을 위한 비식별 조치 가이드라인

  • 비식별 조치 : 데이터 내에 포함된 개인정보에 대한 활용 및 비식별 조치 후 활용 가능 여부에 대한 부분이 국내 관계부처에서 제정한 ‘개인정보 비식별조치 가이드라인’을 준수하고 있는지 확인
  • 가이드라인 : 공공정보 개방/공유에 따른 개인정보보호지침, 개인정보 비식별화에 대한 적정성 자율평가 안내서, 빅데이터 개인정보보호 가이드라인, 빅데이터 활용을 위한 개인정보 비식별화 기술 활용 안내서 준수  

 

<2021 빅데이터 분석기사 한 권으로 끝내기>, 정혜정 저 / 시대고시기획 을 정리한 내용입니다.