이 글은 데이터분석준전문가(ADsP)를 취득 후 정리하며 쓰는 글입니다.
ADsP 의 공부방법 및 후기글은 하단의 일상블로그 링크를 참고해주세요.
데이터에듀사의 교재를 참고하였으며, 작성된 모든 내용과 그림은 직접 재구성하였습니다.
1. 분석기획 방향성 도출
* 분석 대상과 방법
- 분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 나누어짐.
* 목표 시점 별 분석 기획 방안
- 목표시점 별로 당면한 과제를 빠르게 해결하는 ‘과제 중심적 접근 방식’과 지속적인 분석 내재화를 위한 ‘장기적 마스터 플랜 방식’ 으로 나눌 수 있다.
- 과제 중심적 접근 방식 : 속도와 성취가 중요하며 문제를 해결하는 것이 주된 목적
- 장기적 마스터 플랜 방식 : 정확하고 긴 관점에서 문제를 정의하는 것이 중요함.
* 데이터 유형과 특징
- 정형 데이터 : 데이터 자체로 분석이 가능함 (ERP, CRM,SCM 등의 정보 시스템)
- 반정형 데이터 : 데이터 자체로 분석은 가능하나 해석이 불가능 (로그데이터, 모바일데이터, 센싱데이터)
- 비정형 데이터 : 데이터 자체로 분석 불가능 (영상, 음성, 문자 등)
2. 분석 방법론
* 데이터 기반 의사결정
- 경험과 감 기반 > 데이터 기반
- 의사결정의 방해요소 : 고정관념, 편향된 생각, 프레이밍 효과
* 방법론의 적용 업무의 특성에 따른 모델
- 폭포수 모델 : 단계를 순차적으로 진행하는 방법
- 프로토타입 모델 : 일부분을 우선 개발해서 그 결과로 개선해 나감
- 나선형 모델 : 반복적 개발 방식에 의해 사용자의 요구가 충분히 반영. 개발 중의 문제를 유연하게 대응할 수 있고 사용자 요구도 충분히 반영 가능하다. 그러나 분석, 개발, 평가가 반복적으로 진행되므로 프로젝트 기간이 길어질 수 있고, 관리가 어려워질 수 있다.
* 데이터 전처리
- 잡음과 이상치, 결측치를 식별하고 필요시 제거하거나 의미있는 데이터로 만드는 것
* CRISP-DM 분석 방법론의 프로세스
1. 업무이해 : 프로젝트 목적과 계획 수립
2. 데이터 이해 : 초기 데이터를 수집하고 인사이트 발견
3. 데이터 준비 : 분석기법에 적합한 데이터를 편성, 데이터 정제
4. 모델링 : 모델링 기법과 알고리즘 선택, 모델 테스트 계획, 모델 평가
5. 평가 : 프로젝트 목적에 부합하는지 평가하고 모델링 과정과 적용성도 평가함
6. 전개 : 실제 업무에 적용하기 위한 계획을 세우고 유지보수 계획까지 수립하는 단계
* 빅데이터 분석 방법론
- 1단계 분석 기획 : 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 위험계획 수립
- 2단계 데이터 준비 : 필요 데이터 정의
- 3단계 데이터 분석 : 분석용 데이터 준비, 분석, 모델링
- 4단계 시스템 구현 : 시스템 분석 및 설계 > 구현 > 테스트 > 운영계획
- 5단계 평가 및 전개
3. 분석 과제 발굴
* 하향식 접근법
- 하향식 접근법은 문제 해법을 찾기 위해 각 과정이 단계화되어 수행하는 분석과제 발굴 방식이다. 과정은 다음과 같으며, 문제 탐색은 목적이 문제정의는 기법이 강조된다.
* 비즈니스 모델 기반 문제 탐색
- 비즈니스모델 캔버스의 9가지 블록을 단순화하여 업무, 제품, 고객 단위로 문제를 발굴한다.
- 위를 관리하는 규제와 감사, 지원 인프라 영역에 대한 기회를 추가로 도출한다.
* 분석 유즈 케이스
- 분석 유즈 케이스는 풀어야 할 과제의 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후에 활용하도록 하는 것이다.
* 상향식 접근법
- 새로운 문제 탐색에 유효하며, 답을 미리 내는 것이 아니라 다양한 데이터로 다양한 관점에서 접근하는 방식. 일반적으로 비지도학습법에 의해 수행된다. (여기서 비지도학습은 데이터 분석의 목적이 명확한 것이 아닌 데이터 자체의 연관성과 같은 것으로 데이터의 상태를 표현한다. ex. 군집 분석)
- 프로토타이핑 접근법 : 일단 분석을 시도하고 결과를 보며 반복 개선하는 방법이다.
참고
필자 취득 후기 및 공부 방법
데이터에듀 홈페이지 및 기출복원
데이터 전문가 포럼 카페
쉽게 배우는 소프트웨어 공학
'Data Science > ADsP' 카테고리의 다른 글
<ADsP> 3.1 데이터 분석 개요 (0) | 2020.10.11 |
---|---|
<ADsP> 2.2 분석 마스터 플랜 (0) | 2020.10.05 |
<ADsP> 1.4 기타 빅데이터 상식 (0) | 2020.10.04 |
<ADsP> 1.3 데이터 사이언스와 전략 인사이트 (0) | 2020.10.03 |
<ADsP> 1.2 데이터의 가치와 미래 (0) | 2020.10.02 |