본문 바로가기

빅데이터기초

(4)
<ADsP> 3.5 정형 데이터 마이닝 (1) 이 글은 데이터분석준전문가(ADsP)를 취득 후 정리하며 쓰는 글입니다. ADsP 의 공부방법 및 후기글은 하단의 일상블로그 링크를 참고해주세요. 데이터에듀사의 교재를 참고하였으며, 작성된 모든 내용과 그림은 직접 재구성하였습니다. 1. 데이터마이닝의 개요 * 데이터마이닝 - 데이터마이닝 : 대용량 데이터에서 의미있는 패텅을 파악하거나 예측하여 의사결정에 활용하는 방법 * 분석방법 - 지도학습 : 의사결정나무, 인공신경망, 회귀분석, 로지스틱 회귀분석 등 - 비지도학습 : 연관성규칙발견, 군집분석, SOM 등 * 데이터마이닝 추진단계 - 1. 목적 설정 : 무엇을 왜 하는지 목적 설정 - 2. 데이터 준비 : 충분한 양의 데이터를 확보 - 3. 가공 : 소프트웨어에 적용할 수 있는 형식으로 가공 - 4...
<ADsP> 2.1 데이터 분석 기획의 이해 이 글은 데이터분석준전문가(ADsP)를 취득 후 정리하며 쓰는 글입니다. ADsP 의 공부방법 및 후기글은 하단의 일상블로그 링크를 참고해주세요. 데이터에듀사의 교재를 참고하였으며, 작성된 모든 내용과 그림은 직접 재구성하였습니다. 1. 분석기획 방향성 도출 * 분석 대상과 방법 - 분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 나누어짐. * 목표 시점 별 분석 기획 방안 - 목표시점 별로 당면한 과제를 빠르게 해결하는 ‘과제 중심적 접근 방식’과 지속적인 분석 내재화를 위한 ‘장기적 마스터 플랜 방식’ 으로 나눌 수 있다. - 과제 중심적 접근 방식 : 속도와 성취가 중요하며 문제를 해결하는 것이 주된 목적 - 장기적 마스터 플랜 방식 : 정확하고 긴 관점에서 문제를 정의하는 ..
<ADsP> 1.2 데이터의 가치와 미래 이 글은 데이터분석준전문가(ADsP)를 취득 후 정리하며 쓰는 글입니다. ADsP 의 공부방법 및 후기글은 하단의 일상블로그 링크를 참고해주세요. 데이터에듀사의 교재를 참고하였으며, 작성된 모든 내용과 그림은 직접 재구성하였습니다. 1. 빅데이터의 이해 * 빅데이터 활용의 3요소 : 데이터, 기술, 인력 * 빅데이터 정의의 범주 및 효과 - 데이터 변화 : 규모(Volume), 형태(Variety), 속도(Velocity) - 기술 변화 : 데이터 처리, 저장, 분석 기술 및 아키텍쳐, 클라우드 컴퓨팅 활용 - 인재, 조직 변화 : 데이터사이언티스트, 데이터 중심 조직 * 빅데이터의 기능과 비유 - 산업혁명의 석탄, 철 : 제조업을 포함하여 서비스 분야의 생산성까지 끌어올림. - 21세기의 원유 : 산업..
<ADsP> 1.1 데이터의 이해 이 글은 데이터분석준전문가(ADsP)를 취득 후 정리하며 쓰는 글입니다. ADsP 의 공부방법 및 후기글은 하단의 일상블로그 링크를 참고해주세요. 데이터에듀사의 교재를 참고하였으며, 작성된 모든 내용과 그림은 직접 재구성하였습니다. 1. 데이터와 정보 * 데이터의 유형 - 정성적 데이터 : 언어와 문자등의 형태로 된 데이터를 의미한다. 주로 비정형 데이터이며, 주관적 내용이다. 따라서 통계분석이 어려워 많은 비용이 소모된다. (ex. A사 매출이 증가하였습니다.) - 정량적 데이터 : 수치적인 데이터부터 도형과 기호까지 포함한다. 주로 정형 데이터이며, 객관적 내용이 주를 이룬다. 따라서 통계분석이 용이하다. (ex.주가) * 지식경영 - 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드..