본문 바로가기

AI ML/ML

(3)
<ML기초> 지도학습 | 비지도학습 | 강화학습 1. 지도학습 - 지도학습(Supervised Learning)은 과거의 데이터로부터 학습하여 결과를 예측하는 머신러닝의 한 분야이다. 이 때, 학습에 사용되는 데이터는 원인인 독립변수과 결과인 종속변수로 이루어져 있어야 한다. 지도학습에서 데이터를 훈련시키면 모델을 만들 수 있게 된다. - 아래 테이블은 이전 장에서 봤었던 아이스크림 판매량 데이터 세트이다. - 위 데이터를 학습시키면 "판매량 = 온도 * 2" 라는 식의 모델을 만들어낼 수 있다. 이처럼 독립변수와 종속변수의 관계를 학습시키면 컴퓨터는 그 관계를 설명할 수 있는 공식을 만들고, 이를 '모델'이라 한다. 이 공식으로 우리는 다음의 결과를 예측할 수 있다. - 이 지도학습은 크게 회귀(regression)와 분류(classification..
<ML기초> 통계와 머신러닝 분류 1. 통계 * 테이블 - 앞선 장에서 봤듯이 어떤 결과를 위해서는 데이터가 필수이다. 데이터 산업은 데이터 과학과 데이터 공학으로 나눌 수 있다. 데이터 과학은 데이터를 생성하고 분석하는 일을 말하며, 데이터 공학은 데이터를 다루는 도구를 개발하고 관리하는 일을 말한다. - 데이터 산업에서는 테이블(또는 표)을 이해하는 것이 매우 중요하다. 표는 행과 열로 이루어져 있으며, 데이터를 넣을 수 있는 도구이다. 아무리 복잡한 데이터라도 표에 정리하면 컴퓨터를 통해 쉽고 빠르게 분석할 수 있다. 따라서 표는 데이터 분석의 시작점이라고 할 수 있다. - 표에서 가로를 행(row), 세로를 열(column)이라고 부른다. 만양 아이스크림 판매량 데이터를 표에 담게된다면 아래처럼 2가지 경우가 생길 것이다. - 데..
<ML기초> 머신러닝이란 1. 머신러닝이란 * 소개 - 머신러닝은 인간의 판단을 기계적으로 대신하는 기술로, 비교와 선택으로 이루어진 결정 과정을 자동화하기위해 만들어졌다. 알다시피 우리는 매일매일 여러가지 결정 앞에서 고민을 해야한다. 무엇이 더 좋고 나쁜지만 안다면 이 선택은 기계적인 일인 것이다. - 따라서 인간은 결정을 편하게 하기 위해 수학적 개념인 '수'를 만들어 대소관계를 표준화했으며, 이를 기반으로 더 복잡한 세상을 표현하기 위해 '통계를 개발하기에 이르렀다. - 그러나 결정을 기계에 맡기고 싶은 욕구로 인해 인간 고유의 영역이었던 결정을 기계에 학습시키는 기술인 머신러닝이 등장한 것이다. * 만들어보기 - 머신러닝하면 코딩이나 통계, 수학 등을 떠올리게된다. 하지만 최근에는 머신러닝을 간단하게 이용하여 AI모델을..