본문 바로가기

Python

[Python 데이터 분석] 머신러닝이란?

Traditional Programming                                      머신러닝

좌(1) 우(2)

 

(1)

프로그래머가 만드는 부분은 일차 함수 (Y=3x+10)

(2)

데이터 사이언티스트가 함수를 직접 만들지 않고 인풋 데이터와 아웃풋 데이터를 활용하여 가운데 어떤 함수가 들어가는 게 가장 적절한지 

 

머신러닝이란?

1. Supervised Learning

우리가 이미 답을 알고 있을 때 사용 가능한 머신러닝

(Y 값 종속변수를 이미 알고 있을 때)

인풋 데이터와 아웃풋 데이터를 모두 넣어 자동으로 머신러닝이 새로운 데이터가 들어왔을 때 판단 가능

 

2. Unsupervised Learning

답을 모를 경우 사용 

우리가 알고자 하는 답(결과)이 아직 정해지지 않음

ex) 클러스터링

비슷한 데이터 끼리 묶어주는 알고리즘

과일을 예로 들자면 크기별 과일이름별 색깔별

장점 : 각각의 클러스터가 어떤 특성을 가졌는지 직접 확인하면서 우리가 알지 못했던 새로운 클러스터의 개념을 만들 수 있음 (일반적인 직업, 나이, 성별 이외 새로운 복잡한 기준과 특성 파악 가능)

 

3. Reinforcement Learning

보상과 처벌이라는 기준을 가지고  머신 학습

ex) 알파고, 자율주행 자동차