[핸즈온 머신러닝 2판] 1장 한눈에 보는 머신러닝 (p35 - p37)

2021. 10. 29. 17:55나혼머(나혼자머신러닝)/핸즈온머신러닝2판

2021.10.29.금

p35

 

1.4 머신러닝 시스템의 종류

 

1.4.1 지도 학습과 비지도 학습

 : 머신러닝 시스템을 '학습하는 동안의 감독의 형태나 정보량'에 따라 분류 할때 

 1) 지도학습 2) 비지도학습 3) 준지도학습 4) 강화학습 네 가지 주요 범주가 있음

 

 

▶ 지도학습(Supervised Learning) 

 : 알고리즘에 주입하는 훈련 데이터에 레이블(Label) 이라는 답이 포함되어 있음

 

      - 분류(Classification)  

        : 전형적인 지도학습 

        : 예를 들면 스팸 필터 

 

      - 회귀(Regression) 

        : 예측 변수(Predictor variable)라 부르는 특성(feature)를 사용해 타깃(Target) 수치를 예측하는 것

 

 : 일부 회귀 알고리즘은 분류에 사용할 수 있고, 반대로 일부 분류 알고리즘을 회귀에 사용할 수도 있음

 

        - 지도 학습의 알고리즘

           1) k-최근접 이웃 (k-nearest neighbors)

           2) 선형 회귀(Linear Regression)

           3) 로지스틱 회귀(Logistic regression)

           4) 서포트 벡터 머신(Support vector machine; SVM)

           5) 결정 트리(Decision tree)와 랜덤 포레스트(Random Forest)

           6) 신경망 (neural networks) 

 

           : 분류에 널리 쓰이는 로지스틱 회귀는 클래스에 속할 확률을 출력함 ( 예를들면 스팸일 가능성 20%) 

           : 로지스틱 회귀는 이름에 회귀라고 되어있지만 분류문제, 회귀 문제 모두 사용할 수 있음

 

  * 머신러닝에서의 속성(Attribute) / 특성(Feature) *

  ( 이 책을 읽고 알게 된 사실이지만 나는 속성이랑 특성을 정확하게 구분 짓고 있지 않았음)

 속성(Attribute)데이터 타입을 말하고 특성(Feature)은 일반적으로 속성과 값이 합쳐진 것을 의미함

  예를 들면 속성은 키, 몸무게 이고 특성은 키=180, 몸무게=70 이 되겠다.