회귀와 분류
회귀
- 회귀는 연속적인 값을 예측하고 예측 변수와 목표 변수 간의 관계를 모델링하는 작업
- 주어진 입력 데이터와 목표 변수(또는 출력) 간의 관계를 학습하고, 이 관계를 사용하여 새로운 입력에 대한 연속적인 값을 예측
- 예를 들어, 주택 가격 예측, 주식 가격 예측, 온도 예측 등이 회귀 문제의 예
- 일반적인 회귀 알고리즘에는 선형 회귀, 다항 회귀, 결정 트리 회귀, 랜덤 포레스트 회귀가 있음
분류
- 분류는 데이터를 여러 범주 중 하나로 분류하는 작업
- 주어진 입력 데이터를 학습하여, 해당 입력이 어떤 범주에 속하는지 예측하는 모델을 만듭니다.
- 예를 들어, 이메일 스팸 여부 판단, 질병 진단, 손글씨 숫자 인식 등이 분류 문제의 예
- 분류 알고리즘에는 로지스틱 회귀, 결정 트리 분류, 랜덤 포레스트 분류, 서포트 벡터 머신(SVM), 신경망이 있
간단하게 말하면 회귀는 연속적인 값을 예측하는 문제이며, 분류는 범주형 값을 예측하는 문제입니다. 어떤 문제를 다룰 때 회귀 또는 분류 중 어떤 유형의 머신러닝 작업을 선택할지는 데이터와 문제의 본질에 따라 다릅니다.
지도학습과 비지도학습
지도 학습
- 지도학습은 레이블 또는 명시적인 정답이 주어진 데이터를 기반으로 모델을 학습하는 방법입니다. 학습 데이터셋은 입력과 해당 출력(레이블 또는 목표)으로 구성
- 예시: 이메일 분류, 스팸 메일 감지, 이미지 분류, 텍스트 감정 분석
- 알고리즘: 선형 회귀, 로지스틱 회귀, 의사결정 트리, 랜덤 포레스트, 신경망
비지도 학습
- 비지도학습은 레이블이 없는 데이터를 기반으로 모델을 학습하는 방법입니다. 이 모델은 데이터의 구조나 패턴을 발견하거나 데이터를 그룹화하는 데 사용
- 예시: 군집화, 차원 축소, 이상 탐지, 토픽 모델링
- 알고리즘: K-평균 군집화, 주성분 분석(PCA), 자기 조직화 지도(SOM), t-SNE
간단히 말하면, 지도학습은 모델을 훈련시키기 위해 정답이 포함된 데이터를 사용하며, 모델은 입력과 출력 간의 관계를 학습합니다. 반면에 비지도학습은 정답 레이블 없이 데이터의 구조와 패턴을 발견하거나 데이터를 그룹화하는 데 중점을 둡니다. 그림으로 비유하자면, 지도학습은 "답을 맞추는 학습"이고, 비지도학습은 "패턴을 찾아가는 학습"이라고 생각할 수 있습니다.
Linear Regression 선형 회귀
- 회귀 문제는 주어진 데이터포인트 x에 해당하는 실제 값으로 주어지는 타겟 y를 예측하는 과제
- ex. 주택 가격, 기온, 판매량 등 연속된 값을 예측
3.1. 선형 회귀(Linear Regression) — Dive into Deep Learning documentation (d2l.ai)
3.1. 선형 회귀(Linear Regression) — Dive into Deep Learning documentation
ko.d2l.ai
'Machine Learning' 카테고리의 다른 글
4wk_예측값과 실제값 비교 : MSE · RMSE · MAE · R2 (0) | 2024.03.31 |
---|---|
1wk_Machine Learning_Python Packages (0) | 2024.03.09 |
사이킷런 의사결정나무 알고리즘 및 당뇨병 데이터셋 (0) | 2024.01.16 |
사이킷런과 머신러닝이란? (2) | 2024.01.11 |
Machine Learning_Numpy (0) | 2023.09.16 |