딥러닝 3

[3장-4] 피마 인디언 당뇨병 예측

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV from sklearn.metrics import confusion_matrix,classi..

[06] 딥러닝의 개념 및 발전

# 딥러닝: 수많은 데이터에서 특징을 추출하고, 특징의 패턴을 학습하는 기계학습 기법 # 인공신경망: 중요한 특징들을 제공해서 학습 AI > 머신러닝 > 딥러닝 [1] 딥러닝 배경 및 활성화 요인 - 데이터의 폭발적 증가 - 하드웨어(CPU 속도 빨라지고 개발 및 투자 증가) - imagenet 안경잡이개발자 :: 이미지넷(ImageNet) 데이터셋 소개 및 다운로드하는 방법 (tistory.com) 이미지넷(ImageNet) 데이터셋 소개 및 다운로드하는 방법 이미지넷(ImageNet) 데이터셋은 MNIST, CIFAR 데이터셋과 더불어 굉장히 유명한 데이터셋이다. 일반적으로 MNIST나 CIFAR는 아이디어에 대한 검증 목적으로 사용한다. 최신 컴퓨팅 장치를 기준으로 보았 ndb796.tistory...

Data Science Issue 2023.04.08

[3장-1] 분류 성능 평가 지표

성능 평가 지표(Evaluation Metric)는 모델이 회귀인지 분류인지에 따라 여러 종류로 나뉨 1) 회귀의 경우 대부분 실제값과 예측값의 오차 평균값에 기반 2) 분류의 성능 평가 지표 분류 성능 평가지표: classification - 정확도 - 오차행렬 - 정밀도 - 재현율 - F1 스코어 - ROC AUC 1) 정확도 정확도 : 실제 데이터에서 예측 데이터가 얼마나 같은지 판단하는 지표 = 예측 결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 정확도는 직관적으로 모델 예측 성능을 나타내는 평가 지표이지만 이진 분류의 경우 정확도만으로 성능 평가하면 안됨 (ML 모델의 성능을 왜곡할 수 있기 때문) import sklearn print(sklearn.__version__) #버전 확인 1..

728x90