본문 바로가기

머신러닝/Model Evaluation5

Python Box plot +모양이 평균지점이고 Box plot의 맨 위와 맨 아래가 upper fence, lower fence입니다.데이터의 절반이 들어가는 IQR(Interquartile Range)의 각각 1.5배를 벗어나는 지점에 만약 데이터가 있으면 이 데이터를 outlier라고 말합니다. samples = [1, 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 100, 101]samplestmp_y = [1]*len(samples)tmp_y 당연히 두 개의 길이는 똑같습니다.len(samples), len(tmp_y)이제 이걸 가지고 plot을 그릴겁니다. import matplotlib.pyplot as pltplt.figure(figsize=(12,4))plt.scatter(samples, tm.. 2024. 4. 27.
Python으로 다양한 함수 나타내기 (+다항함수, 지수함수, 시그모이드, 벡터 3Dscatter) 1. 함수 나타내기다항함수 방정식을 코드를 통해 그려보는 방법을 알아보겠습니다.그림 그리는 데이터는 numpy로, matplotlib로 그려보겠습니다.import numpy as npimport matplotlib.pyplot as plt x의 변화에 대한 y의 변화를 그리는 것인데, 다항식만 쓰기엔 x값이 없습니다. 이럴 땐 x값부터 정해주어야 합니다. x는 -3부터 2까지 100개의 데이터를 만든다고 생각하면 됩니다. 따라서 numpy의 linspace를 이용합니다. x = np.linspace(-3, 2, 100)y = 3 * x**2 + 2 x를 출력해보겠습니다.  함수 식에 따라 y도 정의되었으니 y도 출력해보겠습니다.  이걸 토대로 그래프를 그릴 수 있습니다.그래프는 pyplot의 plot함수.. 2024. 4. 25.
모델평가_ROC 커브 그리기 1. 데이터 가공 및 accuracy 확인하기 이전에 했던 와인데이터를 바탕으로 모델을 평가하기 위해 ROC 커브를 그려보겠습니다. 우선 데이터를 불러옵니다. import pandas as pd red_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/winequality-red.csv' white_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/winequality-white.csv' red_wine = pd.read_csv(red_url, sep=';') white_wine = pd.read_csv(white_url, sep=.. 2024. 4. 2.
모델평가_ROC와 AUC 개념 1. ROC 커브 ROC 커브란 FPR이 변할 때 TPR의 변화를 그린 그림입니다. FPR은 Fall-out, TPR은 Recall(sensitivity) 입니다. Fall-out이 변할 때 sensitivity가 어떻게 변하냐를 관찰한 커브인데요. 1) 직선 랜덤하게 때려맞춘 모델로, 아무 의미가 없다는 뜻입니다. 2) Good 직선보다 위에 있으면 좋은 모델로 보고 완벽하게 ㄱ으로 꺾여있다면 100%의 모델을 나타냅니다. Threshold 기준으로 그래프를 그려보면, negative라고 맞추고 positive라고 맞춘 경계선이 명확하다면 ROC 곡선에서 100% 다 맞춘 모델이 됩니다. 이 때 AUC를 1이라고 합니다. AUC는 ROC의 면적을 나타냅니다. AUC가 0.7정도인 경우는 위와 같습니다... 2024. 3. 12.
728x90