본문 바로가기

분류 전체보기107

Python Box plot +모양이 평균지점이고 Box plot의 맨 위와 맨 아래가 upper fence, lower fence입니다.데이터의 절반이 들어가는 IQR(Interquartile Range)의 각각 1.5배를 벗어나는 지점에 만약 데이터가 있으면 이 데이터를 outlier라고 말합니다. samples = [1, 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 100, 101]samplestmp_y = [1]*len(samples)tmp_y 당연히 두 개의 길이는 똑같습니다.len(samples), len(tmp_y)이제 이걸 가지고 plot을 그릴겁니다. import matplotlib.pyplot as pltplt.figure(figsize=(12,4))plt.scatter(samples, tm.. 2024. 4. 27.
Python으로 다양한 함수 나타내기 (+다항함수, 지수함수, 시그모이드, 벡터 3Dscatter) 1. 함수 나타내기다항함수 방정식을 코드를 통해 그려보는 방법을 알아보겠습니다.그림 그리는 데이터는 numpy로, matplotlib로 그려보겠습니다.import numpy as npimport matplotlib.pyplot as plt x의 변화에 대한 y의 변화를 그리는 것인데, 다항식만 쓰기엔 x값이 없습니다. 이럴 땐 x값부터 정해주어야 합니다. x는 -3부터 2까지 100개의 데이터를 만든다고 생각하면 됩니다. 따라서 numpy의 linspace를 이용합니다. x = np.linspace(-3, 2, 100)y = 3 * x**2 + 2 x를 출력해보겠습니다.  함수 식에 따라 y도 정의되었으니 y도 출력해보겠습니다.  이걸 토대로 그래프를 그릴 수 있습니다.그래프는 pyplot의 plot함수.. 2024. 4. 25.
Python 데이터프레임 인덱싱 및 슬라이싱 - loc, iloc, at, iat 출처 : https://devocean.sk.com/blog/techBoardDetail.do?ID=164657&boardType=techBlog Pandas 인덱싱 속도 높이기 - loc, iloc, at, iat, ix devocean.sk.com Python에서 Pandas를 사용하다 보면 내가 원하는 데이터만 잘라 쓰거나 뽑아야 할 경우가 많은데요, Pandas에서는 편하게 Dataframe에서 'loc'이라는 메소드 외에도 iloc, at, iat 메소드를 사용할 수 있습니다. 간단하게 위의 메소드들은 인덱싱에 사용되는 메소드들이며 소괄호 대신 대괄호 '[]'를 사용한다는 공통점이 있지만, 인덱싱 방법부터, 이들의 인덱싱 속도까지 모두 다른데요, 이번 포스팅에서는 해당 메소드들 간의 기능부터 시.. 2024. 4. 17.
모델평가_ROC 커브 그리기 1. 데이터 가공 및 accuracy 확인하기 이전에 했던 와인데이터를 바탕으로 모델을 평가하기 위해 ROC 커브를 그려보겠습니다. 우선 데이터를 불러옵니다. import pandas as pd red_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/winequality-red.csv' white_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/winequality-white.csv' red_wine = pd.read_csv(red_url, sep=';') white_wine = pd.read_csv(white_url, sep=.. 2024. 4. 2.
728x90