Python Box plot
+모양이 평균지점이고 Box plot의 맨 위와 맨 아래가 upper fence, lower fence입니다.데이터의 절반이 들어가는 IQR(Interquartile Range)의 각각 1.5배를 벗어나는 지점에 만약 데이터가 있으면 이 데이터를 outlier라고 말합니다. samples = [1, 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 100, 101]samplestmp_y = [1]*len(samples)tmp_y 당연히 두 개의 길이는 똑같습니다.len(samples), len(tmp_y)이제 이걸 가지고 plot을 그릴겁니다. import matplotlib.pyplot as pltplt.figure(figsize=(12,4))plt.scatter(samples, tm..
2024. 4. 27.
Python 데이터프레임 인덱싱 및 슬라이싱 - loc, iloc, at, iat
출처 : https://devocean.sk.com/blog/techBoardDetail.do?ID=164657&boardType=techBlog Pandas 인덱싱 속도 높이기 - loc, iloc, at, iat, ix devocean.sk.com Python에서 Pandas를 사용하다 보면 내가 원하는 데이터만 잘라 쓰거나 뽑아야 할 경우가 많은데요, Pandas에서는 편하게 Dataframe에서 'loc'이라는 메소드 외에도 iloc, at, iat 메소드를 사용할 수 있습니다. 간단하게 위의 메소드들은 인덱싱에 사용되는 메소드들이며 소괄호 대신 대괄호 '[]'를 사용한다는 공통점이 있지만, 인덱싱 방법부터, 이들의 인덱싱 속도까지 모두 다른데요, 이번 포스팅에서는 해당 메소드들 간의 기능부터 시..
2024. 4. 17.