본문 바로가기

제로베이스59

Decision Tree를 사용한 Iris 분류_데이터 학습 및 예측 이전 시간에는 scikit learn의 dataset 모듈에 있는 load_iris 데이터에 대해 알아보고, Decision Tree 알고리즘을 통해 분류하는 방식을 수작업으로 진행해봤습니다. 그럼 이번 시간에는 직접 scikit learn에서 Decision Tree 알고리즘을 사용해보려고 합니다. 1.구분하기 쉬운 그래프로 시각화하기 pair plot을 통해 petal length와 petal width로 구분하는 것이 3종을 구분하기 쉽다는걸 확인했으니, scatter로 그래프를 그려보겠습니다. plt.figure(figsize=(12,6)) sns.scatterplot(x='petal length (cm)', y='petal width (cm)', data=iris_pd, hue='species'.. 2024. 2. 21.
Decision Tree를 사용한 Iris 분류_데이터 관찰 1. Intro 머신러닝을 처음 공부할 때 주로 사용되는 붓꽃, Iris의 분류 데이터를 학습해보겠습니다. Iris는 세상에 여러 종이 있지만 우리가 다룰 scikit learn 모듈의 데이터셋에서는 setosa, vergicolor, virginica의 총 3종만 취급합니다. Iris의 꽃받침(sepal)의 너비와 길이, 꽃잎(petal)의 너비와 길이 총 4개의 데이터와 어떤 종인지 0, 1, 2로 나타나 있습니다. 우리는 각 꽃의 4가지 특징(feature)을 통해 어떤 종(species)인지 분류하고, 분류 알고리즘인 Decision Tree를 사용해 머신러닝을 해보겠습니다. 2. Iris 데이터 불러오기 from sklearn.datasets import load_iris iris = load_.. 2024. 2. 19.
[Tableau] 분산형 차트 만들기 1. 집계방식 평균으로 바꾸기 차원이 없이 측정값 두 개를 열 / 행으로 넣을 경우, 태블로에서 자동으로 분산형 차트로 바꿔준다. 열 / 행에 필드를 넣으면 합계로 입력된다. 이를 평균값으로 나타내고 싶을 때는 오른쪽 마우스 클릭, 측정값에서 바꿔준다. 2. 모든 고객 데이터를 보고싶은 경우 고객명(혹은 고객번호)을 세부정보에 넣는다. 아래는 그 후 수익에 따른 색상변화도 주고싶어서 수익>색상 한 것. 여기서 가운데 값을 0이 아닌 다른 값으로 정하고 싶은 경우, 오른쪽 색상편집 클릭>가운데 값 수정을 하면 된다. 3. 전체적인 경향을 보고싶을 때 분석 패널 > 추세선 드래그 & 드롭 4. 분산형 그래프에서 하나의 튀는 값에 대한 정보를 알고 싶을 때 (데이터 설명 기능) 해당 항목클릭>전구모양클릭>특성.. 2023. 3. 27.
[Tableau] 기본 차트 만들기 - 테이블/막대/라인/파이/트리맵/누적막대 1. 테이블 차원을 먼저 선택한 뒤 측정값을 선택하면 테이블 형태로 수치가 표시된다. 이 때, 마크에 들어있는 측정값을 ctrl를 누른채 색상으로 드래그하면 색상에 따라서 볼 수 있다. 마크를 사각형으로 바꿀 경우 아래와 같이 Heatmap처럼 표시되는데 차원이 3종류라 그렇지 종류가 많은 차원을 넣으면 이렇게 된다. 2. 막대 측정값을 먼저 넣고 차원을 넣으면 막대그래프로 보여준다. 즉, 어떤 값을 먼저 넣느냐에 따라 수치로 표기할지, 그래프로 표시할 지 정할 수 있다. 쉽게 보기 위해서 행열 전환을 통해 가로막대그래프로 바꿔준 뒤, 정렬 시켜주고, 표준을 전체보기로 바꾼다. 고객 세그먼트별로 색상을 주기위해 고객 세그먼트를 마크>색상에 드래그 하고, 합계(매출)을 수치로도 보기위해 매출을 마크>레이블.. 2023. 3. 13.
728x90