본문 바로가기

데이터취업스쿨56

앙상블 기법 - HAR 데이터 HAR은 Human Activity Recognition이라고 사람의 행동을 예측하는 기법입니다. 이미지는 아니고, 사람의 몸에 어떤 디바이스를 붙여놓았다고 생각하면 됩니다.오래된 디바이스지만, 이 휴대폰에는 IMU센서가 붙어있습니다. 즉 자이로센서, 가속도센서, 등등이 붙어있다고 합니다. 위 데이터는 사람 몸에 IMU센서를 부착해서 사람의 행동을 인식하는 실험입니다. IMU 센서를 부착하기 힘들어서 핸드폰을 직접 부착한 상태입니다. 자이로 센서(Gyroscope)는 회전하는 각속도를 측정하는 센서고 가속도 센서는(Accelerometer)는 가속도 성분을 측정하는 센서입니다. 내가 책상에 가만히 있다면 지구 중력을 측정합니다. -9.8m/s^2... 무튼 자이로센서는 가만히 놔두면 지구 자전을 검출해 .. 2024. 5. 8.
Logistic Regression - PIMA 인디언 당뇨병 예측 Logistic Regression은 분류를 위한 것으로 PIMA 인디언의 당뇨병을 예측하기 좋습니다.PIMA 인디언은 1950년대까지 당뇨가 없었습니다. 그런데 20세기 말, 50%가 당뇨에 갑자기 걸렸고 50년만에 50%의 인구가 당뇨에 걸렸다고 합니다. 원래 데이터는 kaggle에 있는데 저희는 pinkwink에서 가져오겠습니다.각 컬럼에 대한 정보는 다음과 같습니다. import pandas as pdPIMA_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/diabetes.csv'pima = pd.read_csv(PIMA_url)pima.head()pima.info() 총 768개의 데이터가 있고 전부 수치형.. 2024. 5. 7.
Logistic Regression - 실습 지난번에 했던 wine 데이터를 가지고 한번 logistic regression을 실습해보겠습니다.import pandas as pdwine_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/wine.csv'wine = pd.read_csv(wine_url, index_col=0)wine.head()wine['taste'] = [1 if grade>5 else 0 for grade in wine['quality']]X = wine.drop(['taste', 'quality'], axis=1)y = wine['taste']from sklearn.model_selection import train_test_splitX_t.. 2024. 5. 6.
Cost function - Boston 집값 예측 Iris와 마찬가지로 sklearn의 datasets에는 Boston 집값예측 데이터가 들어있습니다. 이 데이터 세트는 Barnegie Mellon University에서 유지관리 중이며 1978년에 만들어졌습니다. 보스턴 주택 가격 데이터는 회귀문제를 다루는 많은 머신러닝 논문에서 사용하고 있습니다.from sklearn.datasets import load_bostonboston = load_boston()print(boston.DESCR)DESCR를 살펴보면 다음과 같이 컬럼이 나옵니다.대체 boston이 어떻게 생긴걸까요?  아 dict형태로 data에 데이터가 들어있고 target에 label데이터인 price가 들어있고, feature_names에 data의 컬럼이 들어있네요. dict 형태므.. 2024. 5. 5.
728x90