본문 바로가기

머신러닝55

앙상블 기법 - HAR 데이터 Decision Tree 적용 이제 HAR 데이터를 결정나무 모델을 통해 머신러닝 시켜보겠습니다.1. 데이터 가져오기import pandas as pdimport matplotlib.pyplot as plturl = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/HAR_dataset/features.txt'feature_name_df = pd.read_csv(url, sep='\s+', header=None, names=['column_index', 'column_name'])#txt도 read_csv로 읽을 수 있습니다.#\s는 공백 한칸, \s+는 공백 여러칸입니다.feature_name_dft로 시작하는 데이터는 시간 영역의 데이터라는 뜻이고, f로.. 2024. 5. 10.
앙상블 기법 - HAR 데이터 HAR은 Human Activity Recognition이라고 사람의 행동을 예측하는 기법입니다. 이미지는 아니고, 사람의 몸에 어떤 디바이스를 붙여놓았다고 생각하면 됩니다.오래된 디바이스지만, 이 휴대폰에는 IMU센서가 붙어있습니다. 즉 자이로센서, 가속도센서, 등등이 붙어있다고 합니다. 위 데이터는 사람 몸에 IMU센서를 부착해서 사람의 행동을 인식하는 실험입니다. IMU 센서를 부착하기 힘들어서 핸드폰을 직접 부착한 상태입니다. 자이로 센서(Gyroscope)는 회전하는 각속도를 측정하는 센서고 가속도 센서는(Accelerometer)는 가속도 성분을 측정하는 센서입니다. 내가 책상에 가만히 있다면 지구 중력을 측정합니다. -9.8m/s^2... 무튼 자이로센서는 가만히 놔두면 지구 자전을 검출해 .. 2024. 5. 8.
앙상블 기법 지난시간 공부했던 로지스틱 회귀는 일종의 선형 분류 알고리즘으로, 주어진 입력 변수에 대해 이진 분류 문제를 해결하는 데 사용됩니다. 로지스틱 회귀는 선형 결합을 통해 로지스틱 함수를 적용하여 클래스에 속할 확률을 추정합니다. 반면, 앙상블 기법은 여러 개의 분류 또는 회귀 모델을 결합하여 더 나은 예측을 만들어내는 기법을 일컫습니다. 이러한 앙상블 기법에는 여러 가지 종류가 있습니다. 대표적으로는 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 에이다부스트(AdaBoost) 등이 있습니다. 앙상블 기법은 여러 모델을 결합하여 더 강력한 예측 모델을 형성하는 데 사용되지만, 로지스틱 회귀는 단일 모델로 이진 분류 문제를 해결하는 데 사용됩니다. 앙상블 개요.. 2024. 5. 8.
Precision(정밀도)과 Recall(재현율)의 Trade off precision과 recall을 강제로 조정하는것은 강제로 threshold를 조정하는 것인데, 이것이 모델 성능의 향상을 말하지 않는다는 의견이 많습니다. 어차피 내가 얻은 데이터에서 작은 threshold의 움직임은 변화가 거의없고 또 threshold를 극단적으로 바꾸면 이게 의미가 없거든요. 그래도 방법은 소개해야할 것 같아서 강의에서 말하고 있습니다. wine 데이터를 다시 불러옵니다.import pandas as pdred_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/winequality-red.csv'white_url = 'https://raw.githubusercontent.com/PinkWink.. 2024. 5. 7.
728x90