본문 바로가기

분류 전체보기107

회귀를 통해 이해하는 Cost function_1 Cost Function이란 데이터 셋과 어떤 가설 함수와의 오차를 계산하는 함수이다. Cost Function의 결과가 작을수록 데이터셋에 더 적합한 Hypothesis(가설 함수)라는 의미다. Cost Function의 궁극적인 목표는 Global Minimum을 찾는 것이다. 주택의 규모에 따른 가격이 위와 같다고 하면, 우리가 데이터를 하나 주고 가격을 가격을 알려줍니다. 정답을 알려주기 때문에 지도학습(supervised learning)이네요. 그 출력 결과인 가격은 연속적인(continuous) 값이므로 회귀(regression) 문제입니다. 어쨌든 머신러닝 모델은 학습데이터를 주고 알고리즘을 만듭니다. 그 후 hypothesis라는 가설(=모델)이 나옵니다.hypothesis는 1차식이라고.. 2024. 5. 3.
[통계] 회귀 머신러닝에서 여기는 회귀가 아닌, 통계적인 기초를 바탕으로 하는 회귀에 대해서 공부해보겠습니다.우선 회귀모델이 잘 만들어졌는지 그래프로 확인할때 필요한 모듈을 불러옵니다.import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns 데이터를 로드하겠습니다.data_url = 'https://raw.githubusercontent.com/PinkWink/ML_tutorial/master/dataset/ecommerce.csv'data = pd.read_csv(data_url)data 위 데이터의 구조에 대해 알아보자면, E커머스 회사의 고객정보입니다. - Avg. Session length : 한 번 접속했을.. 2024. 5. 3.
Linear Regression - OLS(최소자승법) 최소자승법, OLS란 Ordinary Linear Lease Square의 약자로, 회귀로 문제를 푸는 방법을 해보겠습니다. 그 중에서 수학적으로 많이 사용하는 방법이 OLS입니다.이 방법에 대해서 알아보겠습니다. 이렇게 생긴 데이터를 하나의 직선으로 만든다고 해봅시다. 총 5개의 데이터를 직선으로 만든다면, y=ax+b 형태를 띌 것입니다. 우리는 x, y를 알고 있으므로 a, b를 찾아야합니다. 어떤 직선이 잘맞는지 모르기 때문에 각 데이터를 넣어야합니다.1=1a+b3=2a+b4=3a+b6=4a+b5=5a+b 이 문제를 벡터와 행렬로 표현한다면, 결과적으로 Y = AX라고 표현할 수 있습니다.y1 = x1*a+by2 = x2*a+b...와 같이 되므로위에서 얘기한 5가지 식과 동일하게 나타낼 수 있습.. 2024. 5. 2.
선형 회귀(Linear Regression) - 회귀 일반적인 문제 해결 절차는 다음과 같습니다. 1. 문제에 대해 공부합니다.2. 규칙을 만듭니다.3. 평가하고 에러를 고치고4. 다시 새로운 문제에 대해 공부하고5. 규칙을 만듭니다... 그러나 만약 데이터를 기반으로 한다면 문제해결 방식은 달라집니다. 1. 문제를 분석하고2. 머신러닝 혹은 딥러닝 알고리즘을 훈련시킵니다.3. 결과를 얻고 다시 에러를 고치고 반복합니다.4. 그 후 런칭을 합니다5. 데이터를 베이스로 하기 때문에 데이터를 이용한 '모델'에 대해서는 코딩을 하지 않는 경우가 많고 알고리즘 구현하고, 서비스로 런칭하는 릴리즈 코딩만 있습니다.  모델 스스로 데이터를 기반으로 변화에 대응할 수 있습니다.런칭 후 업데이트 되는 것도 자동화를 할 수 있기 때문입니다. 업데이트한 과정에서 데이터가 더.. 2024. 4. 28.
728x90