회귀 통계 모델 정의

회귀 분석 변수 사이의 관계

회귀 분석은 특정 데이터 집합이 주어지면 숫자 값 범위 ( 연속 값 이라고도 함)를 예측하는 데 사용되는 데이터 마이닝 기술입니다. 예를 들어 회귀 분석을 사용하여 다른 변수가 주어진 경우 제품 또는 서비스 비용을 예측할 수 있습니다.

회귀 분석은 여러 산업 분야에서 비즈니스 및 마케팅 계획, 재무 예측, 환경 모델링 및 추세 분석에 사용됩니다.

회귀 대. 분류

회귀와 분류 는 유사한 문제를 해결하는 데 사용되는 데이터 마이닝 기술이지만 자주 혼동됩니다. 두 가지 방법 모두 예측 분석에 사용되지만 분류를 통해 데이터를 개별 범주에 할당하는 동안 회귀를 사용하여 숫자 또는 연속 값을 예측합니다.

예를 들어, 회귀 분석은 주택의 위치, 평방 피트, 마지막 판매시 가격, 유사한 주택의 가격 및 기타 요인을 기준으로 주택의 가치를 예측하는 데 사용됩니다. 예를 들어 보행 가능성, 로트 크기 또는 범죄율과 같은 범주로 집을 구성하려는 경우 분류가 순서대로 이루어집니다.

회귀 기법의 유형

회귀의 가장 간단하고 오래된 형태는 두 변수 사이의 관계를 추정하는 데 사용되는 선형 회귀 분석입니다. 이 기법은 직선 (y = mx + b)의 수학 공식을 사용합니다. 간단히 말해서, 이는 Y와 X 축을 가진 그래프가 주어지면 X와 Y 사이의 관계가 극단 치가 거의없는 직선임을 의미합니다. 예를 들어, 인구 증가에 따라 동일한 비율로 식량 생산량이 증가한다고 가정 할 수 있습니다. 두 식량 사이에 강한 선형 관계가 필요합니다. 이를 시각화하려면 Y 축이 인구 증가를 추적하고 X 축은 식량 생산을 추적하는 그래프를 고려하십시오. Y 값이 증가하면 X 값도 같은 비율로 증가하여 두 값의 관계가 직선이됩니다.

다중 회귀와 같은 고급 기술은 여러 변수 간의 관계를 예측합니다. 예를 들어, 소득, 교육 및 거주지간에 상관 관계가 있습니까? 더 많은 변수를 추가하면 예측의 복잡성이 상당히 증가합니다. 다중 회귀 기술에는 표준, 계층 적, 계단식 및 단계별 등 여러 가지 유형이 있으며 각 유형마다 고유 한 응용 프로그램이 있습니다.

이 시점에서 우리가 예측하려고하는 것 (종속 변수 또는 예측 변수)과 예측을 위해 사용하는 데이터 (독립 변수 또는 예측 변수)를 이해하는 것이 중요합니다. 이 예에서 우리는 소득과 교육 ( 예측 변수 모두)에서 주어진 삶의 위치 ( 예측 변수)를 예측하고자 합니다.