회귀 통계 모델 정의

by 마이크 채플

회귀 분석 변수 사이의 관계

회귀 분석은 특정 데이터 집합이 주어지면 숫자 값 범위 ( 연속 값 이라고도 함)를 예측하는 데 사용되는 데이터 마이닝 기술입니다. 예를 들어 회귀 분석을 사용하여 다른 변수가 주어진 경우 제품 또는 서비스 비용을 예측할 수 있습니다.

회귀 분석은 여러 산업 분야에서 비즈니스 및 마케팅 계획, 재무 예측, 환경 모델링 및 추세 분석에 사용됩니다.

회귀 대. 분류

회귀와 분류 는 유사한 문제를 해결하는 데 사용되는 데이터 마이닝 기술이지만 자주 혼동됩니다. 두 가지 방법 모두 예측 분석에 사용되지만 분류를 통해 데이터를 개별 범주에 할당하는 동안 회귀를 사용하여 숫자 또는 연속 값을 예측합니다.

예를 들어, 회귀 분석은 주택의 위치, 평방 피트, 마지막 판매시 가격, 유사한 주택의 가격 및 기타 요인을 기준으로 주택의 가치를 예측하는 데 사용됩니다. 예를 들어 보행 가능성, 로트 크기 또는 범죄율과 같은 범주로 집을 구성하려는 경우 분류가 순서대로 이루어집니다.

회귀 기법의 유형

회귀의 가장 간단하고 오래된 형태는 두 변수 사이의 관계를 추정하는 데 사용되는 선형 회귀 분석입니다. 이 기법은 직선 (y = mx + b)의 수학 공식을 사용합니다. 간단히 말해서, 이는 Y와 X 축을 가진 그래프가 주어지면 X와 Y 사이의 관계가 극단 치가 거의없는 직선임을 의미합니다. 예를 들어, 인구 증가에 따라 동일한 비율로 식량 생산량이 증가한다고 가정 할 수 있습니다. 두 식량 사이에 강한 선형 관계가 필요합니다. 이를 시각화하려면 Y 축이 인구 증가를 추적하고 X 축은 식량 생산을 추적하는 그래프를 고려하십시오. Y 값이 증가하면 X 값도 같은 비율로 증가하여 두 값의 관계가 직선이됩니다.

다중 회귀와 같은 고급 기술은 여러 변수 간의 관계를 예측합니다. 예를 들어, 소득, 교육 및 거주지간에 상관 관계가 있습니까? 더 많은 변수를 추가하면 예측의 복잡성이 상당히 증가합니다. 다중 회귀 기술에는 표준, 계층 적, 계단식 및 단계별 등 여러 가지 유형이 있으며 각 유형마다 고유 한 응용 프로그램이 있습니다.

이 시점에서 우리가 예측하려고하는 것 (종속 변수 또는 예측 변수)과 예측을 위해 사용하는 데이터 (독립 변수 또는 예측 변수)를 이해하는 것이 중요합니다. 이 예에서 우리는 소득과 교육 ( 예측 변수 모두)에서 주어진 삶의 위치 ( 예측 변수)를 예측하고자 합니다.

표준 다중 회귀 분석 은 모든 예측 변수를 동시에 고려합니다. 예를 들어 1) 소득과 교육 (예측 자)과 이웃 선택 (예측) 사이의 관계는 무엇입니까? 2) 개별 예측 변수 각각이 어느 정도까지 그 관계에 기여 하는가?
단계적 다중 회귀 는 전혀 다른 질문에 대한 답입니다. 단계별 회귀 알고리즘은 이웃 선택을 예측하는 데 가장 적합한 예측자를 분석합니다. 즉 단계별 모델이 예측 변수의 중요도 순서를 평가 한 다음 관련 하위 집합을 선택한다는 의미입니다. 이러한 유형의 회귀 문제는 회귀 방정식을 개발하는 데 "단계"를 사용합니다. 이러한 회귀 유형을 감안할 때 모든 예측 변수는 최종 회귀 방정식에 나타나지 않을 수도 있습니다.
계단식 회귀 와 마찬가지로 계층 적 회귀 는 순차적 인 과정이지만 예측 변수는 사전에 정의 된 사전 지정된 순서로 모델에 입력됩니다. 즉 알고리즘에는 다음 순서를 결정하는 기본 방정식 집합이 포함되어 있지 않습니다. 예측자를 입력하십시오. 이것은 회귀 방정식을 만드는 개인이 필드에 대한 전문 지식을 가지고있을 때 가장 자주 사용됩니다.

Setwise 회귀 분석 은 단계적으로 비슷하지만 개별 변수보다는 변수 집합을 분석합니다.

회귀 대. 분류

회귀 기법의 유형

Alike posts

See Newest

Sapid posts