R) 비선형 데이터 회귀 분석

연속성을 띄는 데이터가 모두 선형적일 수는 없다.

실습을 위해 임의 비선형 데이터를 생성했다.



종속변수 y, 독립변수 x 로 구성된 연속된 데이터들로 구성된 데이터 셋이다.



실습

1. 단순 회귀 분석
- y ~ x에 대한 단순 회귀 분석을 수행
- 독립 변수 1개에 대한 단순 분석이므로 생성되는 기본적인 식의 표현은 1차 선형 방정식이 된다.
- 회귀 분석을 진행 한 경우 기본적으로 1차 선형 방정식의 생성이 가능하다

- y = 0.5x^2 인 그래프는 방향이 어느 정도 유사하나, 성능 면에서 떨어지는 것으로 예상된다.


2. 단순 회귀 분석
- y ~  0.5x^2 에 대한 비선형 회귀 분석을 수행
- 1차 선형 방정식보다 높은 성능이면서, R^2 수치 값도 1이다.

- 비선형 식(0.5x^2)에 대해 회귀분석 진행 시 성능이 매우 우수한(데이터 셋과 동일한) 모델을 얻을 수 있다

- 데이터 분포와 완전히 동일한 그래프가 생성된다.
3. 정리
- 비선형 그래프에 대한 추론을 진행하여 식을 완성한다면, 좀 더 높은 성능의 모델을 얻을 수 있다.

-coefficients 데이터를 통해 구체적인 수식을 얻을 수 있다.



댓글