상관분석
-두 변수 간의 선형적 혹은 비선형적인 관계 여부에 대해 분석하는 방법
- 0 보다 큰 경우 : 양의 상관관계
- 0 보다 작은 경우 : 음의 상관관계
- 0 : 관계 없음
cor(숫자 데이터 값)
- 데이터의 각 변수 간 상관 관계 분석
- 별다른 설정이 없는 경우 선형관계의 크기만 측정하는 피어슨 상관계수를 기본으로 측정
- 0 보다 큰 경우 : 양의 상관관계
- 0 보다 작은 경우 : 음의 상관관계
- 0 : 관계 없음
- 스피어만 상관계수 : 두 변수가 순서 또는 서열 척도인 경우에 사용, 비선형적 관계 표현 또한 가능
- 켄달타우 상관계수 : 각 변수의 순위를 비교, 연관성 계산, 피어슨 상관계수 보완
값이 1인 경우는 완전한 양의 상관관계이거나, 자기 자신에 대한 상관관계이며, 1에 가까운 상관 관계이거나 -1에 가까울수록 비례하거나 반비례 한다.
예시에서 붉은 상자로 표시된 부분은 다른 부분의 비해 상대적으로 잔차가 적고, 선형성을 보임(양의 상관성을 가짐)
- corrplot 등의 라이브러리를 통해 cor()함수를 통해 상관분석한 값에 대해 결과 확인이 수월해짐
rplot, network_plot 등 상관관계 조사에 대한 데이터의 시각화 방법은 다양하다.
댓글
댓글 쓰기