본문 바로가기

데이터 분석 입문

상관분석

반응형

상관분석은 데이터 간의 관계를 파악하는 통계적인 분석 방법 중 하나로, 데이터 분석가나 연구자에게 매우 유용한 도구입니다. 즉 변수와 변수 간의 관계를 파악하는 것이 상관분석입니다.

변수A  -  변수B 

이번 글에서는 상관분석의 개념, 사용 방법, 해석 방법 등에 대해 알아보겠습니다.상관분석의 개념과 목적: 상관분석은 두 변수 간의 관계를 측정하고 이를 수치화하는 분석 방법입니다. 두 변수가 함께 움직이는 경향이 있는지, 그리고 얼마나 강한 관련성이 있는지를 파악할 수 있습니다. 이를 통해 한 변수의 변화가 다른 변수에 어떤 영향을 미치는지 예측하거나 설명할 수 있습니다. 상관분석의 목적은 변수 간의 관계를 이해하고 예측력을 향상시키는 데에 있습니다.

 

https://en.wikipedia.org/wiki/Pearson_correlation_coefficient

 

상관분석의 종류: 가장 일반적으로 사용되는 상관분석 방법에는 피어슨 상관계수(Pearson correlation coefficient),

스피어만 상관계수(Spearman's rank correlation coefficient), 켄달의 순위 상관계수(Kendall's rank correlation coefficient)가 있습니다.

 

1. 피어슨 상관계수는 두 변수 X와 Y 간의 선형 상관 관계를 계량화한 수치입니다. 피어슨 상관 계수는 +1과 -1 사이의 값을 가지며, +1로 갈수록 양의 선형 관계, -1로 갈수록 음의 선형관계를 가집니다. 일반적으로 상관관계는 피어슨 상관계수를 사용합니다.

https://ko.wikipedia.org/wiki/%ED%94%BC%EC%96%B4%EC%8A%A8_%EC%83%81%EA%B4%80_%EA%B3%84%EC%88%98

 

2. 스피어만 상관계수는 두 변수의 순위 사이의 통계적 의존성을 측정하는 비모수적인 척도입니다. 스피어만 상관계수는 피어슨 상관계수와 달리 변수 간의 관계가 비선형이거나 정규분포를 따르지 않을때 유용하게 사용됩니다. 또한, 이상치에 영향을 받지 않는 강인한 특성을 가지고 있어서 비모수적인 상관분석 방법으로 널리 사용됩니다. 피어스 상관계수와 마찬가지고 +1에 가까울수록 양의 관계, -1에 가까울수록 음의 관계, 0에 가까울수록 두 변수간의 관계가 없음을 의미합니다.

https://codingcoding.tistory.com/226

3. 켄달의 순위 상관계수는 두 변수 간의 순위 관계를 측정하는 비모수적인 상관분석 방법입니다. 스피어만 상관계수와 유사하게 순위 형태의 데이터나 비선형적인 관계를 분석하는 데에 적합합니다.

 

상황에 따라 적절한 상관계수를 선택하여 분석해야 합니다.

상관분석의 수행 단계: 상관분석을 수행하기 위해서는 다음과 같은 단계를 따릅니다.

 

 

 

 

1.데이터 수집: 분석할 변수에 대한 데이터를 수집합니다.

2. 데이터 전처리: 이상치나 결측치를 처리하고 변수를 정규화합니다.

3. 상관분석 수행: 선택한 상관계수를 사용하여 상관분석을 수행합니다.

4. 결과 해석: 상관계수의 크기와 부호를 해석하여 변수 간의 관계를 이해합니다.

 

 

 

 

 

 

 

 

 

 

상관분석 결과는 상관계수의 값과 부호를 통해 해석됩니다. 상관계수는 -1부터 1까지의 값을 가지며, 0에 가까울수록 두 변수 간의 관계가 약하고, 절댓값이 1에 가까울수록 관계가 강합니다. 부호는 두 변수 간의 관계의 방향을 나타내며, 양수는 양의 상관관계를, 음수는 음의 상관관계를 의미합니다.

 

상관분석의 한계와 주의사항으로는 상관분석은 단순히 두 변수 간의 관계를 파악하는 것이므로 인과관계를 증명하지는 않습니다. 또한, 상관계수는 선형적인 관계만을 고려하므로 비선형적인 관계는 파악하지 못할 수 있습니다. 또한, 데이터의 크기나 표본의 특성에 따라 상관계수의 신뢰성이 달라질 수 있으므로 주의해야 합니다.

 

반응형

'데이터 분석 입문' 카테고리의 다른 글

ANOVA 분석  (0) 2023.07.04
의사결정나무  (0) 2023.06.29
회귀분석  (0) 2023.06.25