본문 바로가기
Statistics Analysis

Canonical Correlation Analysis

by Nowkeeh Ahc

정준 상관분석

 변수 그룹 간의 선형 상관관계를 탐색하는 분석 방법.

ex. 자율성, 다양성, 반응도 등 3가지 변수로 구성된 요인과 경력 기여 만족도, 대인관계 만족도, 급여 만족도 등 3가지 변수로 구성된 요인이 존재할 때, 정준 상관분석은 두 요인(변량 그룹) 사이의 상관관계를 파악하고, 둘 사이의 상관성을 가장 잘 표현해주는 요인 변수들의 선형 결합을 찾는 분석방법이다.

정준 상관분석 = 요인 분석 + 다변량 회귀분석 //이라고 이해하면 편하다.

 

정준 상관 모형

 다음과 같이 p, q개로 이루어진 두 변수 그룹 X 와X와 Y가 있다고 할 때, X와 Y를 소속된 개별 변수들 간의 선형 결합으로 이루어진 정준 변수 (canonical variate)라 하고, 정준 변수 X와 Y 사이의 상관계수 ρ를 정준상관계수 (canonical correlation coefficients)라고 한다.

 

 정준상관분석의 목적은 정준 상관계수와 정준 변수를 추정하는 것 외에도 정준 적재량(canonical loadings)과 교차적재량(cross loadings)을 통해 두 변수 그룹 간의 관계에 대한 각 변수의 상대적 영향력을 확인하는 것이다. 정준 적재량은 정준 변수와 해당 정준 변수를 구성하는 측정 변수들 사이의 상관계수이며, 교차적재량은 정준 변수와 대립하는 정준 변수의 측정변수들 사이의 상관계수를 의미한다. 이를 통해 변수 그룹들 사이에 내포된 상대적 중요도의 의미 파악이 가능하다.

 

 

실습

A 쇼핑은 제품 만족도와 매장 만족도 사이에 연관이 있는지 알아보고 이를 마케팅 기획에 참고하고자 한다고 가정해보자.

우선, A 쇼핑 마케팅 팀은 제품 만족도에 해당하는 가격, 디자인, 품질 만족도와 매장 만족도에 해당하는 직원서비스, 매장 시설, 고객관리 변수에 대한 만족도를 설문 조사한 후, 이 데이터를 바탕으로 제품 만족도 변수 그룹과 매장 만족도 변수 그룹으로 나눠 정준 상관분석을 실시한다. 이를 위해 아래와 같은 가설을 수립하였다.

 

정준 상관분석 과정

#1. 모듈 및 데이터탑재
import pandas as pd
import numpy as np
from sklearn.cross_decomposition import CCA
from scipy import stats

df=pd.read_csv('data.csv'msep=',', encoding='CP949')
U=df[['품질','가격','디자인']]
V=df[['서비스','시설','고객관리']]


#2.  정준변수 구하기
cca=CCA(n_components=1).fit(U,V)
U_c, V_c=cca.transform(U,V)
U_c1=pd.DataFrame(U_c)[0]
V_c1=pd.DataFrame(V_c)[0]

print(U_c)
print('\n',V_c)


#3. 정준상관계수 구하기
CC1=stats.pearsonr(U_c1,V_c1)
print('제1정준상관계수:',CC1)

#4. 정준적재량, 교차적재량 구하기
print('제품만족도 정준변수와 해당 변수들간 정준적재량:',np.corrcoef(U_c1.T,U.T)[0,1:4])
print('제품만족도 정준변수와 매장만족도 변수들간 교차적재량:',np.corrcoef(U_c1.T,V.T)[0,1:])
print('매장만족도 정준변수와 해당 변수들간 정준적재량:',np.corrcoef(V_c1.T,V.T)[0,1:])
print('매장만족도 정준변수와 제품만족도 변수들간 교차적재량:',np.corrcoef(V_c1.T,U.T)[0,1:4])

Out

 제품만족도와 매장 만족도를 나타내는 변수 그룹 간의 정준 상관분석을 실시한 결과 제1 정준 상관계수는 0.77, p-value값은 0.00 이하로 유의 수준 99% 수준으로 유의미하며, 강한 양의 상관관계가 있음.

 


This post was written based on what I read and studied the book below.

http://www.kyobobook.co.kr/product/detailViewKor.laf?mallGb=KOR&ejkGb=KOR&barcode=9791195511754

댓글