Canonical Correlation Analysis 정준 상관분석 변수 그룹 간의 선형 상관관계를 탐색하는 분석 방법. ex. 자율성, 다양성, 반응도 등 3가지 변수로 구성된 요인과 경력 기여 만족도, 대인관계 만족도, 급여 만족도 등 3가지 변수로 구성된 요인이 존재할 때, 정준 상관분석은 두 요인(변량 그룹) 사이의 상관관계를 파악하고, 둘 사이의 상관성을 가장 잘 표현해주는 요인 변수들의 선형 결합을 찾는 분석방법이다. 정준 상관분석 = 요인 분석 + 다변량 회귀분석 //이라고 이해하면 편하다. 정준 상관 모형 다음과 같이 p, q개로 이루어진 두 변수 그룹 X 와X와 Y가 있다고 할 때, X와 Y를 소속된 개별 변수들 간의 선형 결합으로 이루어진 정준 변수 (canonical variate)라 하고, 정준 변수 X와 Y 사이의 상관계수 ρ를 정준.. Correlation Analysis (Spearman) 순서형 변수의 상관관계 분석 순서형 변수의 상관관계 분석은 서열 척도로 이루어진 변수들 간의 상관관계를 검정하기 위한 분석기법이다. 예를 들어 고객들의 구매액 기준 순위와 거래기간 기준 순위는 상관관계가 있을까? 혹은 고객들의 방문 빈도 기준 순위와 구매액 기준 순위는 상관관계가 얼마나 높을까 등과 같은 문제는 순서형 변수의 상관관계 분석 기법을 통해 파악할 수 있다. 스피어만 서열 상관계수 서열척도로 이루어진 변수들의 상관 관계 분석은 주로 Spearman 서열 상관관계 분석을 통해 수행한다. 스피어만 서열 상관계수는 원래의 자료 값 대신에 자료 값들의 순위 (rank)를 이용하여 상관계수를 구하는데, 두 수치형 변수 간의 상관계수는 다음과 같이 주어진다. x값들의 순위를 R_{1},...R_{n} 이.. Partial Correlations Analysis 편 상관관계 분석 특정 변수의 영향을 제거한 상태에서 두 변수 간의 순수한 상관관계를 파악하기 위해서는 편 상관관계 분석이라는 기법을 사용해야 한다. 편 (부분) 상관계수 특정 두 변수의 순수한 상관관계를 확인하고자 할 때 이 두 가지 변수에 영향을 미칠 수 있는 제3의 변수를 통제하거나 효과를 제거한 후 특정 두 변수의 순수한 상관관계를 파악하기 위한 분석기법이다. 예를 들면, 고객들의 객단가와 만족도가 0.8 이상의 매우 높은 상관관계가 있다고 하더라도, 이 두 가지 변수의 상관관계에 방문 횟수가 영향을 미친다고 판단될 경우, 방문 횟수를 통제한 상태에서 객단가와 만족도에 대한 순수한 상관관계를 파악해보아야 한다. 이론적으로 편 상관계수는 제 3의변수 (z)를 통제해야 하기 때문에 분석하고자 하는 두.. Correlation Analysis (Pearson) 두 개 이상 변수들 간의 상호 연관성을 판단하기 위한 상관관계 분석 기법을 살펴보고자 한다. 상관관계 분석은 [표 1]과 같이 변수의 특성과 사용 목적에 따라 다양한 분석 기법이 존재한다. 수치형 변수의 상관관계 분석에서는 변수들 간의 복합적인 상관관계에서 특정 변수의 영향력을 제거한 상태의 순수한 상관관계를 보는 편 상관관계 분석을 추가로 다루고자 한다. [표 1] 상관관계 분석의 종류 상관관계 분석 변수 특성 분석 목적 피어슨 상관관계 분석 수치형 변수간의 개별 상관관계 파악 수치형 변수로 이루어진 두 변수간의 선형적 연관성 파악 (ex. 개인 소득수준과 여행 빈도 간의 연관성) 스피어만 서열 상관관계 분석 순서형 변수간의 개별 상관관계 파악 서열척도로 이루어진 두 변수간의 연관성 파악 (ex. 중학.. paired samples t-test paired samples t-test paired samples t-test는 실험 전 집단과 실험 후 집단과 같이 쌍체로 이루어진 두 표본 집단의 평균을 비교하는 검정이다. 기업에서 고객 대상으로 캠페인을 진행하였는데 이로 인해 매출이 상승했을까?를 파악하기 위해서는 동일한 고객 집단의 캠페인 진행 이전과 이후의 고객 구매액을 비교해야 할 것이다. 이러한 검증을 paired samples t-test를 통해 수행할 수 있다. paired samples t-test 값 산출방식 동일한 표본이 두 개의 서로 다른 상황 (캠페인 진행 여부 혹은 시간의 흐름)에서 특정 수치형 변수의 평균의 동일 여부를 판단하는 분석방법으로 t값은 캠페인 전과 후 혹은 특정 시점과 그 이후 시점과 같이 쌍체로 이루어진 두 표.. independent sample t-test independent sample t-test independent sample t-test는 두 개의 독립된 그룹간의 특정 값의 평균을 비교하기 위해 사용하는 검정 방법이다. 만약 프랜차이즈 화장품 매장을 운영한다고 했을 때 강남지점과 명동지점의 평균 객단가는 동일하다고 볼 수 있을까? 두 지점의 평균 객단가가 유의미한 차이를 보이고 있다면 각 지점에 대한 전략이 달라져야 할 것이다. 이 뿐만 아니라 유지고객과 이탈고객간의 구매빈도차이, 성별 구매금액 차이 등을 검토 할 수 있도록 지원하는 분석 기법이다. independent sample t-test 값 산출방식 독립된 두 표본의 분산이 같을 경우와 분산이 다를 경우로 구분할 수 있다. 하지만 사실상 두 표본의 표준편차의 차이 값을 산출하는 공식만 다.. 이전 1 2 다음