선형 판별 분석

위키백과, 우리 모두의 백과사전.

선형 판별 분석(Linear discriminant analysis, LDA), 정규 판별 분석(normal discriminant analysis, NDA) 또는 판별 함수 분석(discriminant function analysis)은 통계 및 기타 분야에서 사용되는 방법인 피셔의 선형 판별(Fisher's linear discriminant)을 일반화하여 두 개 이상의 클래스를 특성화하거나 구분하는 특징의 선형 조합을 찾는 것이다. 사물이나 사건의. 결과 조합은 선형 분류기로 사용될 수 있으며, 더 일반적으로는 나중에 분류하기 전에 차원 축소를 위해 사용될 수 있다.

LDA는 하나의 종속 변수를 다른 특징이나 측정값의 선형 조합으로 표현하려고 시도하는 분산 분석(ANOVA) 및 회귀 분석과 밀접한 관련이 있다.[1][2] 그러나 ANOVA는 범주형 독립변수와 연속형 종속변수를 사용하는 반면, 판별분석은 연속형 독립변수와 범주형 종속변수(즉, 클래스 레이블)를 사용한다.[3] 로지스틱 회귀 분석과 프로빗 회귀 분석은 연속 독립 변수의 값으로 범주형 변수를 설명한다는 점에서 ANOVA보다 LDA와 더 유사하다. 이러한 다른 방법은 LDA 방법의 기본 가정인 독립 변수가 정규 분포를 따른다고 가정하는 것이 합리적이지 않은 응용 분야에서 선호된다.

LDA는 또한 데이터를 가장 잘 설명하는 변수의 선형 조합을 찾는다는 점에서 주성분 분석(PCA) 및 인자 분석과 밀접한 관련이 있다. LDA는 명시적으로 데이터 클래스 간의 차이를 모델링하려고 시도한다.[4] 대조적으로 PCA는 클래스의 차이를 고려하지 않으며 인자 분석은 유사성보다는 차이점을 기반으로 기능 조합을 구축한다. 판별 분석은 상호의존 기법이 아니라는 점에서 요인 분석과도 다르다. 즉, 독립 변수와 종속 변수(기준 변수라고도 함)를 구별해야 한다.

LDA는 각 관찰에 대한 독립 변수에 대한 측정값이 연속 수량일 때 작동한다. 범주형 독립변수를 다룰 때 동등한 기법은 판별 대응 분석이다.[5][6]

판별 분석은 그룹이 선험적으로 알려진 경우(클러스터 분석과 달리) 사용된다. 각 케이스에는 하나 이상의 정량적 예측 변수 측정값에 대한 점수와 그룹 측정값에 대한 점수가 있어야 한다.[7] 간단히 말해서 판별 기능 분석은 분류, 즉 동일한 유형의 그룹, 클래스 또는 범주로 사물을 배포하는 행위이다.

같이 보기[편집]

각주[편집]

  1. Fisher, R. A. (1936). “The Use of Multiple Measurements in Taxonomic Problems” (PDF). 《Annals of Eugenics》 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x. hdl:2440/15227. 
  2. McLachlan, G. J. (2004). 《Discriminant Analysis and Statistical Pattern Recognition》. Wiley Interscience. ISBN 978-0-471-69115-0. MR 1190469. 
  3. Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288
  4. Martinez, A. M.; Kak, A. C. (2001). “PCA versus LDA” (PDF). 《IEEE Transactions on Pattern Analysis and Machine Intelligence》 23 (2): 228–233. doi:10.1109/34.908974. 2008년 10월 11일에 원본 문서 (PDF)에서 보존된 문서. 2010년 6월 30일에 확인함. 
  5. Abdi, H. (2007) "Discriminant correspondence analysis." In: N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistic. Thousand Oaks (CA): Sage. pp. 270–275.
  6. Perriere, G.; Thioulouse, J. (2003). “Use of Correspondence Discriminant Analysis to predict the subcellular location of bacterial proteins”. 《Computer Methods and Programs in Biomedicine》 70 (2): 99–105. doi:10.1016/s0169-2607(02)00011-1. PMID 12507786. 
  7. Büyüköztürk, Ş. & Çokluk-Bökeoğlu, Ö. (2008). Discriminant function analysis: Concept and application. Egitim Arastirmalari - Eurasian Journal of Educational Research, 33, 73-92.

외부 링크[편집]