차원 축소 (통계학)

위키백과, 우리 모두의 백과사전.

차원축소(次元縮小, 영어: dimensionality reduction)는 고차원 데이터로부터, 저차원의 데이터로 변환하는 방법이다. 저차원 표현이 원본 데이터의 일부 의미 있는 속성을 이상적으로는 본질적인 차원에 가깝게 유지하도록 고차원 공간의 데이터를 저차원 공간으로 변환하는 것이다. 고차원 공간에서 작업하는 것은 여러 가지 이유로 바람직하지 않을 수 있다. 원시 데이터는 차원의 저주로 인해 희소한 경우가 많으며 데이터 분석은 일반적으로 계산상 다루기 어렵다(제어 또는 처리가 어렵다). 차원 축소는 신호 처리, 음성 인식, 신경정보학, 생물정보학 등 다수의 관찰 및 다수의 변수를 다루는 분야에서 일반적이다.

방법은 일반적으로 선형 접근법과 비선형 접근법으로 구분된다. 접근 방식은 특징 선택과 특징 추출로 나눌 수도 있다. 차원 축소는 노이즈 감소, 데이터 시각화, 클러스터 분석에 사용하거나 다른 분석을 용이하게 하기 위한 중간 단계로 사용할 수 있다.

같이 보기[편집]

출처[편집]