베이즈 네트워크

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색

베이즈 네트워크(bayesian network)는 변수들의 집합과 그들 간의 확률적 의존성을 나타내는 확률 그래프 모형이다. 일례로 베이즈 네트워크는 특정 징후의 존재 여부가 주어질 때 환자에게 특정 질병이 있는지의 확률을 계산하는 데 사용될 수 있다. "베이즈 네트워크"라는 용어는 펄(Pearl)이 다음의 세 개 특징을 강조하면서 만들어졌다. (1) 입력 정보의 주관적인 특성, (2) 정보를 갱신하기 위한 기초로 베이지 조건에 의존함, (3) 추론의 원인과 증거 사이의 구분. 그리고, 이러한 것들은 토마스 베이즈의 1763년 논문에 기초하고 있다.

형식적으로, 베이즈 네트워크는 방향성 비순환 그래프로서, 그래프의 각 마디(node)는 변수를 나타내고, 마디를 연결하는 호(arc)는 변수 간의 조건부 의존성(conditional dependency)을 표현한다. 마디는 측정된 모수, 잠재 변수, 가설 등 어떤 종류의 변수든 표현할 수 있다.

베이즈 네트워크에서는 추론학습을 수행하기 위한 효과적인 알고리즘이 존재한다. 음성 신호단백질 순열과 같은 일련의 변수를 모형화하는 베이지 네트워크를 동적 베이즈 네트워크(dynamic Bayesian network)라고 부른다. 불확실성 하에 문제를 표현하고 해를 구할 수 있는 베이즈 네트워크의 일반화를 영향 다이어그램이라고 부른다.

추론[편집]

베이즈 네트워크는 변수와 그들 간의 관계에 대한 완벽한 모형화이기 때문에, 변수들에 대한 확률적 질의에 답하는 데 사용될 수 있다.

모수 학습[편집]

베이즈 네트워크를 완전히 명시하고, 결합 확률 본포를 완전히 표현하기 위해서는 X의 부모 조건 하에서 X의 확률 분포를 각 마디 X에 대해 결정하여야 한다.

구조 학습[편집]

단순한 경우라면, 베이즈 네트워크는 전문가에 의해 명시되어 추론을 수행하기 위해 사용될 수 있으나, 다른 응용에서는 인간이 네트워크를 정의하기에는 너무 복잡할 수 있다. 이러한 경우에 네트워크의 구조와 지역적 분포의 모수들은 자료로부터 학습되어야 한다.

베이즈 네트워크의 구조를 학습하는 것은 기계 학습의 매우 중요한 부분이다.

응용 분야[편집]

베이즈 네트워크는 생물 정보학, 약학, 문서 분류, 영상 처리, 자료 양합결정 지원 시스템 등의 분야에서 지식을 모형화하는 데 사용되고 있다.

함께 보기[편집]

참고 문헌[편집]

  • Ben-Gal I., Bayesian Networks, in Ruggeri F., Faltin F., Kenett R. (Eds.), Encyclopedia of Statistics in Quality and Reliability, John Wiley & Sons, 2007.