사회 연결망 분석

위키백과, 우리 모두의 백과사전.
둘러보기로 가기 검색하러 가기

사회 연결망 분석(Social Network Analysis)이란 사회 연결망 데이터를 활용하여 사회 연결망과 사회 구조등을 사회과학적으로 분석하는 하나의 방식[1]이다.

기술의 발전에 더불어 사회의 객체들 사이의 관계는 더욱 복잡하고, 정교하게 변화하였다. 이런 관계들을 통해 특정 네트워크의 구조나 개인(노드)간의 상호관계등을 파악하는 것을 그 목표로 한다.

이런 분석을 하기 위해 수치화, 통계화, 그래프를 통한 시각화 등을 실시하며, 일련의 과정을 통해 발견된 어떤 형태나 패턴을 분석함으로써 사회구조, 연결망, 관계성, 그룹 또는 개인의 속성을 파악[2]하고자 한다.

이런 사회 연결망 분석은 다양한 학문과 연구에서 하나의 연구 방법으로서 활용되며, 마케팅경영학의 관점에서도 강력한 전략으로써 활용될 수 있다.

등장 배경[편집]

인간과 인간의 관계, 인간과 사회의 관계 등 다양한 관계들을 과학적으로 밝히고 분석하고자 하는 노력은 긴 역사를 가진다. 하지만 기술의 발전이 지속하며 20세기 후반부터 사회 연결망 분석에 대한 연구는 본격적으로 시작되었다. 21세기에 들어 인터넷의 발전과 Flickr, Twitter, Facebook, Instagram 등 다양한 소셜 네트워크 서비스(Social Network Service)의 등장으로 사회 연결망 분석은 다양한 분야에서 그 역할이 중대해졌으며 그 유용성이 과거에 비해 크게 증대[2]하였다. 실제로 19세기에 비해 인터넷이 발전한 20세기 사회 연결망 분석에 대한 연구는 매우 증가하였으며, 2000년대 초반보다 소셜 네트워크 서비스(Social Network Service)가 활발해진 2010년 이후의 사회 연결망 분석 연구 또한 매우 증가하였다. [3]

사회 연결망 분석 단계[편집]

사회 연결망 데이터 수집[편집]

사회 연결망 분석을 시행하기 위해서는 '데이터'를 필요로 한다. 이 데이터는 다양한 경로를 통해 수집이 가능하다. Flickr, Twitter, Facebook, Instagram, 등의 소셜 네트워크 서비스에서 데이터를 수집할 수 있으며, 개개인의 이메일에서 데이터를 수집할 수도 있다. 이런 데이터를 수집하는 방법에도 다양한 방법이 존재한다. 대표적으로는 '웹 크롤러' 기법을 통해 직접 수집이 가능하며, NodeXL 같은 다양한 프로그램을 통해서도 쉽게 데이터 수집이 가능[2]하다.

다만 이런 개개인의 데이터가 가지는 힘이 막강함과 그 위험성이 드러나게 되었고, 그 결과 Facebook을 시작으로 대부분의 소셜네트워크 서비스들은 각각의 'API'를 제한하며 개개인이 데이터를 수집할 수 있는 권한을 대폭 감소하게 되었다.

이 밖에도 인터뷰, 설문서, 관찰 등을 통해 직접 수집하는 방법 또한 존재한다.[2]

데이터 분석[편집]

수집된 데이터를 바탕으로 분석을 시행한다. 데이터를 분석하기 위해서는 R, Python 등 프로그램을 이용하기도 하나, 일반적으로 사회 연결망 분석 프로그램을 사용한다. 국내의 대표적인 프로그램으로는 'UCINET'과 'NetMiner'등이 있으며 해외의 대표적인 프로그램으로는 'NodeXL'등이 있다.[2]

데이터 시각화[편집]

분석을 마친 데이터를 파악하기 위해 시각화를 시행한다. 대부분 프로그램 안에 시각화 기능이 내장되어 있다. 분석방향과 필요한 정보에 따라 최종 시각화를 시행한다.

분석 요소[편집]

  • 연결정도(degree)

연결정도는 노드간의 총 연결관계 개수를 의미[2]한다. 즉 한 노드가 몇 개의 노드와 연결되어 있는지의 정도이다.

  • 포괄성(inclusiveness)

포괄성은 한 네트워크 내에서 서로 연결된 노드의 개수[2]를 뜻한다. 전체 네트워크에서 연결되어 있지 않은 노드들을 제거하고 남은 노드의 개수이다.

  • 밀도(density)

네트워크 내에서 노드 간의 전반적인 연결정도 수준을 나타내는 지표[2]이다. 즉 연결망 내 전체 구성원이 서로 간에 얼마나 많은 관계를 맺고 있는지를 표현한다. 네트워크 내에 존재하는 최대 가능한 관계 대비 실제 형성된 관계의 개수 비율로 계산하게 된다.

연결정도 중심성이란 한 노드가 연결망 내에서 연결된 다른 노드들의 합[2]을 말한다. 이를 통해 한 노드가 얼마나 많은 노드들과 관계를 맺고 있는지를 파악할 수 있으며, 해당 노드가 얼마나 많은 관계에 관여하는지 파악할 수 있다. 연결정도가 높은 노드는 다른 노드들과의 관계를 통해 정보 획득에 용이할 것이며, 네트워크 내에 핵심노드일 가능성이 높다.

  • 근접 중심성(closeness centrality)

근접 중심성이란 각 노드 간의 거리를 바탕으로 중심성을 측정하는 방식[2]이다. 연결정도 중심성은 직접 연결된 노드의 개수만을 파악한다면, 근접 중심성은 간접적으로 연결되어 있는 모든 노드간의 거리를 바탕으로 중심성을 측정한다. 직접 연결되어 있는 사람들을 통해 접근할 수 있는 간접적인 노드 간의 관계까지 파악하며, 연결정도 중심성보다 넓은 범위에서 중심성을 측정하게 된다. 간접적인 중심성이 크다면, 핵심 노드와의 관계가 많다는 뜻으로 다수의 핵심 노드들과의 관계를 통해 해당 네트워크 내의 핵심 노드일 가능성이 높다.

  • 매개 중심성(Betweenness centrality)

네트워크 내에서 한 노드가 다른 노드들 사이에 위치하는 정도를 나타내는 지표[2]이다. 즉 네트워크 내에서 어디에 위치하는지를 파악함으로써 해당 노드의 영향력을 파악할 수 있다. 네트워크 내의 매개 중심성이 높은 노드는 다른 핵심 노드들 사이에서의 중재자(broker) 역할을 수행하게 되며 핵심 노드로서 기능할 가능성이 높다.

  • 아이겐벡터 중심성(Eigenvector centrality)

네트워크 내에 한 노드와 연결된 다른 액터의 중심성을 가중치로 하여 계산하는 방식[2]이다. 즉 자신과 연결된 다른 노드들이 네트워크 내에서 얼마나 중요한지 파악하는 지표이다. 아이겐벡터 중심성이 높다면 연결정도가 적다 하더라도 높은 영향력을 가지며, 반대로 연결정도는 높지만 아이겐벡터 중심성이 낮다면 네트워크 내의 실질적인 영향력은 미미할 것으로 예측할 수 있다.

사회 연결망 분석의 유용성[편집]

사회 연결망 분석은 다양한 분야에서 다양한 목적에 의해 광범위하게 활용될 수 있다.

먼저 경영학적으로는 중심성을 파악함으로써, 소셜 네트워크 서비스 또는 네트워크 내에서 가장 강력한 영향력을 가지는 인물을 선정하여 홍보 효과를 극대화하는 마케팅 전략으로도 활용할 수 있다.

또한 특정 공간 내에서의 관계망을 분석함으로써 사회와 공간 간의 관계를 파악하고 이해할 수 있으며, 그 과정을 과학적으로 분석할 수 있다.

사회 연결망 분석의 대표적인 활용예시로는 '엔론 이메일 분석'을 들 수 있다.

엔론은 미국의 에너지, 물류 서비스 회사로 2001년 말 분식회계가 드러나며 파산하게 된다. 이를 '엔론 사태'라고 한다. 이후 법원의 결정에 따라 회사 직원들의 이메일 데이터가 공개되었다.

엔론 사태 발생 수개월 전부터 엔론 회사 네트워크 내의 각 직원(노드)들 간의 연결정도는 감소하기 시작하였으며, 각 노드의 연결정도 중심성은 감소한다. 반대로 네트워크 외부와의 연결정도는 증가하였으며 외부인들과의 네트워크 내에서의 중심성은 높아지는 분석 결과가 도출되었다.

즉 엔론 사태를 어느 정도 파악한 임직원들은 다른 회사를 알아보거나 구직활동을 시작하였던 것이고, 일부 엔론 사태를 예측한 외부인들은 회사 내 직원들에게 접근하기 시작했다.

이미 사건이 지난 후 분석이 이루어졌지만, 당시에 사회 연결망 분석을 시행했다면 이 사태를 일부분 예견할 수 있었을지도 모르는 일이다.

이렇듯 다양한 연구와 예측 등에도 사회 연결망 분석이 사용될 수 있으며, 앞으로 그 가치는 더욱 증대할 것이다.

각주[편집]

  1. 존 스콧 (2012.10.25). 《소셜 네트워크 분석》. 커뮤니케이션북스. 
  2. 곽기영 (2014). 《소셜 네트워크 분석》. 청람. 
  3. 김성희 (2010.12). “사회 연결망 분석 연구동향 및 정보학 분야에서의 활용가능성에 관한 연구”. 《정보관리학회지》 (한국정보관리학회).  [깨진 링크(과거 내용 찾기)]