넷마이너

위키백과, 우리 모두의 백과사전.

넷마이너
개발자사이람
안정화 버전
운영 체제마이크로소프트 윈도우
언어영어
종류네트워크 분석 사회 연결망 분석, 텍스트 마이닝, 시각화, 웹 데이터 수집
라이선스사유 상용 소프트웨어
웹사이트http://www.netminer.com

넷마이너는 사이람에서 개발한 사회연결망 분석을 위한 소프트웨어로 관계데이터에 대한 탐색적 분석과 시각화 작업을 실행할 수 있다. 직관적인 인터페이스와 관계 데이터의 변환, 분석, 통계, 시각화, 차트에 대한 기능을 통합적으로 제공하며, 파이썬 언어를 사용한 스크립트 프로그래밍으로 넷마이너 기능의 자동화, 반복화, 고도화 등이 가능하다. 2001년 버전 1이 출시된 이후 2011년 스크립트 기능을 탑재한 넷마이너 4가 출시되었으며, 2017년 뉴스, SNS, 인터뷰, 보고서 등 텍스트 데이터에서 자동으로 키워드(단어)를 추출하고, 추출된 단어 간 네트워크를 구성하여 연관 단어, 핵심 단어, 세부 주제를 파악할 수 있는 Semantic Network Analysis 기능이 추가되었다. 또한 2018년, SNS 데이터를 수집하여 NetMiner에서 분석할 수 있는 기능(SNS Data Collector)가 출시되었다.

현재 세계 160여개국의 다국적기업, 컨설팅회사, 정부기관, 공공연구기관, 대학 등에서 사용하고 있다. 대학 등의 강의 이수를 위한 수업용 라이선스가 무료로 제공되고 있다. 최신 버전인 넷마이너 4는 마이크로소프트 윈도우 OS (윈도 2000 이상)에서 사용할 수 있다.

버전[편집]

2001년 12월 21일 넷마이너가 첫 출시되었다. 가장 최신 버전은 2011년 5월 10일 출시된 넷마이너 4이다.

넷마이너[편집]

2001년 12월 21일 출시.

  • 연결망 분석 모듈과 연결망 시각화 모듈이 하나의 패키지 프로그램에 통합
  • 데이터 분석과 관리를 위한 사용자 인터페이스
  • 다층 연결망 데이터를 지원하는 데이터 구조 사용

넷마이너 2[편집]

2003년 4월 9일 출시

  • 외부 데이터 지원
  • 연결망 분석 모듈과 통계 분석 지원 및 성능 향상
  • 시각화 모듈 추가

넷마이너 3[편집]

2007년 5월 15일 출시

  • 대용량 데이터 지원을 위해 데이터 구조 개선
  • 표준화된 분석 과정을 위해 분석 및 시각화 모듈의 통합
  • 외부 데이터베이스로부터 데이터를 가져오기 할 수 있는 모듈 추가

넷마이너 4[편집]

2011년 5월 10일 출시

  • 파이썬 기반의 넷마이너 스크립트 탑재
  • NMF 파일의 암호화 기능
  • 네트워크 전파모형, 마이닝 기능(Classification, Regression, Anomaly Detection, Frequent Subgraph 등)
  • 2-모드 네트워크 분석 모듈 추가
  • 영어, 한글 비정형 텍스트 데이터 분석 기능 추가(형태소 분석 및 워드클라우드, 토픽 모델링)(버전 4.3.0)
  • NetMiner 확장프로그램 SNS Data Collector(페이스북, 트위터, 유튜브 데이터 수집) 소개
  • 현재(2018.9) 버전 4.4.1

파일 포맷[편집]

넷마이너 데이터 파일 포맷[편집]

  • .NMF

가져오기 및 내보내기 가능 포맷[편집]

  • Plain text data: .TXT, .CSV
  • MS-Excel data: .XLS, .XLSX
  • NetMiner 2 data: .NTF
  • UCINet data: .DL, .DAT
  • Pajek data: .NET, .VEC, .CLU, .PER
  • StOCNET data file: .DAT
  • Graph Modelling Language data: .GML(importing only)
  • Unstructured text data(비정형 텍스트 데이터): .TXT, .CSV

데이터 구조[편집]

넷마이너의 데이터 구조의 계층[편집]

데이터셋(DataSet)은 넷마이너의 모든 분석과 시각화의 기본 데이터 단위로 사용된다. 데이터셋은 메인노드셋과 서브노드셋, 1-모드 네트워크, 2-모드 네트워크의 4가지 요소로 구성되어 있다. 메인노드셋은 데이터셋에 1개만 입력될 수 있다. 나머지 3가지 구성요소는 2개 이상 입력될 수 있다. 워크파일(Workfile)은 데이터셋과 프로세스로그(ProcessLogs)로 구성되며 프로세스 로그는 분석과 시각화 작업을 수행하면 생성된다. 하나의 프로젝트(Project)에는 2개 이상의 워크파일이 저장될 수 있으며, 각각의 워크파일은 독립적으로 존재하기 때문에 메인노드의 노드 수나 종류 등이 같지 않아도 된다. 넷마이너의 데이터 구조는 아래와 같다.

Project > Workfile > Dataset > Data items

데이터 아이템[편집]

노드셋(Nodeset)[편집]

노드셋은 공통의 성질을 갖고 있는 노드들의 집합체이다.

네트워크 데이터[편집]

네트워크 데이터는 노드간의 관계를 나타내는 데이터로, 행렬이나 관계목록(link list)로 구성할 수 있다. 1-모드 네트워크란 공통의 성질을 갖는 노드간의 관계로 메인노드셋 내의 노드에 대해서만 허용한다. 메인노드셋과 서브노드셋의 서로 다른 노드셋에 속한 노드간의 관계는 2-모드 네트워크라 말한다.

노드와 링크의 속성[편집]

넷마이너에서는 노드와 링크에 대해 각각 속성값을 저장할 수 있다. 속성값은 숫자(number), 텍스트(text), 일자(datetime), 시간(time)이 가능하며 결측치(missing value)도 허용한다. 이 속성값은 데이터 분석과 시각화에 이용될 수 있다. 일부 분석 또는 시각화 모듈은 속성값을 입력 데이터로 요구하기도 한다. 속성값을 이용해 전체 데이터 중 일부를 추출할 수도 있으며, 시각화에서는 스타일링을 위해 사용된다.

데이터셋(Dataset)[편집]

다수의 데이터셋[편집]

데이터셋은 2개 이상의 노드셋을 가질 수 있으며, 1개의 메인노드셋과 여러 개의 서브노드셋으로 나뉜다.

다수의 네트워크 데이터(레이어)[편집]

데이터셋은 2개 이상의 네트워크 데이터를 가질 수 있다. 1-모드 네트워크는 메인노드셋에 속한 노드간의 관계 데이터이다. 2개 이상의 독립적인 1-모드 네트워크가 메인노드셋의 노드에 대하여 형성될 수 있다. 예를 들어 {A, B, C, D, E, F}의 6개의 노드가 메인노드셋에 있을 때, "좋아함"과 "싫어함"의 2가지 관계가 정의될 수 있다.

1. "좋아하다"에 대한 1-모드 네트워크 = {(A,B), (A,C), (B,D), (C,E)} 2. "싫어하다"에 대한 1-모드 네트워크 = {(A,C), (B,C), (D,E), (A,E)}

넷마이너에서는 동일한 노드셋들에 대한 노드간의 관계에 대한 집합을 네트워크 레이어(network layer)라고도 표현하며, 메인노드셋에 대해서는 1-모드 네트워크 레이어가 생성될 수 있고, 메인노드와 특정 서브노드셋에 대해서는 2-모드 네트워크 레이어가 생성될 수 있다. 다수의 네트워크 데이터(레이어)는 분석 또는 시각화 과정에서 하나의 네트워크 데이터로 통합시킬 수 있다.

워크파일[편집]

워크파일(Workfile)은 데이터셋과 프로세스 로그로 구성된다. 넷마이너에서는 데이터셋과 모듈 프로세스를 연속적으로 관리하기 위해 워크파일의 개념을 사용한다. 프로세스로그는 세션(Session), 쿼리셋(QuerySets), 선택(Selections)로 구성되며, 프로세스의 실행 기록을 보여준다. 모듈이 실행되면, 세션이 생성되어 목록에 등록된다. 쿼리(질의문) 또는 선택이 저장되면 목록에 추가된다. 모듈의 수행이나 임의적인 수정에 의해 메인노드셋 내의 데이터가 변경되었을 경우 자동으로 새로운 워크파일이 생성되어 추가된다. 워크파일은 트리구조로 관리할 수 있으며, 사용자는 워크파일 트리를 이용하여 데이터 변경 이력을 추적할 수도 있다.

프로젝트(Project)[편집]

하나의 넷마이너 데이터 파일(확장자 .NMF 파일)은 하나의 프로젝트에 대응한다. 넷마이너에서는 하나의 프로젝트를 열람할 수 있다. 하나의 프로젝트는 다수의 워크파일을 포함할 수 있으며, 각각의 워크파일은 독립적으로 다룰 수 있다.

넷마이너 4 스크립트 워크벤치[편집]

넷마이너 4는 파이썬 스크립트 언어 기반의 스크립트 워크벤치를 탑재했다. 스크립트 생성기(Script generator)는 자동으로 스크립트를 생성할 수 있도록 한다. 사용자는 그래픽 유저 인터페이스(GUI) 뿐만 아니라 스크립트를 통해서도 넷마이너의 모듈을 실행할 수도 있다. 넷마이너의 대부분의 기능은 메뉴를 클릭하여 모듈을 실행하는 것 대신에 스크립트를 통해 수행할 수 있으며, 사용자는 데이터 분석의 일련의 과정을 저장하고 반복적으로 수행할 수 있다. 파이썬으로 작성된 다양한 라이브러리도 별도의 수정 없이 넷마이너 4에서 사용할 수 있으며, 파이썬에서 제공하는 일반적인 데이터 구조나 자료형도 넷마이너에서 이용할 수 있다. 사용자는 넷마이너의 기능을 조합하여 자신만의 알고리즘을 개발할 수도 있다. 작성한 스크립트는 플러그인 형태로 넷마이너 4의 메뉴로 등록하여 사용할 수 있으며, 다른 넷마이너 사용자와 공유할 수도 있다.

넷마이너 스크립트의 기능[편집]

파이썬 기반 스크립팅[편집]

넷마이너 스크립트는 무료로 제공되며 많은 사용자를 가지고 있는 파이썬을 기반으로 하고 있다. 파이썬 문법은 신규 사용자도 배우고 사용하기 쉬운 것으로 알려져 있다. 또한 파이썬으로 작성된 수학 또는 통계 라이브러리 등은 별도의 수정 없이 불러와 넷마이너 4가 제공하는 기능과 함께 사용할 수 있다. 반복문, 조건문을 이용하여 분석 작업을 심화시킬 수 있다. 또한 배치파일을 만들어 넷마이너를 자동으로 실행하고, 분석이나 시각화 작업을 자동으로 수행시킬 수 있다.

위지위그(WYSIWYG) 스크립팅[편집]

넷마이너는 GUI를 통해 사용자친화적인 사용 환경을 제공한다. 또한 넷마이너 스크립트도 GUI를 기반으로 하고 있다. GUI를 통해 실행되는 모든 넷마이너의 기능은 스크립트 언어로 표현하고 조정할 수 있다. 넷마이너 4의 모듈 자체는 실행 방식의 인터페이스에 관계없이 독립적으로 방식으로 수행된다. 스크립트 생성기(Script generator)는 넷마이너 상에서 GUI를 통해 메뉴를 실행하는 것과 동일하게 GUI 상태의 메뉴를 클릭하는 방법으로 스크립트를 생성한다.

주요 특징[편집]

넷마이너는 8가지의 주요 특징을 가지고 있다.

  • 표현형 연결망 데이터 모델: 넷마이너는 다양한 유형의 노드와 링크, 그리고 다양한 노드 속성과 링크 속성을 통합적으로 표현할 수 있는 데이터 모델을 사용한다.
  • 대규모 네트워크 데이터 처리: 적절한 라이선스와 컴퓨팅 환경의 조건 하에 1,000,000 노드와 10,000,000 링크 이상의 데이터를 처리할 수 있다.
  • 네트워크 분석과 방법론을 포괄: 데이터 변환을 위한 26가지 모듈, 네트워크 분석을 위한 66가지 모듈, 통계 분석을 위한 19가지 모듈, 네트워크 시각화를 위한 37가지 모듈을 탑재
  • 표준화된 옵션과 결과물: 넷마이너의 각 모듈들의 프로세스 과정을 5가지 단계로 표준화 - 입력데이터, 전처리, 주처리, 후처리, 결과
  • 직관적인 사용자 인터페이스: 복잡한 분석에 대해서도 그래픽 유저 인터페이스(GUI)를 통하여 작업의 흐름을 직관적으로 관리할 수 있다.
  • 스크립트 환경: 파이썬 스크립트 언어 기반의 스크립트 환경을 제공하며, 데이터 관리, 네트워크 분석, 시각화 등 넷마이너의 기능을 조작할 수 있다. 사용자는 넷마이너 스크립트를 이용하여 자신만의 플러그인을 제작할 수 있다.
  • 수치결과와 시각적 결과물의 제시: 수치적 분석 결과물과 함께 적합한 시각적 결과물이 자동으로 산출되기 때문에, 탐색적 분석과 직관적이고 동적인 네트워크 데이터의 해석과 이해가 가능하다.
  • 통계 분석을 위한 통합적 환경:네트워크 데이터의 통계 분석을 넷마이너 내에서 지원한다.

화면[편집]

네트워크 정보 보기
네트워크 맵 탐색 및 시각화 옵션
Matrix Diagram
Contour Chart
넷마이너 스크립트 워크밴치

같이 보기[편집]

외부 링크[편집]