메타데이터

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색

메타데이터(metadata)는 데이터(data)에 대한 데이터이다. 이렇게 흔히들 간단히 정의하지만 엄격하게는, Karen Coyle에 의하면 "어떤 목적을 가지고 만들어진 데이터 (Constructed data with a purpose)"라고도 정의한다. 가령 도서관에서 사용하는 서지기술용으로 만든 것이 그 대표적인 예이다. 지금은 온톨로지의 등장과 함께 기계가 읽고 이해할 수 있는 (Machine Actionable)한 형태의 메타데이터가 많이 사용되고 있다.

개요[편집]

데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터이다. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다.[1]

이를테면, 디지털 카메라에서는 사진을 찍어 기록할 때마다 카메라 자체의 정보와 촬영 당시의 시간, 노출, 플래시 사용 여부, 해상도, 사진 크기 등의 사진 정보를 화상 데이터와 같이 저장하게 되어 있다. 이러한 데이터를 분석하여 이용하면 그 뒤에 사진을 적절하게 정리하거나 다시 가공할 때에 아주 유용하게 쓸 수 있는 정보가 된다. GPS 기능을 사용하여 위치 정보까지 사진의 메타데이터에 입력할 수도 있는데, 이를 이용하면 사진이 어디에서 촬영되었는지를 쉽게 알 수 있고, 이로써 다시 다른 지역 정보를 검색하거나 같은 지역에서 찍은 다른 사진을 검색하게 하는 검색성을 향상시킬 수 있다.

메타데이터는 메타데이터가 부여될 때와 쓰일 때의 문맥 정보를 구조화시켜 그 활용도를 확대시키는 역할을 한다. 웹 2.0이나 온톨로지(Ontology)의 분야에서 구조화된 메타데이터는 매우 유용하다.

표준화[편집]

MARC(Machine Readable Cataloging, 기계가독목록) 메타데이터 형식을 대체하기 위해 1995년 3월 OCLC와 NCSA는 미국 오하이오 주의 더블린에서 첫 워크숍이 개최되었고, 더블린 코어라고 하는 메타데이터 형식을 만들었다. 이 형식은 단순화되었기 때문에 생성과 유지가 쉽고, 이해가 쉬우며, 국제적으로 인정되는 형식을 갖추도록 하였고, 확장성을 가질 수 있는 구조로 만들었다.[1]

더블린 코어의 요소로는 제목, 만든이, 주제, 요약 정보 등 15가지 요소로 이루어진다. 덤다운(Dumb down) 원칙에 따라 상세화를 위해 쓰여진 한정어 때문에 오히려 그 뜻이 모호해지는 것을 막도록 한정 요소를 바꾸거나 빼고 상위 개념을 남겨두어 하위 개념을 같이 포함하도록 하는 단순화를 통해 안정적인 의미 전달을 하고자 한다.

메타데이터의 간략사[편집]

인류사에서 여러 가지 메타데이터가 등장한다. 그 첫째는 카드목록이다. 전혀 목록이 필요없다가 가나다순, 서명순, 저자명 순 등의 메타데이터가 필요했던 것이다. 그 다음은 David Wheeler가 말하는 간접수준(Level of Indirection)을 올리는 일이었다. 그는 컴퓨터 사이언스가 지금까지 한 공헌 중에서 가장 위대한 것이 있다면 바로 이 간접수준을 올렸다는 것이다. 바로 MARC와 같은 메타데이터이다. 그 다음이 Tim Berners-Lee가 말하는 Machine Actionable Metadata 이다. 기계는 전혀 모르는 flat한 메타데이터가 아니라, 기계가 스마트하게 알고 반응하는 메타데이터를 말한다. 텍스트의 바다요 아름다운 정원에 갇혀있는 엄청난 크기의 카탈로그의 문제를 Linked Data가 해결할 수 있는 모습을 보여주었고 이제는 웹 그 자체가 고질적으로 안고 있는 문제이다. 어쩌면 웹과 도서관이 서로 도와야 하는 부분이 이런 부분일 것이다.

같이 보기[편집]

각주[편집]

  1. 정봄. "미래 도서관의 모습…클라우드가 해답". 머니투데이. 2015년 3월 4일.

바깥 고리[편집]