본문으로 이동

데이터 사전

위키백과, 우리 모두의 백과사전.
데이터 사전의 간단한 레이아웃

IBM 컴퓨팅 사전의 정의에 따르면 데이터 사전(data dictionary) 또는 메타데이터 저장소는 "의미, 다른 데이터와의 관계, 출처, 사용법 및 형식과 같은 데이터에 관한 정보의 중앙 집중식 저장소"이다.[1] 오라클은 이를 메타데이터가 포함된 테이블의 집합으로 정의한다. 이 용어는 데이터베이스데이터베이스 관리 시스템(DBMS)과 관련하여 다음과 같은 몇 가지 밀접하게 연관된 의미 중 하나를 가질 수 있다.

  • 데이터베이스 또는 데이터베이스 모음을 설명하는 문서
  • 데이터베이스의 구조를 결정하는 데 필요한 DBMS의 필수 구성 요소
  • DBMS 고유의 데이터 사전을 확장하거나 대체하는 미들웨어의 일종

문서화

[편집]

데이터 사전 및 데이터 저장소라는 용어는 카탈로그보다 더 일반적인 소프트웨어 유틸리티를 의미한다. 카탈로그는 DBMS 소프트웨어와 밀접하게 결합되어 있다. 카탈로그는 저장된 정보를 사용자나 DBA에게 제공하기도 하지만, 주로 DDLDML 컴파일러, 질의 최적화기, 트랜잭션 프로세서, 보고서 생성기 및 제약 조건 적용기와 같은 DBMS 자체의 다양한 소프트웨어 모듈에 의해 액세스된다. 반면, 데이터 사전은 메타데이터, 즉 정보에 관한 (구조화된) 데이터를 저장하는 데이터 구조이다. 독립형 데이터 사전 또는 데이터 저장소용 소프트웨어 패키지는 DBMS의 소프트웨어 모듈과 상호 작용할 수도 있지만, 주로 정보 자원 관리를 위해 컴퓨터 시스템의 설계자, 사용자 및 관리자에 의해 사용된다. 이러한 시스템은 시스템 하드웨어 및 소프트웨어 구성, 문서화, 애플리케이션 및 사용자에 대한 정보뿐만 아니라 시스템 관리와 관련된 기타 정보를 유지 관리한다.[2]

데이터 사전 시스템이 DBMS 소프트웨어가 아닌 설계자, 사용자 및 관리자에 의해서만 사용되는 경우 이를 수동적(passive) 데이터 사전이라고 한다. 그렇지 않은 경우 능동적(active) 데이터 사전 또는 데이터 사전이라고 한다. 수동적 데이터 사전이 업데이트될 때는 DBMS(데이터베이스) 구조의 변경과 무관하게 수동으로 수행된다. 능동적 데이터 사전의 경우, 사전이 먼저 업데이트되고 그 결과로 DBMS의 변경 사항이 자동으로 발생한다.

데이터베이스 사용자응용 프로그램 개발자는 하나 이상의 데이터베이스에 대한 조직, 내용 및 규칙을 분류하는 권위 있는 데이터 사전 문서로부터 이점을 얻을 수 있다.[3] 여기에는 일반적으로 다양한 테이블(레코드 또는 엔티티) 및 해당 내용(필드)의 이름과 설명, 그리고 각 데이터 요소유형 및 길이와 같은 추가 세부 정보가 포함된다. 데이터 사전이 제공할 수 있는 또 다른 중요한 정보는 테이블 간의 관계이다. 이는 때때로 개체-관계 다이어그램(ERD)에서 언급되거나, 집합 기술자를 사용하는 경우 데이터베이스 테이블이 어떤 집합에 참여하는지 식별하는 데 사용된다.

능동적 데이터 사전에서는 기본 데이터에 제약 조건이 부여될 수 있다. 예를 들어, 데이터 요소(필드)의 숫자 데이터 값에 범위가 지정되거나, 테이블의 레코드가 다른 레코드 유형과 설정된 관계에 참여하도록 강제될 수 있다. 또한 분산 DBMS는 능동적 데이터 사전 내에 기술된 특정 위치 세부 정보(예: 테이블이 물리적으로 위치한 곳)를 가질 수 있다.

데이터 사전은 지원되는 각 백엔드 DBMS에 맞게 시스템 생성 명령 파일에 의해 데이터베이스에 생성된 레코드 유형(테이블)으로 구성된다. 오라클은 "sys" 사용자를 위한 특정 뷰 목록을 보유하고 있다. 이를 통해 사용자는 필요한 정확한 정보를 찾아볼 수 있다. 명령 파일에는 해당 유형의 데이터베이스에서 요구하는 특정 문을 사용하여 `CREATE TABLE`, `CREATE UNIQUE INDEX`, `ALTER TABLE`(참조 무결성용) 등에 대한 SQL 문이 포함되어 있다.

이러한 문서의 상세 수준에 대해서는 보편적인 표준이 없다.

미들웨어

[편집]

데이터베이스 애플리케이션을 구축할 때, 기본 DBMS 데이터 사전과 통신하는 추가적인 데이터 사전 소프트웨어 계층, 즉 미들웨어를 도입하는 것이 유용할 수 있다. 이러한 "상위 수준" 데이터 사전은 일반적인 애플리케이션의 요구 사항이 아닌 DBMS의 기본 기능을 지원하는 것이 주 목적인 고유의 "하위 수준" 데이터 사전의 한계를 넘어서는 추가 기능과 유연성을 제공할 수 있다. 예를 들어, 상위 수준 데이터 사전은 공통 데이터베이스를 공유하는 서로 다른 애플리케이션에 적합하도록 맞춤화된 대체 개체-관계 모델을 제공할 수 있다.[4] 데이터 사전의 확장은 분산 데이터베이스에 대한 질의 최적화에도 도움을 줄 수 있다.[5] 또한 능동적 데이터 사전과 밀접하게 결합된 재구조화 도구를 사용하여 DBA 기능이 자동화되는 경우가 많다.

고속 응용 프로그램 개발을 목표로 하는 소프트웨어 프레임워크에는 상위 수준 데이터 사전 기능이 포함되기도 하며, 이는 데이터베이스 자체를 포함하여 메뉴, , 보고서 및 기타 데이터베이스 애플리케이션 구성 요소를 구축하는 데 필요한 프로그래밍 양을 상당히 줄여줄 수 있다. 예를 들어, PHPLens에는 여러 데이터베이스에 대해 이식성 있게 테이블, 인덱스 및 외래 키 제약 조건을 자동으로 생성하는 PHP 클래스 라이브러리가 포함되어 있다.[6] RADICORE 툴킷의 일부인 또 다른 PHP 기반 데이터 사전은 데이터 유효성 검사 및 복잡한 조인이 포함된 메뉴와 폼을 위한 프로그램 객체, 스크립트 및 SQL 코드를 자동으로 생성한다.[7] ASP.NET 환경의 경우, 베이스 원 인터내셔널(Base One International)의 데이터 사전은 자동 데이터베이스 생성, 데이터 유효성 검사, 성능 향상(캐싱 및 인덱스 활용), 애플리케이션 보안 및 확장된 자료형을 위한 크로스 DBMS 기능을 제공한다.[8] 비주얼 데이터플렉스(Visual DataFlex)의 기능[9]은 데이터 사전을 클래스 파일로 사용하여 사용자 인터페이스와 기본 데이터베이스 사이의 중간 계층을 형성하는 기능을 제공한다. 이는 하나 이상의 관련 애플리케이션 전체에서 데이터 무결성을 유지하고 비즈니스 규칙을 시행하기 위한 표준화된 규칙을 생성하는 것을 목적으로 한다.

일부 산업에서는 시스템 간의 상호 운용성을 보장하기 위해 일반화된 데이터 사전을 기술 표준으로 사용한다. 예를 들어 부동산 산업은 전미 부동산 중개인 협회(National Association of Realtors)가 정책 핸드북을 통해[10] 자사의 다중 목록 서비스(MLS)가 준수하도록 강제한[11] RESO 데이터 사전을 따른다. MLS의 고유 데이터베이스를 위한 이 중간 매핑 계층은 MLS 조직에 API 서비스를 제공하는 소프트웨어 회사들에 의해 지원된다.

플랫폼별 예시

[편집]

개발자들은 IBM i 환경에서 데이터를 처리하는 애플리케이션 프로그램의 외부에 있는 파일 설명의 데이터 속성을 설명하기 위해 데이터 설명 사양(DDS)을 사용한다.[12] 오라클의 sys.ts$ 테이블은 데이터베이스의 모든 테이블에 대한 정보를 저장한다. 이는 오라클 데이터베이스가 생성될 때 함께 생성되는 데이터 사전의 일부이다.[13] 개발자들은 또한 개방형 환경에서 구조화된 트랜잭션 쿼리를 위해 자유-오픈 소스 소프트웨어(FOSS)의 DDS 컨텍스트를 사용할 수도 있다.

일반적인 속성

[편집]

다음은 열이나 필드에 대한 데이터 사전에 있는 일반적인 항목의 대략적인 목록이다.

  • 엔터티 또는 양식 이름 또는 해당 ID(EntityID 또는 FormID). 이 필드가 속한 그룹이다.
  • RDBMS 필드 이름과 같은 필드 이름
  • 표시된 필드 제목. 비어 있는 경우 기본적으로 필드 이름이 사용될 수 있다.
  • 필드 유형(문자열, 정수, 날짜 등)
  • 최소값 및 최대값, 표시 너비, 소수 자릿수 등의 측정값이다. 필드 유형에 따라 이를 다르게 해석할 수 있다. 대안은 필드 유형에 따라 다른 속성을 갖는 것이다.
  • 필드 표시 순서 또는 탭 순서
  • 화면의 좌표(위치 기반 또는 그리드 기반 UI인 경우)
  • 기본값
  • 드롭다운 목록, 콤보 상자, 체크 상자, 범위 등과 같은 프롬프트 유형
  • 필수 여부 (불리언) - 'true'인 경우 값은 공백, null 또는 공백일 수 없다.
  • 읽기 전용(불리언)
  • 참조 테이블 이름(외래 키인 경우) 유효성 검사 또는 선택 목록에 사용할 수 있다.
  • 다양한 이벤트 핸들러 또는 참조. 예: "클릭 시", "검증 시" 등. 사건 기반 프로그래밍 문서 참고.
  • 정규 표현식 또는 COBOL 스타일 "PIC" 문과 같은 형식 코드
  • 설명 또는 개요
  • 데이터베이스 인덱스 특성 또는 사양

같이 보기

[편집]

각주

[편집]
  1. ACM, IBM Dictionary of Computing, 10th edition, 1993
  2. Ramez Elmasri, Shamkant B. Navathe: Fundamentals of Database Systems, 3rd. ed. sect. 17.5, p. 582
  3. TechTarget, SearchSOA, What is a data dictionary? 보관됨 12 2월 2009 - 웨이백 머신
  4. U.S. Patent 4774661, Database management system with active data dictionary, 19 November 1985, AT&T
  5. U.S. Patent 4769772, Automated query optimization method using both global and parallel local optimizations for materialization access planning for distributed databases, 28 February 1985, Honeywell Bull
  6. PHPLens, ADOdb Data Dictionary Library for PHP 보관됨 7 11월 2007 - 웨이백 머신
  7. RADICORE, What is a Data Dictionary?
  8. Base One International Corp., Base One Data Dictionary
  9. VISUAL DATAFLEX,features 보관됨 5 4월 2018 - 웨이백 머신
  10. Handbook on Multiple Listing Policy (영어). nar.realtor. January 2015. 2020년 10월 11일에 확인함.
  11. Real Estate Transaction Standards (RETS) Web API (영어). nar.realtor. 2015년 1월 23일. 2020년 10월 11일에 확인함.
  12. DDS documentation for IBM System i V5R3.
  13. Oracle Concepts - Data Dictionary. dba-oracle.com. 2017년 2월 13일에 확인함.

외부 링크

[편집]
  • 위키미디어 공용에 데이터 사전 관련 미디어 분류가 있습니다.