시맨틱 메타데이터 레포지토리

Saltlux

Jump to: navigation, 찾기

목차

개요

이 문서에서는 시맨틱 메타데이터 저장 및 관리에 대한 전반적인 내용들을 다루고자 합니다. 우선 메타데이터에 대해 살펴본 다음 시맨틱 기술이 메타데이터를 보완하여 시맨틱 메타데이터가 탄생하게 된 배경을 통해 전체적인 흐름을 살펴봅니다. 이후 시맨틱 메타데이터를 저장하는 관점 별 차이를 설명하며 관련 표준과 사례를 알아보도록 하겠습니다.

메타데이터

메타데이터는 정보 자원의 속성을 기술하는 데이터로서 흔히 data about data(데이터에 대한 데이터)로 정의할 수 있습니다. 이러한 메타데이터를 사용하는 목적은 크게 두 가지로 나눌 수 있는데 첫 번째는 데이터 자체를 표현하기 위한 목적이고 두 번째는 데이터를 검색하기 위한 목적입니다. 또한 메타 데이터는 관리용 메타 데이터 요소를 가질 수 있는데 이를 통해 메타데이터 자체의 관리를 체계적이고 효율적으로 할 수 있는 장점이 있습니다.

Image:SRM_SAMPLE_METADATA.png
그림 1. 문서의 메타데이터 작성예 (publishers toolkit)

메타데이터는 사용 분야에 따라 여러 가지 정의와 기능을 가지고 다양한 포맷으로 사용됩니다. 예를 들어 기록 관리 메타데이터 분야에서는 메타데이터를 "기록의 맥락과 내용, 구조와 기록관리 전 과정을 기술한 데이터"(ISO 15489)로 정의하고 있습니다. 즉 기록에 대하여 맥락, 내용, 구조, 관리내력이라는 4가지 영역을 기술하는 데이터라고 이해할 수 있을 것입니다. 또한 기록관리 메타데이터는 기록을 생산, 관리, 유지, 이용 과정, 시스템과 이를 관장하는 정책을 확인하고 진본임을 증명하며 맥락을 파악하는 기능(ISO 23081)을 합니다. 대표적인 메타데이터들이 MARC, DC, MODS, ONIX 등을 들 수 있습니다. 그러나 이렇게 다양한 메타데이터가 존재함으로 발생하는 문제는 서로 다른 형식의 메타데이터를 사용하여 데이터 요소와 표현의 불일치가 발생하고 이에 따라 동일한 내용의 정보자원이 상이한 형식으로 표현되며 다른 형식의 메타데이터에는 접근할 수 없는 문제가 발생합니다. 따라서 이러한 이질적인 메타데이터의 상호운용성(interoperability) 확보가 큰 이슈로 대두되게 되었습니다.

메타데이터를 상호운용성 관점으로 접근하는 것은 데이터의 교환이라는 단순한 목적을 넘어서는 보다 포괄적인 개념입니다. 다른 환경의 시스템간의 정보를 교환 하는 것은 ‘소통’이 가능하다는 의미로 볼 수 있습니다. 여태껏 메타데이터의 상호운용성을 확보하기 위해 다양한 방법을 고려해 왔습니다. 일례로 DC, MARC 등을 이용하여 자원을 하나의 표준 메타데이터로 통합하여 표현하려는 시도, 다양한 메타데이터 형식과 기술 구조를 유지하면서 메타데이터 표준들을 상호 매핑하는 방법, 메타데이터 레지스트리(Metadata Registry)를 이용하는 방법 등이 메타데이터를 이용하여 상호운용성을 확보하려는 노력이라 할 수 있습니다.

지식과 메타데이터

저장되어 있는 오래된 문서의 정보를 다시 보고 싶다면 문서의 이름이나 키워드를 이용하여 검색해야 합니다. 기억에 의존한 검색은 적절한 정보를 찾아내기 힘들 수 있으므로 문서를 지식으로 재사용 하기 위해서는 문서의 정보를 구조화하여 저장할 필요가 있습니다. 즉, 지식은 문서의 정보를 구조화하여 저장한 모양새를 말합니다. 문서의 정보 구조와 구성요소를 메타데이터로 정의하고 공유할 수 있다는 것은 메타데이터가 데이터나 정보를 지식으로 변환시켜 사용자와 사업 관점의 확장에 기여할 수 있음을 의미합니다.

Image:SRM_KNOWLEDGE_AND_DATA.png
그림 2. 지식과 데이터

시맨틱 메타데이터 (Semantic Metadata)

메타데이터는 시맨틱 기술과 접목되었을 때 그 진가를 발휘할 수 있습니다. 개념과 관계를 표현하고 처리할 수 있는 시맨틱 영역과 데이터의 데이터가 만나 시너지 효과가 나타나게 됩니다. 데이터관점에서부터 bottom-up으로 메타데이터를 바라본다면 사업이나 프로세스 관점에서 top-down으로 메타데이메타 접근했을 때, 시맨틱 기술이 그 절충된 결과로 시맨틱 메타데이터라는 새로운 개념을 탄생시킵니다.

Image:SRM_MEANING_OF_SEMANTIC_METADATA.png
그림 3. 시맨틱 메타데이터와 저장소의 의미

메타데이터 스토어 (Metadata Store)

메타데이터의 저장소는 레지스트리(registry)와 레파지토리(repository)로 구분할 수 있습니다. 종종 혼동해서 쓰는 경우가 있지만 명확히 구분됩니다. 레지스트리는 사용 가능한(available) 메타데이터가 등록되어있는 공간을 의미합니다. 레파지토리는 접근이 가능하며 가공되어있는 공간에 저장되어 있는 공간을 의미합니다. 즉 등록과 관리의 측면에서 큰 차이점이 있습니다.

시맨틱 메타데이터 레지스트리 (Semantic Metadata Registry)

MDR(MetaData Registry)은 동일한 정보의 중복과 구문적, 문자적 차이를 식별할 수 있게 함으로써 의미적으로 동일한 요소들 간의 통합을 가능하도록 하기 위한 노력의 일환입니다.

MDR은 데이터의 요청과 등록을 유용하게 하고, 데이터에 대한 접근과 사용을 촉진하고, 메타데이터에 의하여 기술된 특징을 이용하여 데이터의 조작을 가능하게 함으로써 지능적 소프트웨어에 의한 자동화 방안을 용이하게 하고, CASE룰과 저장소(repository)를 위한 데이터 표현 메타모형의 개발을 가능하게 하며 전자 데이터 교환과 데이터 공유를 가능하게 합니다. 이러한 MDR은 다음과 같은 6개의 Part로 구성되어 있습니다.

<Part 1 프레임워크(Framework)>
ISO/IEC 11179의 6개 표준들의 유기적 관계와 MDR의 가장 중요한 개념적 모델의 요소인 데이터 요소 개념, 데이터 요소, 값 영역, 개념 영역간의 관계를 설명하고 있습니다.

<Part 2 분류(Classification)>
MDR 내의 관리항목들을 분류하고 분류 스킴 들을 등록하기 위한 절차와 기술에 대한 부분으로 MDR의 관리항목인 객체 클래스, 속성, 표현, 값 영역, 데이터 요소 개념, 데이터 요소는 모두 분류될 수 있습니다.

<Part 3 메타모형과 기본속성(Metamodel and Basic Attributes)>
MDR의 메타모형과 기본속성으로 11179 표준 중 핵심 부분으로서 MDR의 구조, 메타데이터 항목들의 기본 속성, 11179 표준의 범위를 다룹니다.

<Part 4 데이터 정의의 공식화(Formulation of data definitions)>
데이터와 메타데이터의 정의에 필요한 필수요건 및 권고요건을 기술을 다룹니다.

<Part 5 명명과 식별(Naming and identification principles)>
데이터 요소 개념, 개념 영역, 데이터 요소, 값 영역과 같은 관리항목에 이름과 식별자(identifier)를 부여하는 원칙을 제공. 각각의 관리항목들은 등록기관이 부여한 유일한 식별자를 부여 받습니다. 식별자는 등록기관 식별자(Registration Authority Identifier), 데이터 식별자(Data Identifier), 버전 식별자(Version Identifier) 등을 사용하며 이것들은 국제등록 데이터 식별자(International Registration Data Identifier)를 구성하는 요소 들입니다.

<Part 6 등록(Registration)>
관리항목에 대한 메타데이터의 등록에 관한 표준. MDR의 등록대상이 되는 정보의 종류, 등록에 필요한 조건과 절차, 또한 등록에 관여하는 이해관계자와 책임에 관한 내용입니다.


관련 표준

XMDR은 ISO 11179 Edition 3 에서 제안한 단계로서 eXtended MDR의 약자입니다. XMDR은 기존 MDR에 전문용어, 온톨로지, 개념 시스템과 같은 시멘틱 관리 능력을 이용하여 확장한 형태입니다. 이러한 확장을 통해 기존 MDR에서 다룰 수 없었던 복잡한 메타데이터 구조도 등록할 수 있습니다. 기존 MDR이 Administered Item의 관리와 메타모델의 등록이 핵심 이었다면 XMDR은 위에서 언급했듯이 온톨로지 등을 이용하여 Knowledge 관리와 메타모델 상호 운용성을 위한 확장이 핵심입니다.
Image:SRM_ISO_IEC_STANDARD.jpg
그림 4. ISO/IEC 11179 MDR 모형 개요

관련 사례

본 사례는 솔트룩스가 참여한 국가기록원의 온톨로지 기반 MDR 구축 사례에 대한 설명입니다. 국가기록원은 정부 내 다양한 포맷의 기록물을 관리하고 저장하는 기관으로 메타데이터에 대한 통합적인 저장과 관리에 대한 표준화된 기술을 필요로 하였고, 이를 해결하기 위해 시맨틱 웹 기술 기반의 MDR을 이용하여 이를 해결하였습니다.

Image:SRM_MDR_GOAL.jpg
그림 5. MDR 구축목표


Image:SRM_MDR_CONCEPT.jpg
그림 6. 국가기록원 MDR 개념도


Image:SRM_MDR_SYSTEM.jpg
그림 7. MDR 시스템 구성

콘텐트 히스토리 


[작성 : 솔트룩스 시맨틱 그룹]