국가 IT 온톨로지 인프라 기술 개발

Saltlux

Jump to: navigation, 찾기

목차

과제소개

온톨로지 (Ontology)란 사람이 보유한 지식을 컴퓨터가 이해할 수 있는 형태로 표현한 것입니다. 온톨로지는 스키마와 인스턴스로 구분될 수 있습니다. 스키마는 지식을 담을 수 있는 틀이며, 인스턴스는 그 틀에 담겨진 실제 개념 또는 지식입니다. 예를 들어, “텔레비전 방송은 텔레비전을 통해 디지털방송된다.”는 것은 스키마이고, “주몽은 보르도TV로 디지털 방송된다.”라는 것인 실제적인 인스턴스입니다.

image:semantic_rd_02_1_1.jpg

스키마와 인스턴스를 통해 구축된 온톨로지는 다양한 소프트웨어에 활용될 수 있습니다. 특히, 모호한 단어나 개념의 문제를 해결할 수 있고, 추론을 통해 지능적인 소프트웨어의 개발이 가능합니다. 유비쿼터스 분야를 중심으로 하는 지능형로봇, 홈네트워크, RFID/USN 등의 다양한 프로젝트에서 온톨로지를 구축하여 사용하고 있습니다. 하지만 이렇게 모든 프로젝트가 각각의 온톨로지를 구축하여 사용할 때에, 비슷한 개념이 존재하게 될 수 있고, 이것은 온톨로지 구축의 목적과 어긋날 수 있습니다. 또한 두 프로젝트가 통합될 필요가 있을 때 비슷한 개념들이 존재하게 온톨로지를 다시 구축해야하는 어려움이 발생할 수도 있습니다. 따라서 국가적으로 활용할 수 있는 표준적이고, 상호운용 가능한 통합된 온톨로지의 구축이 필요합니다.


image:semantic_rd_02_1_2.jpg


CoreOnto (Core Ontology) 과제”는 이러한 필요성에 의해 국가 차원에서 국내 IT 분야 및 국제 표준으로 활용할 수 있는 “국가 IT 온톨로지”를 만들고자 하는 과제입니다. 국가 IT 온톨로지는 기반 온톨로지 위에 IT 코아 온톨로지를 구축하고, 그 위에 디바이스, 서비스, 라이프 등의 온톨로지를 구축하게 됩니다.

image:semantic_rd_02_1_3.jpg

그리고 구축된 국가 IT 온톨로지는 u-Life, 유비쿼터스 IT 서비스, IT 지식포털 등의 다양한 서비스에 활용될 수 있습니다.
image:semantic_rd_02_1_4.jpg

CoreOnto 인프라 개념도


image:semantic_rd_02_1_5.jpg

연구목표

최종적인 연구 목표는 소프트인프라웨어로서 국가 IT 온톨로지를 구축하고, 온톨로지 인프라 기술 및 온톨로지 인프라 기술 및 온톨로지 기반 서비스 시스템 개발입니다. 온톨로지 구축이 핵심이며, 이를 검증하기 위한 서비스를 개발하여 활용을 통해 검증해야합니다. 솔트룩스는 온톨로지 인스턴스 생성 파트와 지능형 서비스 시스템 파트에 참여하고 있습니다.

image:semantic_rd_02_1_6.jpg

CoreOnto 과제는 5차년도까지 계획되어 있으며, 2009년 1월 현재 3차년도를 마무리하고, 4차년도를 준비하고 있습니다.

image:semantic_rd_02_1_7.jpg

수행내용

1차년도 (2006년)

  • IT Core 온톨로지 설계 및 5만 어휘의 온톨로지 구축
  • 온톨로지 반자동 및 자동 구축을 위한 정보추출 기술 개발
    • 문맥과 구성어휘 패턴에 기반한 IT 용어 추출기(v1.0) 개발
    • 분류체계 구축 시스템 개발
       클래스간 IS-A 관계 설정 툴킷(v1.0) 개발
    • 의미 관계 추출기 개발
  • 온톨로지 인스턴스 자동 생성도구(V1.0) 개발
    • IT 온톨로지 고유 속성을 부여하는 온톨로지 인스턴스 생성 소프트웨어 개발
    • 구조(웹구조문서, DB데이터 등)/비구조(신문기사, 보고서 등) 정보를 크롤링 기술을 적용한 IT문서 자동 수집 기능 지원
    • 구조/비구조 정보 추출 기능 지원
    • 애매성 해소 기술을 적용한 인스턴스 OWL 매핑 기능 지원
    • 의미정보추출자동화율 75% (목표 60%), 인스턴스 생성 자동화율 67% (목표 50%) 달성
    • (DTV 분야 대상으로 측정한 것으로, 전 분야 확대 예정)
  • OWL 온톨로지 추론 엔진 v1.0 개발
    • Tableaux 방식 기반의 온톨로지 추론 엔진 개발
    • ALC 수준의 서술논리(Description Logic) 처리 가능한 추론 엔진 개발
    • TBox 온톨로지 추론 기술 개발
    • ABox 온톨로지 인스턴스 추론 기술 개발
    • Dependency directed backtracking 최적화 기술 기반 온톨로지 추론 기술 개발
  • SWRL 추론 엔진 개발
    • Datalog 기반의 온톨로지 추론 기술을 이용한 SWRL 추론 기술 개발
    • KAON2 기반의 SWRL 추론 엔진 구축
    • SWRL 처리를 위한 KAON2 기반 엔진 구축
    • IT 온톨로지 처리를 위한 SWRL 구축
  • Description Logic (DL) 기반 일관성 확인 검증엔진 v1.0 개발
    • Pellet 기반 일관성 검증기 개발
    • KAON2 기반 일관성 검증기 개발
  • IT839 전략 분야 시맨틱 포털 설계
    • IT 온톨로지와 추론엔진의 추론기능, 자동 instance 생성 기능을 활용하는 IT 시맨틱 포털 서비스 개념 정의
    • 시맨틱 포탈 POC(Proof Of Concept) 요구사항 분석과 시스템 설계
    • IT 시맨틱 포털 서비스 기능 활용 핵심 시나리오 작성

2차년도 (2007년)

  • 문서 분류기
    • 대용량 용어 메트릭스를 이용한 위키피디아 문서 분할 기술 개발함으로 모듈러한 온톨로지 구축이 가능해 짐.
  • 용어의 관련 정보 추출 및 용어 개념화
    • 용어 문맥 정보를 이용한 관련도 계산 및 클러스터링 기술 개발로 상향식 개념화 기술 개발
    • SUMO/MILO+WordNet의 매핑 결과를 기반 온톨로지로 선택함으로, 하향식 개념화가 용이해짐
  • 정보 추출 기술을 이용한 IT 온톨로지 (반)자동 구축 기술 개발
    • 분야 상위 온톨로지 구축에서, 대량의 IT분야 용어를 일반 분야 시소러스에 매핑 함으로, IT분야 상위 개념을 선별하여 분야 개념 분류체계를 추축(구축)하는 방법을 제안하였다.
    • 분야 상위 온톨로지를 먼저 구축하고, 다음 용어에 대한 개념 분류와, 광의어-협의어 또는 광의어-관련어 관계에 대한 의미관계 분류를 통하여, 분야 시소러스를 이용한 온톨로지 확장 방법을 제안하였다.
    • 대규모 자동 의미표지 부착 모델을 제안하여 위키피디아데어터에 대한 is-a및 기타 의미관계 표지 부착이 가능하도록 함.
    • 기존 자원과 공기정보, 온톨로지 기반 용어 의미 판단 방법을 이용한 대규모 데이터 기반 온톨로지 구축 기술 개발.
    • 어휘 정보를 이용한 의미관계 분류에서, 기계학습 방법을 이용한 지도식 의미관계 분류기의 구현으로, 일정한 훈련데이터 축적 후의 관계 분류 자동화를 가능하게 하였다.
  • 나선형 모델의 온톨로자 구축 검증체계 설계 및 실험
    • 온톨로자 자동 구축 시스템 성능 향상과 온톨로지의 질적 향상 기대
  • IT 라이프와 IT 확장 온톨로지 간의 연계 구축
    • SUMO/MILO+WordNet의 매핑 결과를 기반 온톨로지로 선택함으로, 자체 구축 온톨로지간 통합과 기존 온톨로지와의 통합 모두 용이해짐.
  • Tableaux 알고리즘을 이용한 ALC 기반 추론엔진 시스템(특허 2건), 하이브리드 온톨로지 추론엔진(특허 1건), 사용자 선호에 따른 의미기반 추천검색시스템
  • 온톨로지 인스턴스 자동 생성도구 V2.0 ( OPTIMA 2.0 ) 개발
    • GUI 환경의 온톨로지 인스턴스 통합 워크벤치 V2.0 개발 ( OPTIMA 2.0)
    • 분산 처리 및 다중 사용자를 고려한 Server-client 모델 개발
    • 대용량 온톨로지 저장소 기능 지원 (SOR)
    • 구조(웹구조문서, DB데이터 등)/비구조(신문기사, 보고서 등) 자동 크롤링 기술 개선
    • 다양한 기계 학습을 이용한 Hybrid 방식의 정보 추출
    • 기계학습 기반의 인스턴스 매핑 기술을 적용하여, 인스턴스의 OWL 및 N-triple 생성 기능 지원
    • 의미정보추출 자동화율 82.7% (목표 80%), 인스턴스생성 자동화율 72.4% (목표 60%) 달성
  • 서비스 브로커 프로토 타입 개발
    • IT 온톨로지 기반의 다양한 서비스 연계와 수행을 위한 통합 플랫폼인 서비스 브로커 개발을 목표로 하며, 1차적으로 유비쿼터스 홈네트워크의 서비스와 U-City의 서비스를 연계하여 수행하는 프로토타입의 개발.
  • 하이브리드 방식의 온톨로지 인스턴스 생성도구(V1.0)개발
    • 대용량 인스턴스 저장을 위한 저장소 서버 지원
    • 정보추출, 온톨로지 매칭, 인스턴스 관리 기능 다중 클라이언트
  • 국가 IT 온톨로지 기반 유비쿼터스 서비스 브로커 프로토타입 구축
    • 홈네트워크와 텔레매틱스을 대상으로 한 지식 서비스 미들웨어와 유비쿼터스 환경의 지능형 교통정보 제공 미들웨어를 연계한 서비스를 제공하는 브로커 프로토타입 구축

3차년도 (2008년)

  • 유비쿼터스 환경 지원 상황인지 온톨로지 구축 및 IT 온톨로지 점진적 확장기술 개발
  • 클래스와 속성 인식 및 검증의 자동화 및 수동 수정 워크벤치 기술개발
  • 상호참조 해결 기술을 이용한 인스턴스 생성 기반 기술 개발
  • IT라이프, 디바이스, 코아 수준 간의 융합 설계와 인스턴스 연계 통합 기술개발
  • 대용량 시맨틱 메타데이터 관리 및 실시간 시맨틱 메타데이터 변환 기술 개발
  • 유비쿼터스 환경지원 하이브리드 온톨로지 추론 기술 개발 및 유비쿼터스 온톨로지 처리기 구축
  • 유비쿼터스 IT 온톨로지를 위한 태블로 알고리즘 기반 Consistency 유지 자동화기술
  • 11억 트리플을 저장하고 색인하는 시맨틱 레파지토리 개발
  • 시맨틱 Association 랭킹 기술 개발
  • 온톨로지 기반 Focused 크롤링 기술 개발
  • OPEN API기반의 온톨로지 접근 시맨틱 인프라 서비스 개발
  • IT 라이프 온톨로지 기반 시맨틱 검색 서비스 에이전트 시스템 개발
  • IT 온톨로지(IT Core, 디바이스)와 기업 온톨로지를 활용하는 시맨틱 위키와 시맨틱 블로그 기반의 * 엔터프라이즈 시맨틱 포털 시스템 구축과 자동 지식베이스 생성 및 기업 지식 포털 시범 서비스