국가 IT 온톨로지 인프라 기술 개발
Saltlux
목차 |
과제소개
온톨로지 (Ontology)란 사람이 보유한 지식을 컴퓨터가 이해할 수 있는 형태로 표현한 것입니다. 온톨로지는 스키마와 인스턴스로 구분될 수 있습니다. 스키마는 지식을 담을 수 있는 틀이며, 인스턴스는 그 틀에 담겨진 실제 개념 또는 지식입니다. 예를 들어, “텔레비전 방송은 텔레비전을 통해 디지털방송된다.”는 것은 스키마이고, “주몽은 보르도TV로 디지털 방송된다.”라는 것인 실제적인 인스턴스입니다.
스키마와 인스턴스를 통해 구축된 온톨로지는 다양한 소프트웨어에 활용될 수 있습니다. 특히, 모호한 단어나 개념의 문제를 해결할 수 있고, 추론을 통해 지능적인 소프트웨어의 개발이 가능합니다. 유비쿼터스 분야를 중심으로 하는 지능형로봇, 홈네트워크, RFID/USN 등의 다양한 프로젝트에서 온톨로지를 구축하여 사용하고 있습니다. 하지만 이렇게 모든 프로젝트가 각각의 온톨로지를 구축하여 사용할 때에, 비슷한 개념이 존재하게 될 수 있고, 이것은 온톨로지 구축의 목적과 어긋날 수 있습니다. 또한 두 프로젝트가 통합될 필요가 있을 때 비슷한 개념들이 존재하게 온톨로지를 다시 구축해야하는 어려움이 발생할 수도 있습니다. 따라서 국가적으로 활용할 수 있는 표준적이고, 상호운용 가능한 통합된 온톨로지의 구축이 필요합니다.
“
CoreOnto (Core Ontology) 과제”는 이러한 필요성에 의해 국가 차원에서 국내 IT 분야 및 국제 표준으로 활용할 수 있는 “국가 IT 온톨로지”를 만들고자 하는 과제입니다. 국가 IT 온톨로지는 기반 온톨로지 위에 IT 코아 온톨로지를 구축하고, 그 위에 디바이스, 서비스, 라이프 등의 온톨로지를 구축하게 됩니다.
그리고 구축된 국가 IT 온톨로지는 u-Life, 유비쿼터스 IT 서비스, IT 지식포털 등의 다양한 서비스에 활용될 수 있습니다.
CoreOnto 인프라 개념도
연구목표
최종적인 연구 목표는 소프트인프라웨어로서 국가 IT 온톨로지를 구축하고, 온톨로지 인프라 기술 및 온톨로지 인프라 기술 및 온톨로지 기반 서비스 시스템 개발입니다. 온톨로지 구축이 핵심이며, 이를 검증하기 위한 서비스를 개발하여 활용을 통해 검증해야합니다.
솔트룩스는 온톨로지 인스턴스 생성 파트와 지능형 서비스 시스템 파트에 참여하고 있습니다.
CoreOnto 과제는 5차년도까지 계획되어 있으며, 2009년 1월 현재 3차년도를 마무리하고, 4차년도를 준비하고 있습니다.
수행내용
1차년도 (2006년)
- IT Core 온톨로지 설계 및 5만 어휘의 온톨로지 구축
- 온톨로지 반자동 및 자동 구축을 위한 정보추출 기술 개발
- 문맥과 구성어휘 패턴에 기반한 IT 용어 추출기(v1.0) 개발
- 분류체계 구축 시스템 개발
클래스간 IS-A 관계 설정 툴킷(v1.0) 개발 - 의미 관계 추출기 개발
- 온톨로지 인스턴스 자동 생성도구(V1.0) 개발
- IT 온톨로지 고유 속성을 부여하는 온톨로지 인스턴스 생성 소프트웨어 개발
- 구조(웹구조문서, DB데이터 등)/비구조(신문기사, 보고서 등) 정보를 크롤링 기술을 적용한 IT문서 자동 수집 기능 지원
- 구조/비구조 정보 추출 기능 지원
- 애매성 해소 기술을 적용한 인스턴스 OWL 매핑 기능 지원
- 의미정보추출자동화율 75% (목표 60%), 인스턴스 생성 자동화율 67% (목표 50%) 달성
- (DTV 분야 대상으로 측정한 것으로, 전 분야 확대 예정)
- OWL 온톨로지 추론 엔진 v1.0 개발
- Tableaux 방식 기반의 온톨로지 추론 엔진 개발
- ALC 수준의 서술논리(Description Logic) 처리 가능한 추론 엔진 개발
- TBox 온톨로지 추론 기술 개발
- ABox 온톨로지 인스턴스 추론 기술 개발
- Dependency directed backtracking 최적화 기술 기반 온톨로지 추론 기술 개발
- SWRL 추론 엔진 개발
- Datalog 기반의 온톨로지 추론 기술을 이용한 SWRL 추론 기술 개발
- KAON2 기반의 SWRL 추론 엔진 구축
- SWRL 처리를 위한 KAON2 기반 엔진 구축
- IT 온톨로지 처리를 위한 SWRL 구축
- Description Logic (DL) 기반 일관성 확인 검증엔진 v1.0 개발
- Pellet 기반 일관성 검증기 개발
- KAON2 기반 일관성 검증기 개발
- IT839 전략 분야 시맨틱 포털 설계
- IT 온톨로지와 추론엔진의 추론기능, 자동 instance 생성 기능을 활용하는 IT 시맨틱 포털 서비스 개념 정의
- 시맨틱 포탈 POC(Proof Of Concept) 요구사항 분석과 시스템 설계
- IT 시맨틱 포털 서비스 기능 활용 핵심 시나리오 작성
2차년도 (2007년)
- 문서 분류기
- 대용량 용어 메트릭스를 이용한 위키피디아 문서 분할 기술 개발함으로 모듈러한 온톨로지 구축이 가능해 짐.
- 용어의 관련 정보 추출 및 용어 개념화
- 용어 문맥 정보를 이용한 관련도 계산 및 클러스터링 기술 개발로 상향식 개념화 기술 개발
- SUMO/MILO+WordNet의 매핑 결과를 기반 온톨로지로 선택함으로, 하향식 개념화가 용이해짐
- 정보 추출 기술을 이용한 IT 온톨로지 (반)자동 구축 기술 개발
- 분야 상위 온톨로지 구축에서, 대량의 IT분야 용어를 일반 분야 시소러스에 매핑 함으로, IT분야 상위 개념을 선별하여 분야 개념 분류체계를 추축(구축)하는 방법을 제안하였다.
- 분야 상위 온톨로지를 먼저 구축하고, 다음 용어에 대한 개념 분류와, 광의어-협의어 또는 광의어-관련어 관계에 대한 의미관계 분류를 통하여, 분야 시소러스를 이용한 온톨로지 확장 방법을 제안하였다.
- 대규모 자동 의미표지 부착 모델을 제안하여 위키피디아데어터에 대한 is-a및 기타 의미관계 표지 부착이 가능하도록 함.
- 기존 자원과 공기정보, 온톨로지 기반 용어 의미 판단 방법을 이용한 대규모 데이터 기반 온톨로지 구축 기술 개발.
- 어휘 정보를 이용한 의미관계 분류에서, 기계학습 방법을 이용한 지도식 의미관계 분류기의 구현으로, 일정한 훈련데이터 축적 후의 관계 분류 자동화를 가능하게 하였다.
- 나선형 모델의 온톨로자 구축 검증체계 설계 및 실험
- 온톨로자 자동 구축 시스템 성능 향상과 온톨로지의 질적 향상 기대
- IT 라이프와 IT 확장 온톨로지 간의 연계 구축
- SUMO/MILO+WordNet의 매핑 결과를 기반 온톨로지로 선택함으로, 자체 구축 온톨로지간 통합과 기존 온톨로지와의 통합 모두 용이해짐.
- Tableaux 알고리즘을 이용한 ALC 기반 추론엔진 시스템(특허 2건), 하이브리드 온톨로지 추론엔진(특허 1건), 사용자 선호에 따른 의미기반 추천검색시스템
- 온톨로지 인스턴스 자동 생성도구 V2.0 ( OPTIMA 2.0 ) 개발
- GUI 환경의 온톨로지 인스턴스 통합 워크벤치 V2.0 개발 (
OPTIMA 2.0)
- 분산 처리 및 다중 사용자를 고려한 Server-client 모델 개발
- 대용량 온톨로지 저장소 기능 지원 (SOR)
- 구조(웹구조문서, DB데이터 등)/비구조(신문기사, 보고서 등) 자동 크롤링 기술 개선
- 다양한 기계 학습을 이용한 Hybrid 방식의 정보 추출
- 기계학습 기반의 인스턴스 매핑 기술을 적용하여, 인스턴스의 OWL 및 N-triple 생성 기능 지원
- 의미정보추출 자동화율 82.7% (목표 80%), 인스턴스생성 자동화율 72.4% (목표 60%) 달성
- GUI 환경의 온톨로지 인스턴스 통합 워크벤치 V2.0 개발 (
- 서비스 브로커 프로토 타입 개발
- IT 온톨로지 기반의 다양한 서비스 연계와 수행을 위한 통합 플랫폼인 서비스 브로커 개발을 목표로 하며, 1차적으로 유비쿼터스 홈네트워크의 서비스와 U-City의 서비스를 연계하여 수행하는 프로토타입의 개발.
- 하이브리드 방식의 온톨로지 인스턴스 생성도구(V1.0)개발
- 대용량 인스턴스 저장을 위한 저장소 서버 지원
- 정보추출, 온톨로지 매칭, 인스턴스 관리 기능 다중 클라이언트
- 국가 IT 온톨로지 기반 유비쿼터스 서비스 브로커 프로토타입 구축
- 홈네트워크와 텔레매틱스을 대상으로 한 지식 서비스 미들웨어와 유비쿼터스 환경의 지능형 교통정보 제공 미들웨어를 연계한 서비스를 제공하는 브로커 프로토타입 구축
3차년도 (2008년)
- 유비쿼터스 환경 지원 상황인지 온톨로지 구축 및 IT 온톨로지 점진적 확장기술 개발
- 클래스와 속성 인식 및 검증의 자동화 및 수동 수정 워크벤치 기술개발
- 상호참조 해결 기술을 이용한 인스턴스 생성 기반 기술 개발
- IT라이프, 디바이스, 코아 수준 간의 융합 설계와 인스턴스 연계 통합 기술개발
- 대용량 시맨틱 메타데이터 관리 및 실시간 시맨틱 메타데이터 변환 기술 개발
- 유비쿼터스 환경지원 하이브리드 온톨로지 추론 기술 개발 및 유비쿼터스 온톨로지 처리기 구축
- 유비쿼터스 IT 온톨로지를 위한 태블로 알고리즘 기반 Consistency 유지 자동화기술
- 11억 트리플을 저장하고 색인하는 시맨틱 레파지토리 개발
- 시맨틱 Association 랭킹 기술 개발
- 온톨로지 기반 Focused 크롤링 기술 개발
- OPEN API기반의 온톨로지 접근 시맨틱 인프라 서비스 개발
- IT 라이프 온톨로지 기반 시맨틱 검색 서비스 에이전트 시스템 개발
- IT 온톨로지(IT Core, 디바이스)와 기업 온톨로지를 활용하는 시맨틱 위키와 시맨틱 블로그 기반의 * 엔터프라이즈 시맨틱 포털 시스템 구축과 자동 지식베이스 생성 및 기업 지식 포털 시범 서비스



