Discovery

Saltlux

Jump to: navigation, 찾기

목차

개요

[IN2]Discovery는 조직 내 흩어져 있는 방대한 정보를 다양한 각도로 예리하게 관찰하고 재 조직화, 분석하여 지식화하고 숨겨진 문제와 가치를 발견, 조직의 지식자산으로 재활용할 수 있도록 해주는 시맨틱 통합 검색 솔루션입니다.

[IN2]Discovery는 키워드 기반 통합검색의 한계를 뛰어넘는 검색의 새로운 패러다임으로서, 회사 및 조직의 방대한 양의 구조/비구조적 데이터 및 정보(콜센터 로그, 블로그, 이메일 등)의 지능적 텍스트 분석(Text Analytics)을 통해 업무에 관한 중대한 인사이트(critical insight)를 발견하게 하는 확장성 높은 기업용 정보 분석 플랫폼입니다.

[IN2]Discovery는 비즈니스 인텔리전스(Business Intelligence) 솔루션에 필요한 모든 정보를 통합/조정하여 검색 플랫폼에 적용한 강력한 비즈니스 인텔리전스(BI)의 결합을 의미하며, 직원, 고객, 파트너 및 외부 관점 등에 대한 360도 뷰(view)를 가능하게 하여 더 나은 의사결정과 기업 콘텐트 투자에 대한 ROI 증대를 가져다 줄 것입니다.


특징

  • 혁신성
  1. 저장되어 있는 85%의 비구조적 기업문서의 분석 및 지능화
  2. 연관 정보, 동향, 관련 인물 등 분석 정보 제시
  3. 검증된 기술을 통한 신뢰성 높은 분석 품질
  • 기능성
  1. 대용량 콘텐트의 자동 군집 및 분류, 정보 추출
  2. 시맨틱 마이닝을 통한 연관관계, 트렌드 분석
  3. 지식네트워크 분석, 시맨틱 검색과 시각화
  • 가용성
  1. 지능형 분산 컴퓨팅 및 그리드 기술 적용
  2. 기존의 검색엔진을 그대로 사용 가능
  3. BI 및 데이터 마이닝 시스템과 연동 가능

주요기능

  • 통합검색

웹, wiki/blog, 홈페이지, 이메일 통합 검색
유사어 검색

  • 구조적 검색결과 및 사용자 인터페이스 브라우징 제공
자동 분류(Classification)
자동 군집(Clustering) & 시각화 (Cluster visualization)
Faceted Navigation
Dynamic Selection
  • 통합/직관적 시각화 및 리포팅 (Graphical reporting)
  •     구조/비구조적 데이터에 대한 검색, 다면 분석 및 리포팅 기능
패턴 러닝(Pattern learning)
트렌드 분석 (Trends analysis)
링크 분석 (Link analysis)
조합 분석 (Association analysis)
엔터티 추출 (Entity extraction)
토픽랭크(TopicRank) 기반의 관계성 분석
  • 시맨틱 메타데이터 자동 생성 기능
  •  의미기반 연관 정보 검색과 분석 기능
  •  추론 기반의 강력한 추천(Alert)과 개인화 기능
사용자행위 기반 Machine-Learning
Role-based search
Dynamic Ranking
Social Search
  • 사회관계망(Social network) 분석과 외부정보 연동 기능
  • 고급 관리자 기능
통합 설치 및 관리
랭킹 모델 및 가중치 관리
사전 관리
우수한 통계 및 리포팅 기능
  •  강력한 보안/프라이버시(Privacy) 및 표준 프레임워크 지원
  •  커스터마이제이션(Customization) 및 우수한 확장성 (Scalability)
  •  초대용량 분산 검색 엔진 기본 내장

도입효과

  •  정형/비정형 데이터 콘텐트의 검색과 시맨틱 마이닝을 통해 360° 지식정보분석 가능
  •  개념 기반의 검색, 키워드 검색으로 불가능한, 숨어있는 정보 발굴 및 그 의미관계 파악 가능
  •  검색을 넘은 Knowledge Discovery를 통해 정보 검색보다 좀 더 가치 있는 정보 분석 시간 할애를 가능게 하여

         전략적 의사결정 지원

  •  아울림(OWLIM)과 연동하여 시장/경쟁자 동향 등 기업 내/외부 정보의 통합 분석 가능
  •  강력한 시각화를 통해 직관적 정보 인식 가능


시스템 구성도



[IN2] Indexer/Searcher

[IN2] Indexer 서버는 인덱스(역파일)의 생성과 문서의 생성/삭제 등의 인덱스와 관련된 기능을 담당합니다.
[IN2] Searcher 서버는 인덱스(역파일)에서 어플리케이션에서 요청한 질의를 분석하여 검색을 수행하고, 결과를 전달합니다.
[IN2]Indexe/Searcher는 동일 Process내에서 운영이 가능하며, 시스템 구성에 따라, 인덱스(역파일)을 공유하여 분산된 환경에서도 동작이 가능합니다.

[IN2] TMSTagger
검색 대상 문서에 대해 검색키워드를 추출을 합니다. 자체 개발한 고성능 형태소 분석기를 포함하고 있습니다.

[IN2] IndexAgent
SCRIPT(XML)을 해석 하여, 데이터베이스에서 데이터를 가져와서 [IN2] Indexer에 색인을 요청합니다.

  • Scheduler가 내장되어 있어 색인 주기를 조정이 가능합니다.
  • JDBC를 지원하는 모든 데이터베이스에 사용이 가능합니다.

     ex) ORACLE, MS-SQL, MYSQL, DB2 등

  • DOMINO 데이터베이스(Notes)의 경우 DIIOP 프로토콜을 사용이 가능합니다.


[IN2] Navigator
문서를 서버에서 내려 받아, 해당 검색어가 존재하는 위치로 이동을 하여 줍니다.

  • ActiveX로 제공이 됩니다.
  • URL을 지정하면 HTTP 통신을 사용해서 문서를 내려 받습니다.


[IN2] DICSearcher
데이터베이스에서 단어목록을 읽고, 어플리케이션 요청에 따라 자동완성 단어 검색, 동의어 단어 검색, 텍스트에 용어에 대한 하이퍼링크 추가 작업을 수행합니다. 

  • 데이터베이스에서 읽어 들일 방법은 SCRIPT(XML)로 지정을 합니다.
  • Scheduler가 내장되어 있어 주기적으로 데이터를 다시 읽어 들입니다.


[IN2] ServerAgent
관리서버([IN2] Admin)의 요청에 따라 [IN2] 서버들을 제어하는 역할을 합니다.

  • 서버들 시작 또는 중지 등의 제어를 합니다.
  • 서버들 로그와 시스템 자원(메모리, 디스크, CPU)을 모니터링 합니다.
  • 데이터베이스에서 사용자 사전과 불용어 사전 등을 내려 받아 [IN2] TMSTagger가 사용하는 사전 데이터를 교체하는 역할을 합니다.


☞ [IN2]Admin은 [IN2]서버들을 관리하기 위한 웹 베이스의 관리도구입니다.
☞ [IN2]Admin을 사용하지 않는 경우 [IN2] ServerAgent는 동작 시킬 필요가 없습니다.
☞ 각 시스템에 하나만 운영을 합니다.

[IN2] CAMEO
질의어 통계, 색인 통계, 로그 이벤트 등을 하나의 서버에서 관리를 하여 줍니다.

  • 주기적으로 검색어 통계 연산을 수행합니다.
  • 각 시스템에 있는 로그들을 [IN2]ServerAgent를 통해 수집하여, 데이터베이스에 통합하여 기록하여 둡니다.


☞ [IN2] CAMEO는 MySQL 5.0이상을 기본 데이터베이스로 사용합니다.

상세기능