Discovery
Saltlux
목차 |
개요
[IN2]Discovery는 조직 내 흩어져 있는 방대한 정보를 다양한 각도로 예리하게 관찰하고 재 조직화, 분석하여 지식화하고 숨겨진 문제와 가치를 발견, 조직의 지식자산으로 재활용할 수 있도록 해주는 시맨틱 통합 검색 솔루션입니다.
[IN2]Discovery는 키워드 기반 통합검색의 한계를 뛰어넘는 검색의 새로운 패러다임으로서, 회사 및 조직의 방대한 양의 구조/비구조적 데이터 및 정보(콜센터 로그, 블로그, 이메일 등)의 지능적 텍스트 분석(Text Analytics)을 통해 업무에 관한 중대한 인사이트(critical insight)를 발견하게 하는 확장성 높은 기업용 정보 분석 플랫폼입니다.
[IN2]Discovery는 비즈니스 인텔리전스(Business Intelligence) 솔루션에 필요한 모든 정보를 통합/조정하여 검색 플랫폼에 적용한 강력한 비즈니스 인텔리전스(BI)의 결합을 의미하며, 직원, 고객, 파트너 및 외부 관점 등에 대한 360도 뷰(view)를 가능하게 하여 더 나은 의사결정과 기업 콘텐트 투자에 대한 ROI 증대를 가져다 줄 것입니다.
특징
- 혁신성
- 저장되어 있는 85%의 비구조적 기업문서의 분석 및 지능화
- 연관 정보, 동향, 관련 인물 등 분석 정보 제시
- 검증된 기술을 통한 신뢰성 높은 분석 품질
- 기능성
- 대용량 콘텐트의 자동 군집 및 분류, 정보 추출
- 시맨틱 마이닝을 통한 연관관계, 트렌드 분석
- 지식네트워크 분석, 시맨틱 검색과 시각화
- 가용성
- 지능형 분산 컴퓨팅 및 그리드 기술 적용
- 기존의 검색엔진을 그대로 사용 가능
- BI 및 데이터 마이닝 시스템과 연동 가능
주요기능
- 통합검색
웹, wiki/blog, 홈페이지, 이메일 통합 검색
유사어 검색
- 구조적 검색결과 및 사용자 인터페이스 브라우징 제공
자동 분류(Classification)
자동 군집(Clustering) & 시각화 (Cluster visualization)
Faceted Navigation
Dynamic Selection
- 통합/직관적 시각화 및 리포팅 (Graphical reporting)
- 구조/비구조적 데이터에 대한 검색, 다면 분석 및 리포팅 기능
패턴 러닝(Pattern learning)
트렌드 분석 (Trends analysis)
링크 분석 (Link analysis)
조합 분석 (Association analysis)
엔터티 추출 (Entity extraction)
토픽랭크(TopicRank) 기반의 관계성 분석
- 시맨틱 메타데이터 자동 생성 기능
- 의미기반 연관 정보 검색과 분석 기능
- 추론 기반의 강력한 추천(Alert)과 개인화 기능
사용자행위 기반 Machine-Learning
Role-based search
Dynamic Ranking
Social Search
- 사회관계망(Social network) 분석과 외부정보 연동 기능
- 고급 관리자 기능
통합 설치 및 관리
랭킹 모델 및 가중치 관리
사전 관리
우수한 통계 및 리포팅 기능
- 강력한 보안/프라이버시(Privacy) 및 표준 프레임워크 지원
- 커스터마이제이션(Customization) 및 우수한 확장성 (Scalability)
- 초대용량 분산 검색 엔진 기본 내장
도입효과
- 정형/비정형 데이터 콘텐트의 검색과 시맨틱 마이닝을 통해 360° 지식정보분석 가능
- 개념 기반의 검색, 키워드 검색으로 불가능한, 숨어있는 정보 발굴 및 그 의미관계 파악 가능
- 검색을 넘은 Knowledge Discovery를 통해 정보 검색보다 좀 더 가치 있는 정보 분석 시간 할애를 가능게 하여
전략적 의사결정 지원
- 아울림(OWLIM)과 연동하여 시장/경쟁자 동향 등 기업 내/외부 정보의 통합 분석 가능
- 강력한 시각화를 통해 직관적 정보 인식 가능
시스템 구성도
[IN2] Indexer/Searcher
[IN2] Searcher 서버는 인덱스(역파일)에서 어플리케이션에서 요청한 질의를 분석하여 검색을 수행하고, 결과를 전달합니다.
[IN2]Indexe/Searcher는 동일 Process내에서 운영이 가능하며, 시스템 구성에 따라, 인덱스(역파일)을 공유하여 분산된 환경에서도 동작이 가능합니다.
[IN2] TMSTagger
검색 대상 문서에 대해 검색키워드를 추출을 합니다. 자체 개발한 고성능 형태소 분석기를 포함하고 있습니다.
[IN2] IndexAgent
SCRIPT(XML)을 해석 하여, 데이터베이스에서 데이터를 가져와서 [IN2] Indexer에 색인을 요청합니다.
- Scheduler가 내장되어 있어 색인 주기를 조정이 가능합니다.
- JDBC를 지원하는 모든 데이터베이스에 사용이 가능합니다.
ex) ORACLE, MS-SQL, MYSQL, DB2 등
- DOMINO 데이터베이스(Notes)의 경우 DIIOP 프로토콜을 사용이 가능합니다.
[IN2] Navigator
문서를 서버에서 내려 받아, 해당 검색어가 존재하는 위치로 이동을 하여 줍니다.
- ActiveX로 제공이 됩니다.
- URL을 지정하면 HTTP 통신을 사용해서 문서를 내려 받습니다.
[IN2] DICSearcher
데이터베이스에서 단어목록을 읽고, 어플리케이션 요청에 따라 자동완성 단어 검색, 동의어 단어 검색, 텍스트에 용어에 대한 하이퍼링크 추가 작업을 수행합니다.
- 데이터베이스에서 읽어 들일 방법은 SCRIPT(XML)로 지정을 합니다.
- Scheduler가 내장되어 있어 주기적으로 데이터를 다시 읽어 들입니다.
[IN2] ServerAgent
관리서버([IN2] Admin)의 요청에 따라 [IN2] 서버들을 제어하는 역할을 합니다.
- 서버들 시작 또는 중지 등의 제어를 합니다.
- 서버들 로그와 시스템 자원(메모리, 디스크, CPU)을 모니터링 합니다.
- 데이터베이스에서 사용자 사전과 불용어 사전 등을 내려 받아 [IN2] TMSTagger가 사용하는 사전 데이터를 교체하는 역할을 합니다.
☞ [IN2]Admin은 [IN2]서버들을 관리하기 위한 웹 베이스의 관리도구입니다.
☞ [IN2]Admin을 사용하지 않는 경우 [IN2] ServerAgent는 동작 시킬 필요가 없습니다.
☞ 각 시스템에 하나만 운영을 합니다.
[IN2] CAMEO
질의어 통계, 색인 통계, 로그 이벤트 등을 하나의 서버에서 관리를 하여 줍니다.
- 주기적으로 검색어 통계 연산을 수행합니다.
- 각 시스템에 있는 로그들을 [IN2]ServerAgent를 통해 수집하여, 데이터베이스에 통합하여 기록하여 둡니다.
☞ [IN2] CAMEO는 MySQL 5.0이상을 기본 데이터베이스로 사용합니다.
상세기능
- Discovery 질의 통계
- 쌈지 검색
- test










