TMS
Saltlux
[IN2]TMS 개요
- [IN2]TMS는 비정형 문서에서 정보 추출, 자동 요약, 자동 분류를 수행하는 정보 마이닝 솔루션으로서 지식 정보의 검색과 분석, 활용에 소요되는 시간을 획기적으로 단축시켜 줍니다.
- [IN2]TMS는 방대한 문서들 속에 숨어 있는 지식을 발굴(discovery)하고 이러한 지식 정보를 조직화하기 위해 개발된 시스템이다. 대용량 언어 자원과 자연언어 처리 기술, 각종 규칙과 통계 기반의 분석 알고리즘을 적용함으로 각 고객에게 필요한 최상의 성능을 제공하고 있습니다.
[IN2]TMS 주요 특징
1. 고품질 정보 추출 (Information Extraction)
- 고정밀 다국어 언어 분석 : 텍스트 마이닝 시스템은 자연언어처리 기술에 크게 의존하고 있습니다. [IN2]TMS는 세계 최고 수준의 다국어 언어분석 기술에 기반하고 있습니다.
- 통계와 규칙의 하이브리드 정보 추출 엔진 : 정보추출 시스템은 기계 학습과정을 거친 통계적 알고리즘을 적용할 수 있으며, 매우 강력하고 유연한 패턴 규칙의 기술이 가능한 XRE 패턴 매칭 엔진을 하이브리드로 사용하고 있습니다.
- 기계 학습(Machine Learning) : 통계 기반의 정보 추출은 통계적 사전 학습의 품질이 매우 중요 합니다. [IN2]TMS는 텍스트 마이닝을 위한 자동 기계 학습 툴을 제공하고 있습니다.
- 알짜 검색 기능으로의 확장 : 각 문서의 핵심 개념 혹은 키워드만을 추출해 이를 인덱싱 함으로 사용자가 찾고자 하는 핵심 문서만을 확실하게 검색할 수 있는 기능을 제공합니다.
2. 자동 문서 분류 (Document Classification)
- 다양한 분류 모델 제공 : [IN2]TMS는 문서의 자동 분류를 위해 Rochio, Naïve Bayesian, SVM 등의 다양한 분류 알고리즘이 모두 적용되어 있습니다.
- 자동 분류 학습 기능 내장 : 통계 기반의 자동 문서 분류를 위해, 분류 체계에 따른 사전 학습기를 내장하고 있으며, 각 사용자 맞춤형의 최적화된 분류 성능을 제공하게 됩니다.
- 다단계 문서 분류 및 관리툴 : [IN2]TMS는 사용자가 설계한 텍사노미 분류 체계에 따른 다단계 분류 학습 및 자동 분류 기능을 지원하고 있습니다.
- 탁월한 자동 분류 성능 : 통계적 방법 중 가장 높은 성능을 보이고 있는 SVM 분류 엔진에 규칙기반의 자동 분류 기술을 통합함으로, 탁월한 성능의 자동 분류기를 구현하였습니다.
3. 자동 문서 요약 (Document Summarization)
- 키워드 및 추출 요약 : 문서 내의 핵심 키워드, 개념 및 문장을 추출하여 이에 기반하여 문서를 요약하는 기능을 제공하고 있습니다.
- 템플릿 기반 생성 요약 : [IN2]TMS는 요약 대상 문서를 자동 분류하여, 각 분류 별 요약 템플릿을 선정하고 정보 추출 규칙에 기반한 요약문 생성을 수행하는 기능을 제공합니다.
- 다국어 자동 요약 지원 : [IN2]TMS의 자동요약 시스템은 한국어 뿐만 아니라 영어, 일본어 등 여러 언어에 대해서도 매우 높은 성능을 보이고 있습니다.
4. 자동 문서 군집 (Document Clustering)
- [IN2]TMS는 각 문서가 담고 있는 특성들에 근거해 유사도 및 관련성이 높은 문서들을 상호 클러스터링 시킴으로 사용자의 관심정보 접근성을 높여줍니다.
- 특성 벡터 추출 및 유사도 계산 : 각 문서의 유전자에 해당하는 특성들을 추출하고, 특성들의 형태와 중요도에 따른 벡터를 구성, 타 문서와의 유사도 및 관련성을 계산합니다.
- 다양한 유사도 계산 모델 : [IN2]TMS는 k-means에 기반한 클러스터링을 위해 Cosine, Euclidian, Jaccard, Dice 유사도 계수를 선택적으로 사용할 수 있도록 하고 있습니다.
- 다국어 문서 클러스터링 지원 : [IN2]TMS의 클러스터링 시스템은 서로 다른 언어로 구성된 문서에 대해서도 문서 군집을 수행할 수 있습니다. 다국어 문서 군집의 경우, 온톨로지 적용과 추출된 특성벡터의 다국어 변환, 확장을 통해 수행됩니다.
- 예제기반 검색 시스템 구현 : 몇 개의 키워드 조합으로 방대한 문서 집합에 대한 정확한 검색을 하는 데는 많은 한계가 있습니다. 예제기반 검색(Qnery By Example)은 사용자가 가지고 있는 문서 자체를 가지고 관련 문서를 검색하는 기술입니다. 예제기반 검색은 문서 군집의 가장 전형적인 응용 솔루션으로서, 다양한 부문에 적용 가능합니다.
[IN2]TMS 시스템 구성

플랫폼
: Intel x86 : MS Windows 2000/2003Server, Linux
: SUN SPARC : Solaris 8(SUN OS 5.8)
: HP PA-RISC: HP-UX 11.x
History
2003년 08월 신소프트웨어 대상
2007년 09월 GS(Good Software)인증


