휴대형 한/영 자동통역 기술 개발
Saltlux
한영 자동 통역기에 사용될 대역문 개발 및 번역, DB 작업
1. 연구기간: 2008.03.01 ~ 2012.02.28 (48개월)
2. 수행기관: 한국전자통신연구원
3. 과제 전체 소개
가. 목표
세계화의 가속화에 따른 언어장벽 문제를 해소하기 위해 대화 음성에 대한 음성인식 및 자동번역의 성능 한계를 극복하는 기술을 개발하고, 이를 기반으로 여행자를 위한 한/영 자동통역기의 DB 개발입니다.
여행 대화 한/영 자동통역기술 개발
한국어/영어 대화체 음성인식
한/영 대화체 자동번역
음성 기반 자동통역
멀티모달 기반 자동통역 사용자 인터페이스 기술 개발
나. 연구개발과제의 중요성
공공성: 세계화에 따른 언어장벽 문제 해소
세계화(Globalization)의 가속화로 국가간 인적, 물적 교류가 활발해지고 있으며, 이에 언어간 장벽을 허무는 자동통역 기술의 확보는 무한 경쟁시대에서 국가 경쟁력과 직결됩니다.
사업성: 정보통신 산업 블루오션 창출
여행자를 위한 모바일 한/영 자동통역 기술은 기존 시장의 대체가 아닌 새로운 서비스와 제품 시장을 창출할 것입니다. 글로벌 기업간 비즈니스가 활발해짐에 따라 국적과 언어가 다른 회사들의 의사소통 문제가 크게 부각되고 있습니다.
기술원천성: 자동통역 기술 한계 극복
자동통역 기술은 대화체 음성인식, 언어번역, 음성합성 등 요소기술이 어우러진 복합기술로서, 이 요소기술들은 지능형 로봇, 텔레매틱스, 디지털 홈 등 IT성장동력산업 전 분야에서 HCI(Human Computer Interaction)의 핵심요소로 요구되는 원천 기술입니다.
다. 핵심 요소 기술
음성인식: 발성이 자유롭고 변화가 많은 대화 음성을 인식하는 대화체 음향 모델링 기술, 비정형적인 대화 언어를 모델링 하는 대화체 언어 모델링 기술, 이러한 다양성에 의해 발생하는 많은 문장을 실시간으로 처리할 수 있는 고속 탐색 기술, 대화의 흐름에 따른 문맥 지식을 활용하는 문맥지식기반 음성인식 기술, 대화의 대상물과 대화가 이루어지는 상황 정보를 활용하는 상황지식기반 음성인식 기술이 핵심 기술입니다.
자동번역: 비정형적인 대화체의 분석 및 생성을 위한 대화체 분석 기술, 규칙 기반과 통계 기반 기술의 융합이 핵심 기술입니다.
음성합성: 한/영 양방향 자동통역 시스템의 음성출력 기술 개발로, 한국어/영어 대화체 합성기 구현을 위한 각 언어별 대화체 언어처리, 운율처리 및 HMM기반 합성음 생성 기술이 핵심요소임. 사용자의 원음과 비슷한 음색의 음성을 합성하는 음색 변환 음성 합성 기술, 사용자의 의도가 표현된 대화체 음성 합성 기술이 핵심 기술입니다.
멀티모달 사용자 인터페이스: 고유명사 등 신규 어휘를 쉽게 추가할 수 있는 어휘 추가 기술, 음성인식, 번역 단계에서의 오류를 쉽게 수정할 수 있는 오류 정정 인터페이스 기술이 핵심 기술입니다.
시스템통합: 언어 지식 정보를 모듈 간에 공유하는 구조, 모듈 간의 인터페이스를 통한 성능 하락을 막는 밀결합 구조가 핵심 기술입니다.
4. 솔트룩스 해당 과제 개발 과정 (2008년, 1차년)
가. 대화체 자동번역용 한글 10만 문장
-자동 번역에 쓰이는 한영문장 10만 문장 개발합니다.
-여행중에 생길수 있는 모든 상황과 많은 지역을 고려할 수 있는 국내외 여행경험이 많은 사람들로 하여금 한글 문장을 만듭니다.
-다양한 표현으로 생길 수 있는 중복적 표현은 솔루션(across)로 방지합니다.
-많은 문장을 생성함에 있어서 생길 수 있는 불확실한 내용, 오탈자 등을 최종 감수로 확인합니다.
-가능하면 관용적 표현으로 문장을 작성합니다.
나. 영어 10만 문장
-개발된 한글 문장 10만 문장을 영문으로 번역합니다.
-해외(영어권 국가)에 경험이 많은 사람이 번역을 진행합니다.
-중복된 한글 문장을 다양한 영문장으로 번역합니다.
-관용적 표현으로 번역합니다.
다. 단어집
-개발된 한영문 10만 문장에 쓰인 단어를 추출하여 자동번역시 보다 정확한 번역을 위해 DB화 합니다.
5. 최종 결과물 (2008년, 1차년)
- 한글 대화 10만 문장 개발
- 영문 대화 10만 문장을 위한 대역 작업
- 한영문에 쓰인 명사 및 동사의 단어집


