본문 바로가기

Science news

ETRI, 4개국어 언어음성DB 국내최초 배포(03.30)

'스마트 인터페이스 분야 외국기술 잠식 차단 큰 역할'


백승민 기자 bsm1702@hellodd.com

 

국내연구팀이 독일어, 러시아어, 아랍어, 베트남어 대화체(구어체) 언어음성 DB(데이터베이스)를 국내최초로 구축해 배포한다.

 

ETRI(한국전자통신연구원, 원장 이상훈)는 4개 국어 대화체 음성DB 총 36만 문장과 한국어 대역 총 20만 문장을 산업체와 학계 등에 배포한다고 30일 밝혔다.

 

외국 언어에 대한 음성DB는 최근 스마트폰 등 모바일 기기의 확산 보급과 함께 중요한 원천기술로 각광받고 있다.

 

그동안 음성DB를 이용한 상용 제품들은 국가DB사업에서 구축한 자료를 이용해 국내 기술로 자체개발한 부분도 있으나 국내 DB가 없는 경우 외국에서 개발한 음성인식과 번역엔진을 도입해 탑재하는 형편이었다.

 

ETRI는 지난 2011년부터 한·영·일·중 등 다국어 언어음성 DB를 구축, 배포해 왔다. 2014년에는 프랑스어를 추가했고 지난해에는 독일어, 러시아어, 아랍어, 베트남어를 구축한 바 있다.

 

배포하는 DB는 독일어, 러시아어, 아랍어, 베트남어 대화체 음성DB와 한국어-독일어, 한국어-러시아어, 한국어-아랍어, 한국어-베트남어 대화체 대역문장DB 등의 8종의 언어음성 DB다.

 

ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포, 총 430억원에 해당하는 비용 절감 성과를 얻었다. 이번에 배포하는 8종 4개 국어 대화체 음성DB 총 36만 문장, 한국어 대역 총 20만 문장의 DB를 국내 10개 기관에 배포할 경우 최소 120억원의 수입대체 효과를 얻을 수 있을 것으로 기대하고있다.

 

이번 DB 배포는 지난 2011년부터 미래창조과학부가 추진한  '스마트 모바일용 다국어 언어음성DB' 구축사업의 일환으로 진행됐다.

 

이영직 자동통역연구실 박사는 "ETRI의 음성DB는 국가DB사업에서 요구하는 고품질 수준으로 국가지정 감리업체로부터 합격했다"며 "본 DB를 활용할 경우 언어 음성기술의 완성도를 높일 수 있어 신규시장 창출과 국제경쟁력 강화에 큰 기여를 할 것으로 보인다"라고 밝혔다.