<佛수출 음성인식 에어컨, 리모콘, 내비게이션에 탑재>
ETRI, 프랑스어 언어음성DB 국내최초 배포
- 8년간 국내 57개 기관에 212개 DB 배포, 370억원 수입대체
- 음성리모콘, 어학교육, 자동통번역 등 토종기술 다국어 개발에 활용
- 스마트 인터페이스 분야 외국기술 잠식 차단 큰 역할
외국 언어에 대한 음성DB(데이터베이스)는 최근 스마트폰 등 모바일 기기의 확산 보급과 함께 아주 중요한 원천기술로 각광받고 있다.
이런 가운데 국내 연구진이 프랑스어 대화체(구어체) 음성DB의 개발에 성공했다.
ETRI(한국전자통신연구원, 원장 김흥남)는 프랑스어 대화체 음성DB 10만문장을 산업체 및
학계 등에 유료로 배포한다고 13일 밝혔다.
음성DB는 여행이나 관광, 어학분야에 널리 활용된다. 또한 음성 리모콘 제조사, 외국어 교육 업체, 자동통번역 서비스업체, 자동차 및 내비게이션 제조사, 포탈업체 등에 이번에 개발한 프랑스어가 활용될 전망이다.
프랑스어 음성DB를 활용하면, 향후 프랑스어권에 수출하는 음성인식 에어컨, 음성인식 TV리모콘, 음성인식 내비게이션 등에 장착되어 수출을 견인할 것으로 내다보고 있다. 언어음성 DB는 크게 음성인식 분야와 언어번역 분야의 SW로 나뉜다.
이들을 이용해 기업은 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야에 널리 활용해 왔다. 최근에는 ETRI가 만든 세계 최고의 통번역 '앱' 인 지니톡에도 활용되었다.
이번 DB 배포는 지난 2011년부터 2017년까지 미래창조과학부가 한국정보화진흥원을 통해 추진하는 국가DB사업 중 하나인 "스마트 모바일용 다국어 언어음성DB" 구축사업에 일환으로 진행되었다.
ETRI가 이번에 배포하는 DB는 ▲프랑스어 대화체 음성DB ▲한국어-프랑스어 대화체 대역문장DB ▲남미 스페인어 대화체 음성DB 등 3종의 언어음성DB다.
프랑스어 언어음성DB 구축에 사용된 핵심기술은 △특정영역 언어음성DB 기획 및 설계 기술 △언어음성DB 오류검출 기술 △언어음성DB 평가기술 등이다. 현재 국내 업체와 애플, 구글 등 세계적 기업 간에는 스마트폰, 스마트카, 스마트TV 등 스마트 인터페이스 분야의 경쟁이 치열하다.
따라서, ETRI가 이번 DB배포를 통해서 스마트 인터페이스 분야의 외국기술 잠식을 차단하는데 큰 역할을 할 것으로 기대된다.
그동안 음성DB를 이용한 상용제품들은 국가DB사업에서 구축한 자료를 이용하여 국내 기술로 자체개발한 부분도 있으나, 국내 DB가 없는 경우 외국에서 개발한 음성인식 및 번역엔진을 도입하여 탑재하는 형편이었다.
특히, 최근 자동통역서비스 등 자동통역 산업이 확산되는 추세를 고려할 때, 이 분야의 기술 자립을 위해서는 다국어 언어음성DB 구축이 시급히 요구된다.
ETRI는 이러한 요구에 부응하여 지난 2007년부터 한·영·일·중 등 다국어 언어음성DB를 구축, 배포해 왔다. 지난해 프랑스어를 추가하였고, 올해는 독일어를 추가하며 향후 러시아어, 아랍어, 베트남어 등도 구축할 계획이다.
언어음성DB 구축은 철저한 품질 관리가 필수적이므로, 언어음성DB는 그 가격이 비싸다.
유럽언어자원협회(ELRA) 등 해외로부터 일부 외국어 DB 구입이 가능하나, 300~500명이 발화한 음성DB의 경우 1~2억원 정도의 비용이 소요된다.
이에 반해, ETRI가 제공하는 프랑스어 음성DB는 발화 인원수도 800명에 달하며 가격면에서도 해외DB대비 5~10% 수준으로 중소기업에 제공한다.
ETRI는 지난 2006년부터 올해 2월까지 국내 57개 기관에 212개 DB를 배포, 총 370억원에 해당하는 비용 절감 성과를 얻었으며, 이번에 배포하는 3종의 DB를 국내 10개 기관에 배포할 경우 최소 45억원의 수입대체 효과를 얻을 수 있다.
ETRI 자동통역연구실 이영직 박사는 "ETRI의 음성DB는 국가DB사업에서 요구하는 고품질 수준으로 국가지정 감리업체로부터 합격했다. 본 DB를 활용할 경우 언어음성기술의 완성도를 높일 수 있다. 따라서, 신규시장 창출 및 국제경쟁력 강화에 큰 기여를 할 것으로 보인다" 고 설명했다.
그동안 ETRI가 배포한 DB업체로는 삼성전자, LG전자, KT, NHN, 다음, 보이스웨어, 쓰리소프트, 인피니티텔레콤, 디오텍, 시리우스소프트, 시스트란 인터내셔널, 솔트룩스 등이 있다.
한편, ETRI가 현재 배포중인 DB목록은 지난 2004년부터 현재까지 33개 자료로 음성 1,600시간, A4기준 텍스트는 2만 1천면에 달한다.
'ETRI 최신뉴스' 카테고리의 다른 글
ETRI, 콜센터 녹취데이터 음성인식 엔진 개발 (0) | 2015.03.25 |
---|---|
ETRI, 클라우드 스토리지 확장기술 개발 (0) | 2015.03.25 |
ETRI, 고신뢰 네트워크 원천기술 개발 (0) | 2015.03.12 |
ETRI, HD급 눈맞춤 영상회의 가능기술 개발 (0) | 2015.03.09 |
ETRI, 제어시스템 애플리케이션 방화벽 기술개발 (0) | 2015.02.27 |