본문 바로가기

ETRI 최신뉴스

ETRI, 콜센터 녹취데이터 음성인식 엔진 개발

<고객 음성정보가 기업의 경영정보가 된다>

ETRI, 콜센터 녹취데이터 음성인식 엔진 개발

- 녹취기록을 자동으로 텍스트 변환하는 기술
- 고객 음성 DB 빅데이터 분석으로 신 시장창출
- 외산대비 10% 이상 우수성능 결과로 수입대체 효과

 

 

 

은행, 증권, 카드사 등 국내 대규모 콜센터가 17만석에 달하는 가운데 고객의 음성데이터 자료의 중요성이 점차 부각되고 있다.

 

음성 데이터를 녹취하여 분석을 통해 경영에 반영 할 수 있기 때문이다.   

 

국내 연구진이 콜센터 녹취기록을 자동 텍스트로 변화하는 기술개발에 성공, 관련 시장 상용화에 나서고 있다.

 

ETRI(한국전자통신연구원, 김흥남 원장)는 '자연어 음성인식 SW' 를 개발, 적극 상용화를 추진한다고 22일 밝혔다.

 

현재 콜센터의 고객 음성DB는 데이터 센터에 저장만 하는 형태였다. 따라서 고객과의 분쟁이나 사고 시에만 활용되곤 했다.

 

하지만, ETRI는 콜센터에 고객음성을 실시간으로 텍스트로 바꿔 고객의 음성 DB를 저장, 빅데이터 분석을 할 수 있다고 연구진은 설명했다.

 

이로써 회사는 고객의 연령, 성별에 따른 관심분야 파악은 물론 고객 성향을 알 수 있게 된다.

 

최근 금융권을 중심으로 상담원과 고객 음성 데이터를 자동으로 음성 인식 처리하는 기술이 본격적으로 검토되고 있다.

 

이는 고객 음성DB 분석이 기업의 경영전략 수립과 고객 마케팅, 고객 분쟁 감소 등 경영 자산으로 인식되면서, 대규모의 콜센터를 운영하는 기업들이 관심을 갖게 된 것이다.

 

현재 전 세계 콜센터와 같은 고객의 음성DB 분석시장은 미국과 이스라엘이 시장을 주도하고 있다.

 

하지만, 외국산 제품은 영어 등 주요국가 언어를 분석대상으로 하기 때문에 독특한 우리말과 글을 인식하는데 한계가 있다.

 

따라서, 유지보수에 많은 비용을 수반하게 된다.

 

더욱 큰 문제는 국내 기업이 보유하고 있는 고객 음성DB의 해외유출로 민감한 개인정보 문제를 발생시킬 수 있다는 것이다.

 

이러한 이유로 ETRI는 본 기술개발을 진행하였으며, 현재 관련 기업에 기술이전이 되어 상용화가 추진되고 있다.

 

개발된 기술은 외산 기술과의 비교테스트에서 10% 이상의 우수한 성능 결과를 얻었다.

 

본 기술의 핵심기술은 '자연어 음성인식 및 핵심어 검출기술' 로 자연스럽게 발성한 음성을 인식하여 문자로 변환하거나 특정 단어를 자동 추출해주는 기술이며 특히 콜센터 발화특성에 최적화 되어있다.

 

하지만 아직은 콜센터 녹취데이터와 같은 대화체 음성의 비정형 특성으로 인하여 인식 성공률이 70% ~ 80% 대에 머무르고 있기 때문에 추가 기술개발이 필요하다.

 

한편, 현재 국내 음성DB 분석시장은 초기단계로, 본 기술이 국내 고객 음성DB 분석 시장창출에 큰 역할을 할 것으로 기대하고 있다.

 

ETRI 이윤근 자동통역인공지능연구센터장은 "음성인식 기술은 음성검색을 시작으로 SMS(단문메시지서비스), 콜센터 녹취데이터용 음성인식, 자동통역, 영어학습, 내비게이션 등으로 점차 적용 영역이 넓어지고 있으며, 편리성과 친근성을 장점으로 하여 가까운 장래에 자동차, 가정, 회사 등 생활 모든 영역에서 중요한 사용자 인터페이스로 자리 잡게 될 것이다." 라고 말했다.

 

한편, 본 기술은 미래창조과학부 '모바일 플랫폼 기반 대화 모델 적용 자연어 음성 인터페이스 기술 개발' 사업의 일환으로 개발 되었으며, 특허 6건, 논문 10건, 기술이전 6건을 완료했다.

 

한편, 전 세계 음성인식 시장 규모는 2017년 대략 167억불 규모로 예상되며 이 중, 콜센터 음성인식 시장규모는 약 4억불 규모이다.

 

향후 ETRI는 동 기술에 관한 확실한 기술 우위를 확보하기 위해 심층신경망(deep neural network) 및 고성능 잡음처리기술 등을 지속적으로 개발할 예정이다.