아동학대상담 전용 모델, 상용 음성인식 엔진 중 가장 빠른 성능

[고양신문] 주식회사 마인즈랩(대표 유태준)이 전국 50여 개 국가 지자체에 자사 이동형 상담(회의) 녹취 시스템인 ‘마음상담록’을 납품했다고 28일 밝혔다. 마인즈랩의 ‘마음상담록’은 특히 아동학대상담 전용 모델로 뛰어난 인식 결과물을 보인다는 설명이다. 이는 8년 이상 경력을 보유한 데이터 사이언티스트의 노하우로 완성된 고성능 General 음성인식 모델 베이스를 적용한 결과다.

‘마음상담록’은 마인즈랩이 최근 개발한 한국어 음성인식에 최적화된 CNN 알고리즘 기반 엔진을 사용해 상용 음성인식 엔진 중 가장 빠른 성능을 자랑한다. 또 음성인식에 취약한 사투리 및 외래어에 대해 타사 엔진 대비 높은 인식률을 나타내는 강점이 있다.
 
아동학대 상담은 상담 특성상 특히 개인정보보호 및 유출에 민감할 수밖에 없다. ‘마음상담록’은 기존의 클라우드로 제공되는 음성인식 서비스처럼 외부 네트워크망을 사용하지 않는다는 점에서 더욱 강력한 보안 상태 유지가 가능하다는 것이 관계자의 설명이다.

‘마음 상담록’은 상담사의 편의와 상담 환경에 따라 ‘실시간 상담 기록’과, ‘음성 녹음 업로드 상담 기록’이라는 두 가지 형태의 상담록 작성 방법을 제공한다. 

‘스마트 마이크’를 통해 실시간으로 발화되는 음성을 즉시 인식해 문자로 변환하고, 자동으로 화자를 분리하여 상담록을 작성하며, ‘세컨드 스크린’ 기능으로 표시되는 실시간 음성인식 결과(TEXT)가 자칫 놓칠 수 있는 상담자의 말을 문자로 확인할 수 있어 원활한 상담 진행에 도움이 되도록 했다. ‘마음 상담록’은 다양한 실시간 상담 환경에서 최적의 상담 진행을 할 수 있도록 무지향성 블루투스 고성능 마이크를 무상으로 제공한다.

상담 내용을 녹음해 진행하는 상담 환경에서는 별도의 설치가 필요 없이 PC, 노트북, 태블릿, 스마트폰 등 다양한 전자 기기에서 즉시 상담 시스템에 접속해 손쉽게 녹음 파일을 업로드하고 상담록을 작성할 수 있다. 

타사가 제공하는 기존 DNN, LSTM 음성인식 엔진은 20~30분 정도 소요되는 데 반해 마인즈랩의 CNN 엔진은 1시간 분량의 상담 자료를 처리하는데 약 3분 이내만 소요된다. 따라서 상담사의 업무 효율이 대폭 향상될 수 있도록 지원한다. 또한, 최근 특허를 획득한 화자 표지 텍스트 생성 기술을 통해 상담사가 손쉽게 텍스트별 발화자를 기록할 수 있는 편집 시스템을 제공한다.

원정상 마인즈랩 전무는 “음성인식 기술은 마인즈랩이 가장 자신 있고 잘하는 분야로 어떠한 상황에서도 고품질의 상담 기록물을 만들어 내기 위해 끊임없는 연구개발을 진행하고 있다”며 “’마음 상담록’은 한 번의 납품으로 끝나지 않고 지속적인 음성인식 모델 업그레이드와 무상 SW 업데이트를 지원하고 있으며, 앞으로도 고객 만족에 최선을 다하겠다”고 말했다.

저작권자 © 고양신문 무단전재 및 재배포 금지