KAIST, 달팽이관 모사한 인공지능 기반 음성센서 개발

97.5%의 높은 화자 인식률

신영경

ykshin@dhnews.co.kr | 2018-10-04 13:42:15

[대학저널 신영경 기자] KAIST(총장 신성철) 신소재공학과 이건재 교수와 전기및전자공학부 유창동 교수 공동 연구팀이 인공지능 기반의 화자(話者) 인식용 유연 압전 음성센서를 개발했다.


이번 연구 결과는 국제 학술지 ‘나노 에너지(Nano Energy)’ 9월호에 ‘민감도’와 ‘화자인식’ 논문 두 편으로 동시 게재됐다. 현재 관련 기술은 실용화 단계에 있다.


음성센서는 인간과 기계 사이에서 자유로운 소통을 가능하게 만드는 4차 산업혁명의 핵심 기술이다.


하지만 현재 산업계에서는 음성 신호 수신 시 정전용량을 측정하는 콘덴서 형식을 사용하기 때문에 민감도가 낮고 인식 거리가 짧아 화자 인식률에 한계가 있었다.


이에 연구팀은 인간의 달팽이관을 모사해 주파수에 따라 다른 영역이 진동하는 사다리꼴의 얇은 막을 제작했다. 음성신호에 따른 공진형 진동을 유연 압전 물질을 통해 감지하는 자가발전 고민감 음성센서를 개발한 것.


연구팀의 음성센서는 기존 기술 대비 2배 이상 높은 민감도를 가져 미세한 음성 신호를 원거리에서도 감지할 수 있다. 또한 다채널로 신호를 받아들여 하나의 언어에서도 여러개의 데이터를 얻을 수 있다.


연구팀은 이 기술을 기반으로 화자 인식 시스템에 적용해 97.5%의 화자인식 성공률을 무향실에서 달성, 기존 기술 대비 75% 이상 오류를 줄였다.


KAIST는 이번 연구가 스마트 홈 가전이나 인공지능 비서, 생체 인증 분야 등 차세대 기술에 활용 가능할 것으로 기대하고 있다.

이건재 교수는 "이번에 개발한 머신 러닝 기반 고민감 유연 압전 음성센서는 화자를 정확하게 구별할 수 있기 때문에 개인별 음성 서비스를 스마트 가전이나 인공지능 비서에 접목할 수 있을 것"이라며 "생체 인증 및 핀테크와 같은 보안 분야에서도 큰 역할을 할 수 있을 것이다"라고 말했다.


[ⓒ 대학저널. 무단전재-재배포 금지]