숭실대 권민혜 교수팀 연구논문 국제 저명 AI 콘퍼런스 ‘NeurIPS’에서 발표된다

‘동물의 의사결정방법에 기반한 심층강화학습 연구’

황혜원

yellow@dhnews.co.kr | 2020-11-19 14:07:02

[대학저널 황혜원 기자] 숭실대학교(총장 황준성)는 전자정보공학부 권민혜(사진) 교수팀의 ‘동물의 의사결정 방법에 기반한 심층강화학습 연구’ 논문이 오는 12월 6~12일 열리는 AI 콘퍼런스 ‘NeurIPS’(Neural Information Processing System)에서 발표된다고 19일 밝혔다.

NeurIPS는 머신러닝과 빅데이터, 신경과학 등 다양한 인공지능 분야의 연구 결과가 발표되는 세계적인 학회로, 권 교수팀 논문은 ‘Inverse Rational Control with Partially Observable Continuous Nonlinear Dynamics’라는 제목으로 발표한다.

권 교수팀은 미국 라이스대학교, 베일러 의과대학, 미네소타 주립대학, 구글 연구진과 국제협업을 통해 이 연구를 진행했다.

알파고로 국내에 유명해진 심층강화학습 연구가 주로 진행되는 비디오게임 환경에서는 환경 상태정보를 학습자가 직접 얻을 수 있다. 그러나 대다수의 AI시스템에서는 전체 상태정보를 실시간으로 얻는 것이 현실적으로 어려워 자율주행자동차와 다중로봇시스템과 같은 공학시스템에 적용하는데 어려움이 많았다.

권 교수팀은 이러한 문제를 해결하기 위해 동물의 두뇌에서 수행되는 의사결정 과정에서 답을 찾았다. 인간을 포함한 동물들이 의사결정을 할 때, 자신의 주변 환경에 대한 모든 상태정보를 알지 못하기 때문에 부분 관측정보만을 바탕으로 추론의 과정을 거처 의사결정이 이뤄진다.

이같은 두뇌의 원리를 모방해 ‘Bayesian optimal control ensemble’ 기법을 제안했으며, 부분관측만 가능한 시스템에서도 심층강화학습 사용을 가능하게 했다.

권 교수는 “세계 최고의 AI 연구 결과만 발표한다는 NeurIPS에서 이번 연구를 발표하게 돼 기쁘다"며 “이번 연구 결과가 다양한 공학시스템에 심층강화학습이 널리 사용할 수 있게 되는 연결고리가 됐으면 한다”고 말했다.