고려대, AI 성능 좌우하는 ‘사전학습’ 중요성 규명

고려대, AI 성능 좌우하는 ‘사전학습’ 중요성 규명: 이선용 기자 / 2026-03-09 14:30:46

도메인 전이 연구의 새 방향 제시

왼쪽부터 고려대 인공지능학과 위정명 석사과정(제1저자), 이두진 석박통합과정(공동저자), 김동현 교수(교신저자).

[대학저널 이선용 기자] 고려대학교 인공지능학과 김동현 교수 연구팀이 인공지능(AI) 모델의 도메인 전이 성능에서 사전학습이 핵심적인 역할을 한다는 사실을 체계적으로 분석하고, 향후 AI 연구에서 사전학습을 중심으로 한 새로운 평가 기준이 필요함을 제시했다.

이번 연구는 컴퓨터 비전 분야의 국제 저명 학술지 ‘International Journal of Computer Vision(IJCV, IF=9.3)’ 온라인에 1월 9일 게재됐다.

AI 모델은 학습 환경과 다른 실제 환경에 적용될 경우, 성능이 저하되는 ‘도메인 변화’ 문제를 겪는다. 이를 해결하기 위해 환경 차이를 보정하는 다양한 도메인 적응 알고리즘이 개발되어 왔지만, 기존 연구들은 오래된 사전학습 모델을 기반으로 실험과 분석이 진행돼 최신 사전학습 기술의 영향을 충분히 반영하지 못했다.

이에 연구팀은 최신 신경망 구조와 대규모 사전학습 데이터셋을 활용해 광범위한 실험을 수행했다. 그 결과, 사전학습 방식의 차이가 도메인 전이 성능에 큰 영향을 미친다는 사실을 확인했다. 특히, 어떤 사전학습 모델을 사용하느냐에 따라 적응 기법의 성능 평가 결과가 달라졌으며, 기존에 우수하다고 알려진 알고리즘의 순위가 최신 사전학습 환경에서는 달라질 수 있음을 밝혀냈다.

또한 연구팀은 사전학습 데이터의 단순한 규모보다, 데이터에 포함된 클래스 다양성과 실제 적용 과제와의 유사성이 성능 향상에 더욱 중요한 요인임을 규명했다. 이는 데이터 양을 무조건 늘리기보다 실제 활용 분야와 유사한 범주의 데이터를 포함하는 것이 도메인 전이 성능 개선에 더 효과적일 수 있음을 의미한다.

나아가 연구팀은 웹 기반 대규모 사전학습 데이터에서 발생할 수 있는 데이터 누수 가능성도 정량적으로 분석했으며, 이러한 요인이 도메인 전이 성능 향상에 미치는 영향은 제한적임을 확인했다.

이번 연구는 AI 도메인 전이 분야에서 사전학습 단계의 중요성을 정량적으로 분석하고, 향후 연구 방향을 재정립했다는 점에서 의미가 크다. 이러한 결과는 자율주행, 의료 영상 분석, 산업 자동화 등 다양한 분야에서 안정적이고 신뢰할 수 있는 AI 시스템 개발에 기여할 것으로 기대된다.

김동현 교수는 “이번 연구는 AI의 일반화 성능을 이해하기 위해서는 사전학습 단계에 대한 체계적인 분석이 필수적임을 보여준다”라며 “향후 도메인 전이 연구의 평가 패러다임을 사전학습 중심으로 확장하는 계기가 될 것”이라고 밝혔다.

한편, 이번 연구는 과학기술정보통신부와 한국연구재단의 지원을 받아 수행됐다.