GIST, 국제 AI 음향 인식 대회서 심사위원상 수상

이선용 기자 | honaudo4@hanmail.net | 기사승인 : 2023-10-12 09:14:48
  • -
  • +
  • 인쇄
일상적 실내 생활에서 발생하는 소리를 탐지하는 인공지능 모델 설계

왼쪽부터 심사위원 탐페레 대학 Annamaria Mesaros 교수, GIST 손상원, 김지원 학생, 심사위원 로레인 대학 Romain Serizel 교수. 사진=광주과학기술원 제공

 

[대학저널 이선용 기자] 광주과학기술원(GIST)이 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 심사위원상(Judges’ award)을 수상했다.


세계 최대 전기·전자기술자협회(IEEE)의 신호처리소사이어티가 주관한 이번 대회에서 GIST 전기전자컴퓨터공학부 오디오지능연구실과 한화비전 공동 연구팀은 일상적 실내 생활에서 발생하는 소리를 탐지하는 인공지능 모델을 설계했다.

GIST-HanwhaVision 팀은 ‘DCASE(IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events) 챌린지 2023’에 참가해 ‘실내 음향 이벤트 탐지 부문(Task 4A)’에서 단일 모델 분야 1위와 앙상블 모델 분야 2위를 달성했으며, 특히 워크숍에서 ‘심사위원상’을 수상해 연구의 혁신성과 기술의 완성도 및 논문의 품질 등 다양한 기준에서 우수한 성과를 인정받았다.

심사위원상은 ‘DCASE 챌린지 2023’에 제출된 기술 리포트를 중심으로 연구의 독창성과 우수성을 검토해 Task별 1팀에게만 주어진다.

‘실내 음향 이벤트 탐지 기술’은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다.

이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 어플리케이션에 활용될 수 있다.

이번 워크숍에서 GIST-HanwhaVision 팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다.

구체적으로는 ▲인공지능이 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▲성능 향상을 위한 데이터를 정제하는 기술 ▲인공지능의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 인공지능 모델로 우수한 성과를 달성했다.

김홍국 교수는 “이번 대회를 통해 얻은 경험과 개발 기술은 한화비전의 CCTV 내에서의 음향 이벤트 탐지에 적용될 예정”이라며 “나아가 소셜미디어 콘텐츠에서의 음성구간 및 음향 이벤트 검출을 통해 보다 효율적이고 사용자 친화적인 서비스 개발에 노력하겠다”라고 말했다.

GIST-HanwhaVision 팀의 참여 학생들은 “한화비전 연구원들과의 긴밀한 협업과 김홍국 교수님의 전문적인 지원 덕분에 세계적인 대회에서 인정받는 성과를 창출할 수 있었다”라며, “지금의 성과를 바탕으로 오디오 인공지능 분야에서의 연구를 더욱 심화시켜 오디오지능 기술의 실용화와 사회적 가치 창출에 기여할 계획”이라고 밝혔다.

[저작권자ⓒ 대학저널. 무단전재-재배포 금지]

뉴스댓글 >