메뉴 바로가기 컨텐츠 바로가기 푸터 바로가기

CAU News
글자 확대축소 영역

AI대학원 강성민 석사과정생, 인공지능-정보검색 분야 SIGIR 학회 논문 출판

관리자 2023-04-07 조회 1643

우리 대학 AI대학원 1기 입학생인 강성민 석사과정 학생이 텍스트-비디오 검색 기술 관련 세계 최고 학회 중 하나인 SIGIR(Special Interest Group on Information Retrieval)에 제1저자로 논문을 발표하는 성과를 일궈냈다. 



SIGIR은 BK리스트 최상위 리스트(IF4)에 이름을 올린 학회로 인공지능-정보검색 분야 최고 학회 중 하나로 그 명성이 높다. 


SIGIR은 정보검색 분야에 관심을 가진 전문가들이 속한 ACM(Association for Computing Machinery)의 특수 관심 그룹이다. 인공지능, 컴퓨터 과학, 정보검색 분야의 전문가들이 모여 정보검색 시스템의 이론, 구현, 평가, 응용에 관한 연구와 실용적인 경험을 공유하는 것을 목적으로 한다.


SIGIR은 매년 국제 학회를 개최한다. 이 학회는 정보검색 분야의 세계적인 행사로 알려져 있다. 국제 학회에서는 정보검색, 웹 검색, 텍스트 마이닝, 추천 시스템 등과 관련 있는 다양한 주제가 다뤄진다. 학계·산업계 전문가들이 참여해 연구성과를 발표하고 토론을 펼치는 공간도 제공된다.


SIGIR 학회에서 발표되는 논문들은 까다로운 심사·선별 과정을 거쳐 발표된다. 논문이 발표되는 것 자체가 해당 분야에서의 높은 연구 수준과 성과를 인정받는다는 의미다. SIGIR 학회에서 논문을 발표하는 것은 정보검색 분야에서의 중요한 성과로 간주되며, 해당 분야 연구자들에게 큰 명예로 여겨진다.


강성민 학생이 발표한 기술은 영상 콘텐츠를 이해하는 기초 기술로 유튜브, 틱톡과 같은 비디오 검색·추천 시스템에 사용된다. 학계·산업계에서 오픈 데이터셋을 활용한 경쟁이 치열하게 벌어지고 있는 분야이기도 하다.


강성민 학생은 멀티 엑스퍼트(Multi-Expert) 구조와 새로운 형태의 데이터 증강 기법을 동원해 텍스트가 비디오를 더 세밀하게 이해할 수 있도록 개선한 기술을 개발했다. 기존 연구들보다 높은 성능을 달성해 SIGIR에서 full paper 논문을 구두 발표하게 됐다.


Multi-Expert 구조는 여러 전문가의 지식과 경험을 모아 한 가지 문제를 해결하는 인공지능 기술 구조를 의미한다. 이 구조에서는 여러 전문가의 역량을 대표하는 여러 인공지능 모델이 함께 작동해 각각의 특성을 최대한 활용함으로써 한 가지 문제를 효과적으로 해결할 수 있다. 서로 다른 인공지능 모델들의 강점을 결합해 전체적으로 더 높은 성능을 달성할 수 있다는 얘기다. 각각의 모델이 개별적으로 작동할 때보다 더욱 효율적이고 정확한 결과를 도출할 수 있어 인공지능 기술 발전에 큰 도움이 된다.


데이터 증강(data augmentation)은 기존 데이터를 다양한 방법으로 변형하거나 확장해 인공지능 모델의 학습 데이터를 늘리는 기법이다. 


인공지능 모델은 데이터를 학습할 때 다양한 데이터를 경험할수록 더욱 높은 성능을 발휘한다. 하지만, 충분한 양의 데이터를 수집하는 것은 쉽지 않은 일이며, 많은 시간을 요한다. 


데이터 증강 기법을 사용하면 기존 데이터를 약간씩 변형하거나 조작해 새로운 데이터를 만들어낼 수 있다. 예컨대 이미지 데이터의 경우 이미지를 회전시키거나 반전시키는 등의 방법으로 데이터를 증강할 수 있다. 


이렇게 만들어진 새로운 데이터를 인공지능 모델에 학습시키면, 더 다양한 상황을 학습하게 되고 성능도 향상된다. 강성민 학생은 이번 논문을 통해 새로운 방법의 비디오 데이터 증강 기법을 제안했고, 이를 비디오 검색 분야에 적용했다.


강성민 학생은 “비전공자이기에 AI대학원에 입학한 후 더 많이 노력하고자 했다. 인공지능(AI)대학원 지원사업을 통해 세계적인 학회에 논문이 채택된 것을 영광스럽게 생각한다”고 소감을 전했다.