2025.05.24 (토)

  • 구름많음춘천 16.3℃
  • 구름많음서울 18.2℃
  • 구름조금인천 16.9℃
  • 구름많음원주 17.5℃
  • 맑음수원 17.4℃
  • 맑음청주 18.1℃
  • 맑음대전 18.5℃
  • 맑음포항 19.5℃
  • 맑음군산 17.8℃
  • 맑음대구 19.0℃
  • 맑음전주 19.1℃
  • 맑음울산 20.0℃
  • 맑음창원 20.6℃
  • 맑음광주 18.4℃
  • 맑음부산 19.1℃
  • 맑음목포 18.7℃
  • 맑음여수 16.8℃
  • 맑음제주 21.3℃
  • 구름조금천안 17.8℃
  • 구름조금경주시 20.7℃
기상청 제공

서울대 공대 컴퓨터공학부 김현우 박사, 국제 최우수 AI 학회 EMNLP에서 국내 대학 연구자 최초 논문상 수상

고품질 대규모 대화 데이터셋 누구나 간편하게 구축하는 방법론 개발

 

 

한국 사회적경제신문 박진수 기자 | 서울대학교 공과대학(학장 홍유석)은 컴퓨터공학부 김현우 박사와 김건희 교수가 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI, AI2) 및 워싱턴 대학교(University of Washington)의 최예진 교수 등과 함께 진행한 연구가 국제 최우수 자연어처리 학술대회 'EMNLP 2023'에서 'Outstanding Paper Award'를 수상했다고 밝혔다. 국내 대학 연구진이 EMNLP에서 수상을 한 것은 이번이 최초다. 기존 인공지능(AI) 대화 분야는 고질적으로 데이터 부족 문제에 시달려왔다. 일상에서 이뤄지는 대화들은 데이터로 기록되지 않는 경우가 대부분이기 때문이다. 문자 메세지나 이메일 같은 형태로 대화가 기록되더라도 여러 법적 제약들이 존재하기 때문에 이를 연구에 활용하기에는 어려웠다. 

 

이의 대안으로 그동안 크라우드 소싱을 통해 대화 데이터셋을 제작해왔지만 비용도 많이 들고, 만들 수 있는 데이터셋 크기도 작은 문제점이 있다. 그 결과, 기존 대화 관련 연구들은 모두 소수의 작은 데이터셋 위에서 이뤄져 범용성에 큰 제약이 있었다. 수상 논문인 '사회 상식 맥락화 기법을 통한 백만 단위의 대화 증류(SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization)'는 이를 해결하기 위해 거대 언어모델(large language model, LLM)과 기호 기반 상식 그래프(symbolic commonsense knowledge graph)를 함께 사용해 데이터셋을 효율적으로 자동 구축하는 방법론인 CO_3 증류 프레임워크(distillation framework)를 제시했다. 

 

기존에 크라우드 소싱 활용 시에는 대화 하나당 길게는 몇 분이 걸리던 작업을 6초 내외로 단축시킨다. 연구팀은 이를 통해 세계 최초로 150만 규모의 세계 최대 고품질 일상 대화 데이터셋인 'SODA'를 무료로 공개했는데, 이는 기존 데이터셋 대비 100배 큰 규모다. 이 밖에도 대화의 자연스러움, 일관성, 구체성 등 품질 또한 기존 크라우드 소싱 기반 대화 데이터셋에 비해 2배 이상 뛰어난 것으로 나타났다. 그 결과, SODA에 학습시킨 챗봇 'COSMO'는 파라미터 수가 30억 개로 작은 크기임에도 불구하고 기존 큰 챗봇들(파라미터 수 70억)보다 대화 맥락에 더 적합하고 자연스러운 답변이 가능하다. 이번 연구는 대화 데이터셋 부족 문제를 해결하고, 누구나 간편하게 세계 최대 규모의 고품질 대화 데이터셋을 구축할 수 있는 방법론을 제시했다는 데에 의의가 있다. 이 방법론으로 탄생한 데이터셋 SODA는 다양한 대화 연구에 기반 자료로 쓰일 수 있을 것으로 기대되며, 해당 코드와 SODA 데이터셋, COSMO 모델은 모두 오픈소스로 공개돼 있다. 

 

해당 논문은 김현우 박사가 서울대 박사과정 중 미국 시애틀의 앨런 인공지능 연구소(Allen Institute for AI, AI2)에서 인턴을 수행하며 워싱턴 대학교(University of Washington), 카네기멜론 대학교(Carnegie Mellon University), 서던 캘리포니아 대학교(University of Southern California), 그리고 피츠버그 대학교(University of Pittsburgh)가 함께하는 국제 공동협력 연구를 이끈 결과며, 김현우 박사는 졸업 후 AI2에서 박사후 연구원으로 취업해 후속 연구를 이어가는 중이다. 김현우 박사와 김건희 교수는 정보통신기획평가원(IITP)의 연구비를 지원받았다.(No.2019-0-01082, No.2022-0-00156)


더마음사랑 사회적협동조합, 남양주시 장애인가족에 따뜻한 나눔 실천
한국사회적경제신문 KSEN 김인효 기자 | 남양주시는 지난 8일, 남양주시장애인가족지원센터가 더마음사랑 사회적협동조합과 함께 장애인 가족을 위한 후원금 전달식을 진행했다고 밝혔다. 이번 전달식은 장애 자녀를 돌보는 장애인가족의 정서적·심리적 안정을 지원하기 위해 마련됐다. 전달식에는 남양주시장애인가족지원센터 배애련 센터장과 더마음사랑 사회적협동조합 김민서 대표 등이 참석해 나눔의 의미를 함께했으며, 후원금은 우리 시 발달장애인 부모상담 제공기관을 이용해 심리상담을 받고 있는 장애인 가족의 정서 지원에 사용될 예정이다. 김민서 대표는“일상에 지친 장애인 가족들에게 작지만 따뜻한 쉼과 위로가 되길 바란다”며“앞으로도 지역사회와 함께하는 봉사와 나눔 활동을 이어가겠다”고 말했다. 배애련 남양주시장애인가족지원센터장은 “따뜻한 후원을 해주신 더마음사랑 사회적협동조합 김민서 대표께 감사드리며, 장애인가족에게 실질적인 위로와 격려가 되는 장애인 가족의 삶의 질 향상을 위한 정서적 지원을 지속적으로 추진하겠다”고 말했다. 시 관계자는 “장애인가족을 위한 따뜻한 후원에 감사드리며, 시에서도 장애인 가족
고용노동부 보령지청, 지역 일자리 유관기관과 2025년 상반기 ‘보령 일자리 네트워크’ 협의회 개최
한국사회적경제신문 KSEN 김인효 기자 | 고용노동부 보령지청(지청장 이점석)은 23일 보령고용복지센터에서 지역의 일자리 유관기관과 함께 2025년 상반기 ‘보령 일자리 네트워크’ 협의회를 개최했다. 이날 협의회에는 고용노동부 보령지청, 5개 지자체 일자리부서, 새일센터, 관내 대학, 노사발전재단, 지역의 청‧중장년 유관기관 등 20개 기관이 참석하여 각 기관별로 중점적으로 추진하는 일자리 사업을 공유했다. 또한 지역의 일자리 사업을 현장에서 체계적으로 연계‧협업할 수 있는 일자리 네트워크 구축과 유관기관 간 소통‧협력을 강화하기 위한 활성화 방안을 논의했다. ‘보령 일자리 네트워크’는 기존에 보령지청 관내 일자리 유관기관이 개별적으로 운영되어왔던 사업을 하나의 일자리 협력체계를 구축하여 기관 간 협력을 통해 보다 효율적이고 체계적인 취업 지원을 제공하는 것을 목표로 한다. 이날 참석한 일자리 유관기관은 고용센터를 중심으로 본 협의회를 반기별로 개최하고 실무자 중심의 실무협의회를 운영하기로 했으며, 지역 내 취업에 어려움을 겪고 있는 청‧장년층과 취업 취약계층 등을 지원하여 지역 고용 활성화를 위해 협력하기로