대학원 소식
NLP&AI 연구실, EMNLP 2023에서 6편의 논문 발표로 국제적 명성 증명
2023.12.19 Views 356
NLP&AI 연구실, EMNLP 2023에서 6편의 논문 발표로 국제적 명성 증명
언어 데이터 기반 자연어 처리 연구 분야 세계 최고 학회

언어 데이터 기반 자연어 처리 연구 분야 세계 최고 학회

자연어 처리 분야에서 가장 권위 있는 학회인 EMNLP 2023에서 고려대의 한 연구실에서 6편의 논문이 발표되는 우수한 성과를 거뒀다.
EMNLP(Empirical Methods in Natural Language Processing)는 인공지능(AI) 번역과 챗봇, 기계 독해 등 언어 데이터 기반 자연어 처리와 관련된 연구를 다루는 세계 최고 수준의 학회다.
최근 싱가포르에서 개최된 EMNLP 2023에는 총 4,908편의 논문이 제출됐으며 이 중 1,047편만 통과되어 최종 21.3%의 채택률을 기록했다. EMNLP 2023에는 마이크로소프트, 구글, 애플, 아마존 등 세계 유수의 AI 기업들도 참가했다.
고려대 NLP&AI 연구실(지도교수 : 임희석 교수)은 EMNLP 2023에서 6편의 논문을 소개하는 쾌거를 거뒀다. 임희석 교수 연구실에서 발표한 6편의 논문은 각각 독창적이고 혁신적인 아이디어를 담고 있으며, 자연어처리 분야에서 중요한 발전을 이룬 결과들이다.
● CHEF in the Language Kitchen: A Generative Data Augmentation Leveraging Korean Morpheme Ingredients
한국어 형태소의 특징을 고려한 데이터증강 기법을 제안한 것으로 업스테이지와의 협업을 통하여 성과 도출
● KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processing
한국어 음성 인식 및 후처리 분야를 위한 오류 설명 가능한 벤치마크 데이터셋인 KEBAP을 제안, 업스테이지와의 협업을 통해 성과 도출
● Post-hoc Utterance Refining Method by Entity Mining for Faithful Knowledge Grounded Conversations
지식 기반 대화를 위한 발화 정제 방법을 제안하는 논문으로, 엔씨소프트와 공동연구를 통한 결과
● Beyond Candidates: Adaptive Dialogue Agent Utilizing Persona and Knowledge
페르소나와 지식을 활용한 적응형 대화 에이전트에 관한 연구로, 더 다양하고 맞춤형 대화 구현
● Explore the Way: Exploring Reasoning Path by Bridging Entities for Effective Cross-Document Relation Extraction
문서 간 관계 추출을 위해 엔터티 간 추론 경로를 연구하는 논문으로, 문서 간 관계 파악을 효과적으로 개선
● CReTIHC: Designing Causal Reasoning Tasks about Temporal Interventions and Hallucinated Confounding
시간적 개입과 환각적 혼란 문제에 관한 인과 추론 작업을 설계한 연구로, 이 문제를 다루는 데 중요한 역할
임희석 교수 연구실은 2023년 6월에는 한국어 특화 LLM인 KULLM(구름)을 개발하고 일반에 공개하여 한국 LLM 생태계에도 크게 기여했고, Ko-CommonGen 데이터셋 구축 및 공개로 Open Ko-LLM 리더보드 운영에 기여하는 등 국내 자연어처리 분야의 선두 주자 역할을 하고 있다.
더 나아가 임희석 교수는 LLM의 환각현상과 일관성 부족 문제를 해결하기 위한 연구를 진행 중이며, 이에 대한 성과를 2024년 EMNLP, ACL, EACL, NAACL 등 인공지능분야의 주요 학술대회에 다수의 논문으로 발표할 것이라고 밝혔다. 이를 통해 우리나라의 자연어 처리 분야의 명성과 고려대 NLP&AI 연구실의 명성을 한층 높일 것으로 기대된다.
file