'강화학습+MoE 결합 = 딥시크' 기술 심층 분석 무료 강연 이달 15일 개최

딥시크의 이해와 전망
딥시크의 이해와 전망

최근 중국의 인공지능(AI) 기업 딥시크가 발표한 추론모델(Reasoning Model) 'R1'이 주요 벤치마크에서 오픈AI 최신 모델 'o1'과 견줄 만한 성능을 보이며 글로벌 테크 업계에 충격을 주고 있다. 추론 모델(Reasoning Model)은 대규모 언어 모델(LLM)의 한 유형으로 복잡한 문제를 빠르게 해결하고 논리적 추론을 수행하는 데 특화된 AI 모델이다.

추론 모델을 학습시키기 위해서는 복잡한 문제를 해결하는 대규모의 고품질 데이터 세트를 구축하고 이를 효과적으로 학습시키는 과정에서 발생하는 다양한 기술적 난제를 해결해야 한다. 딥시크는 이러한 한계를 극복하며 새로운 방향성을 제시했다. 특히 강화학습과 MoE(Mixture of Experts) 아키텍처를 결합해 비용 대비 성능을 극대화했다는 점에서 주목받고 있다.

더욱이 고가의 엔비디아 제품이 아닌 저렴한 칩을 활용해 추론 모델을 최적화한 혁신적인 접근 방식은 글로벌 AI 업계의 주목을 받고 있을 뿐 아니라 AI 연구와 개발의 패러다임을 변화시킬 것으로 점쳐지고 있다.

위데이터랩(대표 권건우)은 이처럼 딥시크 기술이 산업 전반에 미치는 영향이 커지는 가운데 이를 심층적으로 분석하고 기술 이해도를 높일 수 있는 무료 강연을 오는 15일(토) 오후 2시 수운회관 본사 강당(1303호)에서 개최한다고 4일 밝혔다.

강연엔 강승우 위데이터랩 연구소장이 맡는다. 딥시크에서 그간 내놓았던 모델의 갈래·발전 상황, 'R1' 모델의 구조와 데이터 생성·학습전략 등을 다룰 예정이다.

또한, 챗GPT에 적용된 인간피드백 기반 강화학습(RLHF)의 대안으로 떠올랐던 '직접신호최적화(DPO)' 등 최근 인기를 끌고 있던 LLM 개선 시도와 함께 강화학습을 중심으로 한 전략이 가진 장단점과 향후 시사점도 논할 예정이다.

행사는 사단법인 한국인공지능데이터과학협회가 주최하고 한국 전자정부 공개소프트웨어포럼, 위데이터랩, 한국산업지능화협회 등이 후원한다. 강연은 위데이터랩 강연장에서 오프라인으로 진행되며, 사전 등록 없이 현장에서도 참여할 수 있다.

또한, 카카오톡 링크를 통해 온라인으로 실시간 참여가 가능해 장소에 구애받지 않고 기술적 논의장에 함께할 수 있다.

강연자인 강승우 위데이터랩 연구소장은 서울대학교에서 물리학과를 졸업한 후 BEA 아태지역 최고기술 아키텍트, 한국 오라클 클라우드 부문 상무를 역임하는 등 폭넓은 경력을 보유하고 있다.

권건우 위데이터랩 대표는 “딥시크의 기술적 접근 방식이 향후 AI 모델 학습과 개발 전략에 어떤 영향을 미칠지 주목되는 상황에서 AI 기술 발전의 흐름을 심층적으로 이해하고, 최신 연구 동향과 산업적 응용 방안을 직접 탐색할 수 있는 이번 강연은 AI 연구자, 개발자, 기업 관계자에게 실질적인 인사이트를 제공할 것”이라고 말했다.

안수민 기자 smahn@etnews.com