
노타의 전문가혼합(MoE) 특화 양자화 알고리즘 논문 2편이 글로벌 머신러닝 학회 'ICML' 2026 AdaptFM(Resource-Adaptive Foundation Model Inference) 워크숍에서 채택됐다.
ICML은 머신러닝과 인공지능 분야를 대표하는 세계적 학회 중 하나다. 글로벌 빅테크와 주요 대학, 연구기관 최신 AI 연구 성과가 발표되는 자리다. AdaptFM 워크숍은 대규모 AI 모델을 제한된 컴퓨팅 자원에서도 효율적으로 실행하는 기술을 다룬다. 아마존·메타 등이 조직위원회에 참여하고 있다.
노타는 이번 논문 채택에 대해 최근 거대언어모델(LLM) 핵심 구조로 주목받는 MoE 모델 최적화 분야에서 축적해온 기술력을 인정 받은 것이라고 평가했다. MoE는 여러 전문가 모델 중 필요한 일부를 선택해 동작하는 방식으로 대형 AI 모델의 성능과 효율을 동시에 높일 수 있다.
채택된 논문 'DREAM-MoE'는 대규모 AI 모델을 여러 구간으로 나누어 양자화할 때 발생할 수 있는 판단 흐름 변화를 줄이는 방법을 제안한다. 'SRA-MoE' 논문은 모델 결과에 더 큰 영향을 주는 중요한 입력을 선별, 우선적으로 보호하는 방법을 제안한다.
두 연구 모두 최신 MoE 특화 양자화 기법과 비교해 더 높은 성능을 기록했다. 보다 적은 메모리와 연산 자원으로 AI 모델의 품질 저하를 줄일 수 있는 가능성을 확인한 것이다.
채명수 노타 대표는 “이번 논문 채택은 노타가 MoE에 특화된 양자화 기술을 꾸준히 고도화해온 성과”라며 “엔비디아 네모트론 해커톤 종합 우승에 이어 ICML 2026 AdaptFM 워크숍에서도 연구 성과를 낸 만큼 대규모 AI 모델을 보다 효율적으로 활용할 수 있는 최적화 기술 개발을 이어가겠다”고 말했다.
박종진 기자 truth@etnews.com