
엔비디아가 에이전트형 인공지능(Agentic AI) 시스템을 위한 새로운 대규모 언어모델 '네모트론3 슈퍼(NVIDIA Nemotron 3 Super)'를 최근 공개했습니다.
이 모델은 최대 5배 높은 처리 성능과 향상된 추론 능력을 제공하도록 설계됐습니다.
네모트론3 슈퍼는 1,200억 개의 파라미터를 가진 오픈 모델로, 실제 추론 과정에서는 120억 개의 활성 파라미터(active parameters)만 사용하는 구조입니다. 이를 통해 복잡한 AI 에이전트 작업을 보다 효율적으로 수행할 수 있습니다.
엔비디아는 이 모델이 자율적으로 작업을 수행하는 에이전트형 AI 시스템을 대규모로 운영할 수 있도록 만들어졌으며, 높은 정확도로 복잡한 작업을 처리할 수 있다고 설명했습니다.
이미 여러 기업이 네모트론3 슈퍼를 도입하고 있습니다.
AI 검색 서비스 기업인 Perplexity는 검색 기능과 멀티모델 시스템인 'Computer'에서 이 모델을 활용하고 있습니다. 또한 CodeRabbit, Factory, Greptile 같은 소프트웨어 개발 에이전트 기업들도 기존 모델과 함께 네모트론3 슈퍼를 통합해 정확도를 높이고 비용을 낮추는 데 활용하고 있습니다.
생명과학 분야에서는 Edison Scientific, Lila Sciences 등이 이 모델을 활용해 문헌 검색, 데이터 분석, 분자 연구 등을 수행하는 AI 에이전트를 개발하고 있습니다.
기업용 소프트웨어 플랫폼에서도 도입이 확대되고 있습니다. Amdocs, Palantir, Cadence, Dassault Systemes, Siemens 등 산업 분야 기업들은 이 모델을 이용해 통신, 사이버보안, 반도체 설계, 제조 공정 등 다양한 업무 자동화를 추진하고 있습니다.
이 모델은 여러 클라우드와 플랫폼에서도 사용할 수 있습니다.
Google Cloud Vertex AI와 Oracle Cloud Infrastructure에서 제공되며, 앞으로 Amazon Web Services(Amazon Bedrock)와 Microsoft Azure에서도 지원될 예정입니다.
또한 Coreweave, Crusoe, Nebius, Together AI 같은 엔비디아 클라우드 파트너와 Baseten, Cloudflare, DeepInfra, Fireworks AI, Lightning AI 등 추론 서비스 기업들도 이 모델을 지원합니다. 데이터 플랫폼 기업인 Distyl, Dataiku, DataRobot, Deloitte, EY, Tata Consultancy Services 역시 관련 서비스에 네모트론3 슈퍼를 활용할 계획입니다.
네모트론3 슈퍼는 NVIDIA NIM 마이크로서비스 형태로 제공되며, 기업들은 이를 통해 온프레미스 환경부터 클라우드까지 다양한 인프라에서 에이전트형 AI 시스템을 구축할 수 있습니다.
최성훈 기자 csh87@etnews.com