
인공지능(AI) 기업 앤트로픽(Anthropic)이 AI 모델 '클로드 오퍼스(Claude Opus) 4.8'을 최근 공개했어요.
이번 업데이트는 AI 업계가 오랫동안 고민해 온 문제인 '정직성(Honesty)' 개선에 초점을 맞췄다는 점에서 주목받고 있죠.
AI는 점점 더 많은 일을 할 수 있게 됐지만, 여전히 틀린 정보를 사실처럼 말하거나 충분한 근거 없이 결론을 내리는 문제가 지적돼 왔어요. 복잡한 코딩 작업이나 장시간 이어지는 프로젝트에서는 작은 오류가 큰 문제로 이어질 수 있기 때문이에요.
앤트로픽은 이번 클로드 오퍼스 4.8이 이러한 한계를 줄이기 위해 개발됐다고 설명했답니다.
“모르겠다”라고 말할 수 있는 AI
그동안 많은 AI 모델은 불확실한 상황에서도 자신 있게 답변하는 경향을 보여왔어요. AI 업계에서는 이를 '환각(Hallucination)' 현상이라고 불러요.
클로드 오퍼스 4.8은 이런 문제를 줄이는 데 집중했어요. 답을 확신할 수 없는 경우에는 불확실성을 더 적극적으로 표시하고, 자신의 결과물에서 발견된 문제점도 스스로 지적할 수 있도록 개선됐어요.
앤트로픽의 내부 평가에 따르면 클로드 오퍼스 4.8은 이전 버전보다 자신이 작성한 코드의 결함을 그냥 지나치는 비율이 약 4배 감소한 것으로 나타났어요.
쉽게 말해 코드를 작성한 뒤 “문제가 없는 것 같습니다”라고 단정하기보다 “이 부분은 추가 검토가 필요합니다”라고 알려줄 가능성이 높아졌다는 의미예요.

더 똑똑해진 코딩 파트너
이번 모델은 코딩 능력도 한층 강화됐어요.
앤트로픽은 클로드 오퍼스 4.8이 다양한 코딩 벤치마크에서 성능이 향상됐으며, 개발자와 협업하는 능력도 좋아졌다고 밝혔어요.
특히 여러 단계를 거쳐 계획을 세우고 실행하는 에이전트형(Agentic) 작업에서 높은 평가를 받았어요. 에이전트형 AI는 사용자의 지시를 받은 뒤 스스로 계획을 세우고 여러 작업을 연속적으로 수행하는 AI를 뜻해요.
초기 사용자들은 클로드 오퍼스 4.8이 복잡한 업무를 처리할 때 더 신중하게 판단하고, 장시간 진행되는 프로젝트에서도 안정적인 모습을 보였다고 평가했어요.
동시에 일하는 수백 개의 AI
앤트로픽은 모델 공개와 함께 '다이내믹 워크플로(Dynamic Workflows)'라는 새로운 기능도 선보였어요.
이 기능은 하나의 AI가 모든 작업을 처리하는 대신, 수백 개의 AI 하위 에이전트가 동시에 협력해 대규모 프로젝트를 수행하는 방식이에요.
예를 들어 수십만 줄에 달하는 대형 소프트웨어를 새로운 환경으로 이전해야 할 경우, AI가 작업을 여러 개로 나눈 뒤 각각의 하위 에이전트에게 맡겨요. 이후 결과를 다시 검증하고 테스트를 거쳐 최종 결과를 사용자에게 전달해요.
앤트로픽은 이를 통해 코드베이스 전체를 옮기는 대규모 개발 작업도 수행할 수 있게 됐다고 설명했어요.
생각하는 시간도 직접 조절
클로드 오퍼스 4.8에는 '노력 제어(Effort Control)' 기능도 추가됐어요.
사용자는 이제 AI가 답변을 만드는 데 얼마나 많은 계산 자원을 사용할지 직접 선택할 수 있어요.
빠른 응답이 필요할 때는 낮은 수준으로 설정해 속도를 높일 수 있고, 복잡한 문제를 해결할 때는 높은 수준으로 설정해 AI가 더 오래 생각하도록 만들 수 있죠.
앤트로픽은 기본적으로 고노력(High Effort) 모드를 적용해 성능과 사용 경험의 균형을 맞췄다고 밝혔어요.

강화된 안전성과 신뢰성
앤트로픽은 이번 모델에 대해 별도의 정렬성(Alignment) 평가도 진행했어요. 정렬성은 AI가 사용자의 의도와 안전 기준에 맞게 행동하는지를 살펴보는 평가예요.
평가 결과 클로드 오퍼스 4.8은 사용자 자율성을 존중하고 사용자의 이익을 우선하는 성향에서 기존 모델보다 높은 점수를 받은 것으로 나타났죠.
또한 속임수나 오용 협조 같은 비정상적인 행동 비율도 이전 버전인 오퍼스 4.7보다 감소했어요.
이는 단순히 성능만 좋은 AI가 아니라 사용자의 의도를 더 정확하게 이해하고 안전하게 행동하는 AI를 만들기 위한 노력의 결과로 해석돼요.
AI 경쟁의 새로운 기준
그동안 AI 업계의 경쟁은 누가 더 높은 성능을 보여주느냐에 집중돼 있었어요.
최근에는 이야기가 달라지고 있어요. AI가 실제 업무와 기업 환경에 깊숙이 들어오기 시작하면서, 얼마나 똑똑한지뿐 아니라 얼마나 믿을 수 있는지가 중요한 평가 기준으로 떠오르고 있어요.
클로드 오퍼스 4.8은 이런 변화를 보여주는 대표적인 모델이에요. 더 빠르고 더 똑똑해지는 것을 넘어, 스스로 실수를 인정하고 불확실성을 설명할 수 있는 AI를 향한 첫걸음이기 때문이죠.
최성훈 기자 csh87@etnews.com