앤스로픽, 세계 최고 수준 AI 모델 ‘클로드 4’ 시리즈 공개


AI 스타트업 앤스로픽(Anthropic)이 코딩과 추론 능력에서 세계 최고 수준을 자랑하는 차세대 인공지능 모델 ‘Claude 4’ 시리즈를 공식 출시했다고 발표했다. 이번에 공개된 Claude Opus 4와 Claude Sonnet 4는 기존 AI 모델들의 한계를 뛰어넘어 장시간 집중이 필요한 복잡한 작업도 수행할 수 있는 능력을 갖췄다.

YouTube 동영상

세계 최고 코딩 성능의 Claude Opus 4

가장 주목받는 모델인 Claude Opus 4는 현재 출시된 AI 모델 중 코딩 능력이 가장 뛰어나다. 실제 소프트웨어 엔지니어링 작업을 평가하는 SWE-bench에서 72.5%의 성과를 기록해 구글의 제미나이(Gemini)나 OpenAI의 GPT 모델들을 앞섰다. 특히 몇 시간에 걸쳐 수천 단계의 복잡한 작업을 지속적으로 수행할 수 있어, AI 에이전트가 할 수 있는 일의 범위를 크게 확장했다.

이런 성능은 실제 기업들의 평가에서도 입증되고 있다. 코딩 도구를 만드는 커서(Cursor)는 “복잡한 코드베이스를 이해하는 능력에서 비약적 발전을 보였다”고 평가했고, 클라우드 개발 플랫폼 Replit은 “여러 파일에 걸친 복잡한 변경사항에서 정밀도가 극적으로 향상됐다”고 밝혔다. 일본의 라쿠텐은 실제로 7시간 동안 독립적으로 오픈소스 코드를 리팩터링하는 작업을 성공적으로 수행한 사례를 공개하기도 했다.

실용성을 높인 Claude Sonnet 4

Claude Sonnet 4는 기존 Sonnet 3.7 모델을 대폭 개선한 버전으로, 성능과 효율성의 균형을 맞춘 실용적인 모델이다. 코딩 테스트에서 72.7%의 성과를 기록해 최첨단 수준에 도달했으며, 사용자의 지시를 더 정확하게 따르는 능력도 향상됐다.

마이크로소프트가 인수한 깃허브(GitHub)는 Claude Sonnet 4를 자사의 코딩 도구인 깃허브 코파일럿(GitHub Copilot)에 통합할 계획이라고 발표했다. GitHub 측은 “에이전트 시나리오에서 뛰어난 성능을 보인다”며 도입 배경을 설명했다. 코드 검색 도구를 만드는 Sourcegraph도 “문제를 더 깊이 이해하고 우아한 코드를 제공하는 소프트웨어 개발의 상당한 도약”이라고 평가했다.

혁신적인 하이브리드 사고 방식

Claude 4 시리즈의 가장 큰 특징은 두 가지 사고 방식을 모두 갖춘 ‘하이브리드 모델’이라는 점이다. 간단한 질문에는 즉시 답변하지만, 복잡한 문제가 주어지면 충분한 시간을 들여 깊이 사고한 후 답변한다. 사고 과정에서는 웹 검색 같은 도구도 활용할 수 있어, 추론과 정보 수집을 번갈아가며 더 정확한 답변을 만들어낸다.

특히 개발자들이 로컬 파일에 접근할 수 있게 해주면, Claude Opus 4는 중요한 정보를 기억해두는 ‘메모리 파일’을 자동으로 만든다. 예를 들어 포켓몬 게임을 플레이할 때는 ‘내비게이션 가이드’를 스스로 작성해 게임 진행에 활용하는 모습을 보였다. 이런 기능은 장기간에 걸친 복잡한 프로젝트를 수행할 때 일관성을 유지하는 데 큰 도움이 된다.

개발자 도구 클로드 코드(Claude Code)도 정식 출시

YouTube 동영상

앤스로픽은 AI 모델과 함께 개발자 도구인 클로드 코드(Claude Code)도 정식으로 출시했다. 이 도구는 프로그래머들이 터미널에서 직접 Claude의 도움을 받을 수 있게 해주며, Visual Studio Code나 JetBrains 같은 인기 있는 개발 환경과도 연동된다. Claude가 제안하는 코드 수정 사항이 편집기에서 바로 표시되어 검토와 적용이 간편해졌다.

특히 주목할 만한 기능은 깃허브(GitHub)와의 연동이다. 개발자들이 코드 리뷰 요청이나 오류 수정이 필요할 때 Claude Code를 태그하면, AI가 자동으로 피드백에 응답하거나 문제를 해결해준다. 이는 팀 단위 개발에서 생산성을 크게 높일 수 있는 혁신적인 기능으로 평가받고 있다.

접근성과 가격 정책

Claude 4 모델들의 가격은 기존과 동일하게 유지된다. API를 통해 이용할 경우 Opus 4는 100만 토큰당 입력 15달러, 출력 75달러이고, Sonnet 4는 입력 3달러, 출력 15달러다. 100만 토큰은 대략 75만 단어에 해당하는 방대한 양이다.

일반 사용자들은 무료로도 Sonnet 4를 이용할 수 있고, 유료 구독을 하면 Opus 4까지 사용할 수 있다. 아마존 웹 서비스나 구글 클라우드를 통해서도 접근 가능해 기업들이 자사 서비스에 통합하기 쉽다.

안전성 강화에도 주력

앤스로픽은 성능 향상과 함께 안전성 확보에도 심혈을 기울였다. 새로운 모델들은 작업을 완료하기 위해 편법이나 지름길을 사용하는 빈도가 기존 모델 대비 65% 줄어들었다. 또한 화학, 생물학, 핵무기 관련 정보의 오남용 가능성을 차단하기 위한 고수준 안전 조치도 적용했다.

긴 사고 과정을 거칠 때는 전체 내용을 보여주는 대신 핵심만 요약해서 보여주는 기능도 추가했다. 사용자 입장에서는 결과만 간단히 확인할 수 있고, 필요한 경우에만 상세한 사고 과정을 볼 수 있다.

AI 에이전트 시대의 서막

앤스로픽은 이번 Claude 4 출시를 “가상 협력자를 향한 큰 발걸음”이라고 표현했다. 실제로 두 모델은 단순히 질문에 답하는 수준을 넘어서, 인간과 함께 장기간 프로젝트를 수행하고 복잡한 문제를 해결하는 진정한 AI 파트너의 모습을 보여주고 있다.

OpenAI와 구글 같은 경쟁사들이 연이어 강력한 모델들을 출시하는 상황에서, 앤스로픽의 이번 발표는 AI 업계의 경쟁을 한층 더 치열하게 만들 것으로 예상된다. 특히 코딩과 에이전트 기능에서 보여준 압도적 성능은 개발자 커뮤니티의 큰 관심을 끌고 있다.

한편, 앤스로픽은 지난 3월에 615억 달러 가치에 35억 달러를 투자받은 바 있다. 

기사 공유하기

답글 남기기