앤트로픽은 오퍼스 4.5 출시와 함께 클로드 개발자 플랫폼과 클로드 코드, 소비자용 앱도 대규모로 업데이트했다. 장시간 구동되는 에이전트를 지원하는 신규 도구가 추가됐으며, 클로드를 엑셀·크롬·데스크톱 환경에서 활용하는 방식도 한층 확장됐다. 클로드 앱에서는 긴 대화가 중간에 끊기지 않도록 문맥 관리 기능이 강화됐다.
앤트로픽은 엔지니어 채용 과정에서 활용하는 고난도 실기 시험을 내부 모델 평가에도 동일하게 적용해왔다. 제한 시간 2시간 안에 기술력과 판단력을 평가하는 것으로, 오퍼스 4.5는 해당 조건 기반으로 역대 어떤 인간 지원자보다도 높은 점수를 기록했다. 해당 시험은 시간 압박 속에서 기술적 역량과 판단 능력을 검증하는 데 초점을 두고 있어, 협업·커뮤니케이션 같은 다른 중요 역량은 평가 대상이 아니다. 그럼에도 고급 기술 영역에서 AI가 숙련된 엔지니어를 능가한 이번 결과는 앞으로 엔지니어링 직무 전반이 어떤 변화를 맞게 될지에 대한 중요한 논의를 던진다. 앤트로픽은 이러한 변화를 추적하기 위해 사회적 영향 및 미래 경제 연구를 진행 중이며, 관련 분석 결과를 조만간 추가로 공개할 계획이다.









