앤트로픽 "AI 탈옥 대응 강화"…보안 협력 체계 구축 착수
|
앤트로픽은 이날 소셜미디어를 통해 상무부로부터 두 모델 모두에 대한 접근 제한을 해제한다는 통보를 받았다고 전했다. 미토스에 대해서는 이미 지난 26일 제한이 일부 완화됐다.
앤트로픽은 "'클로드 페이블5'가 내일부터 전 세계에서 다시 서비스된다"며 "미국 행정부와 일련의 논의를 거친 끝에 우리는 사이버 보안 위협 행위를 더 정확히 찾고 차단할 수 있는 새로운 분류기 시스템을 적용해 모델을 재배포하기로 했다"고 설명했다.
이어 "오탐지를 줄이고 실제 악용 사례와 정당한 요청을 더 잘 구별할 수 있도록 앞으로 몇 주 동안 분류 시스템을 지속적으로 고도화할 예정"이라고 덧붙였다.
아울러 "아마존, 마이크로소프트, 구글을 비롯한 글로벌 AI 보안 협력 프로젝트 '글래스윙' 파트너사들과 함께 AI '탈옥(보안장치 우회)'의 심각성을 평가하고 AI 개발사가 어떻게 대응해야 하는지에 대한 합의 프레임워크 초안을 작성하기 시작했다"고 전했다.
로이터 통신에 따르면 행정부는 그동안 중국, 러시아 등 우려 국가의 군사 정보 기관이 첨단 AI 모델을 오용할 수 있다고 우려해 잠재적 위협을 검열하기 위해 새로 출시하는 모델에 대한 감독을 강화했다.
상무부는 지난 12일 비공개 서한을 보내 안보 위협 가능성을 이유로 미소스와 페이블에 대한 외국인의 접근을 즉각 제한하라는 통제 규정을 부과했다. 이에 앤트로픽은 사용자의 국적을 일일이 파악할 방법이 없어 모든 사용자의 접속을 차단했다.










