정보 생성의 정확도·유용성 높여
한국어 언어능력서 강점
|
30일 네이버는 추론(reasoning) 능력을 강화한 생성형 AI 'HyperCLOVA X THINK(하이퍼클로바X 씽크)' 개발을 완료하고 모델의 구조와 성능을 담은 기술보고서를 발표했다. 이 모델은 사용자 질의에 대해 혼잣말하듯 사고를 전개하며 응답을 구성하는 방식으로, 복잡한 문제를 단계별로 나누고 적절한 도구를 활용하며 오류를 교정하는 일련의 추론 과정을 통해 정보 생성의 정확도와 유용성을 높인 것이 특징이다.
HyperCLOVA X THINK는 특히 한국어 언어 능력에서 강점을 보였다. 네이버에 따르면 서울대 언어학과가 개발한 고난도 평가 지표 'KoBALT-700' 벤치마크에서 동급 국내외 모델을 제치고 최고 수준의 점수를 기록했으며, 또 다른 대표 지표인 'HAERAE-Bench' 평가에서도 높은 성능을 보였다. 두 벤치마크 모두 통사론, 의미론, 화용론 등 한국어의 심층적 이해도를 진단하는 전문가용 기준으로, HyperCLOVA X THINK의 언어적 추론 능력이 에이전트 AI로서의 경쟁력을 입증했다는 평가다.
또한 HyperCLOVA X THINK는 시각 정보 기반의 추론 능력도 갖췄다. 과학·기술·공학·수학(STEM) 영역의 이미지를 인식하고 문제를 푸는 과정에서, 예컨대 수능 생명과학 문제에 등장하는 생태계 변화 그래프나 식물 군집의 생산량 변화 데이터를 시각적으로 해석하고 배경지식과 결합해 정답을 도출하는 성능을 보였다. 네이버 측은 해당 모델이 멀티모달 특화 구조가 아님에도 시각 추론 영역에서 의미 있는 성과를 냈다고 평가하며 향후 이미지·영상·음성 모델과의 통합을 통해 멀티모달 추론 AI로 고도화해나갈 계획이라고 밝혔다.
네이버는 HyperCLOVA X THINK를 오픈소스로 공개할 예정이다. 앞서 공개한 경량형 모델 'HyperCLOVA X SEED'가 한 달 만에 50만 다운로드를 기록한 만큼, 이번 추론모델 역시 한국 AI 생태계 활성화에 크게 기여할 것으로 기대된다. 모델 설계에는 ICML 2025에 채택된 자체 신경망 정규화 기법 'Peri-LN'이 적용됐고, 강화학습 기반 학습 방법도 글로벌 학계에 공유됐다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 두 가지 축으로 고도화하고 있으며 이번 HyperCLOVA X THINK를 통해 지능 측면에서 상당한 발전이 이뤄졌다"며 "급변하는 AI 흐름 속에서 글로벌 선두권 그룹의 기술을 지속적으로 갖춰가고 있으며, 기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 말했다.