中 AI 키미 K2의 등장

< 일러스트 pexels 제공 >

딥시크를 뛰어넘는 성능

[객원 에디터 9기 / 정호진 기자] 딥시크는 올해 1월 ‘저비용 고성능’ AI 모델을 앞세워 등장과 동시에 폭발적인 반응을 얻었다. 미·중 기술 패권 경쟁이 격화되는 가운데 중국의 ‘AI 굴기’를 상징하는 사례로 주목받기도 했다. 그러나 최근 중국 인공지능(AI) 시장의 판도가 빠르게 흔들리고 있다. 올해 1분기까지만 해도 딥시크는 전체 오픈소스 AI 모델 사용량의 99%를 차지했으나, 지난달에는 80% 수준으로 급락했다. 불과 반년 만에 점유율이 20% 포인트(p) 가까이 떨어진 것이다. 

28일 홍콩 사우스차이나모닝포스트(SCMP)에 따르면, 클라우드 플랫폼 PPIO는 “5월 이후 우수한 오픈소스 모델들이 대거 등장해 사용자 선택권이 확대되면서 딥시크의 독점적 지위가 약화됐다”라고 전했다. 특히 알리바바가 자체 개발한 AI 모델 ‘큔(Qwen)’은 5월 말 기준 딥시크를 제치고 PPIO 내에서 최대 56%의 점유율을 기록했다. 또한 알리바바가 후원하는 스타트업 문샷 AI가 개발한 ‘키미-K2-인스트럭트(Kimi-K2-Instruct)’ 모델도 7월부터 PPIO에 추가됐다. 키미 K2는 사용 편의성과 학습 효율성을 무기로 빠르게 확산되며 글로벌 커뮤니티에서도 급속히 채택되고 있다.

19일 신화통신에 따르면, 국제학술지 네이처(Nature)는 최근 키미 K2의 성능을 두고 “딥시크급 충격”이라고 평가했다. 서방권 유료 AI 모델과 대등하거나 그 이상의 성능을 보였으며, 특히 코딩과 작문 분야에서 두각을 나타냈다는 것이다. 키미 K2는 프로그래밍 성능을 평가하는 다양한 지표에서 GPT-4나 R1 최신 버전을 뛰어넘는 정확도를 기록했다. 이는 딥시크가 겪었던 답변 오류, 응답 지연, 불안정한 서비스 운영 등 품질 문제를 크게 보완한 것으로, SWE-벤치(SWE-bench) 정답률은 약 66%, 라이브코드벤치(LiveCodeBench) 정답률은 54%에 달했다. 이는 공개된 모델 중 최고 수준이며, 수학 문제 풀이를 평가하는 매쓰-500(MATH-500)에서도 97.4%의 높은 정확도를 보였다. 

네이처는 키미 K2가 코딩 분야에서 특히 높은 점수를 받았으며, 작문의 독창성과 진정성을 평가하는 ‘크리에이티브 라이팅 vs 벤치마크(Creative Writing vs Benchmark)’ 항목에서는 AI 모델 중 1위를 기록했다고 전했다. 문샷 AI에 따르면, 키미 K2는 총 1조 개의 파라미터(매개변수)를 보유하고 있으며 이 중 약 320억 개만을 한 번에 활성화하는 전문가 혼합(MoE) 아키텍처를 기반으로 한다. 또한 딥티크처럼 누구나 자유롭게 다운로드하고 수정·배포할 수 있는 ‘오픈 웨이트(Open-Weight) 모델’이라는 점도 주목받았다.

네이처는 딥시크 출시 6개월 만에 또다시 고성능 AI 모델이 중국에서 등장한 것은 중국의 AI 혁신이 일시적 성과에 그치지 않고 지속적인 발전 궤도에 있음을 보여준다고 평가했다. 키미 K2 개발사인 문샷 AI는 2023년 3월에 설립된 세계적으로 비교적 덜 알려진 기업이지만, 시장조사업체 카운터포인트에 따르면 키미 초기 모델은 지난해 11월 기준 중국에서 세 번째로 널리 사용되는 챗봇이었다. 특히 20만 자 이상의 장문 입력 처리가 가능한 모델을 최초로 선보이며 기술적 도약을 알렸고, 중국 AI 기술이 단순 반짝 성과가 아닌 지속 가능한 ‘기술 파이프라인’을 갖추었다는 평가를 받았다. 

막스플랑크 광학연구소의 마리오 크렌 박사는 네이처와의 인터뷰에서 “중국에서 또 다른 대형 모델이 몇 달 안에 나와도 놀랍지 않다”며 “이제는 놀라움보다 전략적 대응이 필요한 시점”이라고 말했다.

Leave a Reply

Back To Top
error: Content is protected !!