• 최종편집 2026-01-20 (화)
 

114.png

 

 

[시큐리티팩트=김상규 기자] 카카오와 SK텔레콤이 같은 날 인공지능(AI) 모델을 공개하며 소버린 AI 경쟁에 속도를 내고 있다.


카카오는 지난 24일 허깅페이스를 통해 ▲이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 ‘Kanana-1.5-v-3b’와 ▲MoE(Mixture of Experts) 언어모델 ‘Kanana-1.5-15.7b-a3b’를 오픈소스로 공개했다. 지난 5월 공개한 언어모델 Kanana-1.5 4종에 이어 두 달 만에 추가 모델을 오픈소스로 공개하며, 독자적 모델 설계 기반의 기술 경쟁력을 증명했다. 


‘Kanana-1.5-v-3b’는 텍스트뿐만 아니라 이미지 정보도 처리할 수 있는 멀티모달 언어모델이다. 지난 5월 말 오픈소스로 공개한 Kanana 1.5 모델을 기반으로 하고 있다. Kanana 1.5는 모델 개발의 처음부터 마지막 단계까지 카카오의 자체 기술을 바탕으로 구축하는 ‘프롬 스크래치(From Scratch)’ 방식으로 개발됐다. 


‘Kanana-1.5-v-3b’는 이용자의 질문 의도를 정확히 이해하는 높은 지시 이행(instruction following) 성능과 뛰어난 한국어·영어 이미지 이해 능력을 보유한 것이 특징이다. 경량 모델임에도 이미지로 표현된 한국어와 영어 문서 이해 능력이 글로벌 멀티모달 언어모델 GPT-4o와 견줄 수 있을 정도로 뛰어나다. 


또한, 한국어 벤치마크에서 유사 사이즈의 국내외 공개 모델과 비교한 결과 최고 점수를 기록했고, 다양한 영어 벤치마크에서 해외 오픈소스 공개모델과 비교했을 때도 유사한 수준의 성능을 보였다고 카카오는 밝혔다. 지시 이행 능력 벤치마크에서는 국내 공개된 유사한 규모의 멀티모달 언어모델 대비 128% 수준의 성능을 기록했다고 덧붙였다. 


카카오는 이 날 일반적인 ‘밀집(Dense)’ 모델과 차별화되는 MoE(Mixture of Experts) 구조의 언어모델을 오픈소스로 함께 공개했다. ‘MoE’는 입력 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 모델과 달리, 특정 작업에 최적화된 일부 전문가 모델만 활성화되는 방식으로 효율적인 컴퓨팅 자원 활용과 비용 절감이 강점이다. 이러한 장점 덕에 글로벌 시장에서는 AI 모델 개발 트렌드로 자리잡고 있다.


MoE 아키텍처를 적용한 ‘Kanana-1.5-15.7b-a3b’는 전체 15.7B의 파라미터 중 추론 시 약 3B 파라미터만 활성화되어 동작한다. 활성화되는 파라미터가 3B에 불과하지만 성능은 ‘Kanana-1.5-8B’와 동등하거나 상회하는 수준을 기록했다고 카카오는 말했다.

 

카카오는 자사의 MoE 모델이 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 실용적인 도움을 제공할 수 있다고 설명했다. 카카오는 지난해 자체 개발 AI 모델 ‘카나나(Kanana)’의 라인업을 공개한 이래 다양한 모델들의 성능과 개발기를 공개해왔다. 카나나 언어모델 4종을 5월 오픈소스로 공개한 바 있다.


SK텔레콤 또한 24일 허깅페이스(Hugging Face)에 독자 구축 거대언어모델(LLM)인 ‘A.X(에이닷 엑스) 3.1’을 공개했다. 340억 개(34B)의 매개변수를 기반으로 하는 ‘A.X 3.1’은 SKT가 프롬 스크래치(From Scratch) 방식으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했다.


이번에 공개한 A.X 3.1은 A.X 3.0의 대폭 개선된 버전이다. 한국어 대화 성능에 집중했던 A.X 3.0과는 달리 A.X 3.1에서는 추론모델로의 확장 가능성을 고려해 코드와 수학성능을 대폭 향상시켰다고 SKT는 설명했다. 이번 공개로 SKT는 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)과 대규모 학습(CPT, Continual Pre-Training)에 기반한 A.X 4.0 모델 2종(표준, 경량)까지 총 4개의 모델을 오픈소스로 발표했다. 


A.X 3.1(34B)은 자사 A.X 4.0(72B)와 비교할 때 절반 이하의 매개변수로 구성되었지만 같은 한국어 서비스에 적용될 경우 약 90% 수준의 성능을 발휘한다. 사용자들은 A.X 3.1과 4.0 중에서 사용 환경에 더 적합한 성능과 효율을 고려해 선택할 수 있다.


대표적인 한국어 능력 평가 벤치마크인 KMMLU(한국어 대규모 다중과제 언어 이해 평가)에서 ‘A.X 3.1’(69.20)는 ‘A.X 4.0’(78.3) 대비 88% 수준을 확인했고, 한국어 및 한국 문화 벤치마크인 CLIcK에서는 ‘A.X 3.1’(77.1)가 ‘A.X 4.0’(85.7) 대비 90% 수준의 성능을 기록했다.


이들 기업에 앞서 KT도 지난 3일 ‘한국적 AI’의 철학을 담아 자체 개발한 언어모델(LLM) ‘믿:음 2.0’의 오픈소스를 허깅페이스를 통해 공개했다. KT는 지난 2023년 믿:음 1.0 버전의 Standard, Premium 2종을 출시한 이래 KT AICC(AI 고객센터), 지니TV, AI 전화, 100번 고객센터 등 다양한 서비스에 폭넓게 활용해 왔다.


이번에 KT가 한국적 AI라는 철학을 담아 새롭게 선보이는 믿:음 모델은 △115억 파라미터 규모의 ‘믿:음 2.0 Base’ △23억 파라미터 규모의 ‘믿:음 2.0 Mini’ 2종으로 모두 한국어와 영어를 지원한다. 믿:음 2.0 Base는 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반의 질의 응답에서 강력한 성능을 나타낸다. 


믿:음 2.0 Mini는 Base 모델에서 증류한 지식을 학습한 소형 모델이다. 110억 파라미터 이상의 한국어 범용 LLM을 누구나 상업적으로 활용할 수 있는 오픈소스로 공개한 것은 KT가 처음이다. 이 모델은 KT와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표인 ‘Ko-Sovereign(코-소버린)’ 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다. 


특히 KT는 믿:음 2.0은 AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용해 보다 안전하고 투명한 기술을 구현하는 데 힘썼다. 또 믿:음 개발 단계에서 리벨리온과 긴밀히 협력하며 국산 AI 반도체에서의 동작을 최적화했고, 프렌들리AI와 함께 사용자가 별도의 설치 과정 없이도 허깅페이스를 통해 무료로 편리하게 체험해볼 수 있는 환경도 한시적으로 제공한다.


KT는 믿:음 2.0을 공개하며 본격적으로 국내 AI 생태계에 ‘한국적 AI’ 확산 선도에 나선다. 마이크로소프트와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델 또한 순차 공개할 예정이다.


신동훈 KT Gen AI Lab장(CAIO, 상무)은 “믿:음 2.0은 일반적인 생성 능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며, “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다.


AI 등 새로운 기술을 강조하는 구광모 LG 회장이 이끄는 LG 역시 지난달 15일 국내 첫 하이브리드 AI 모델 ‘엑사원(EXAONE) 4.0’을 허깅 페이스에 오픈 웨이트 모델로 공개했다. ‘엑사원 4.0’은 자연어 이해와 생성, 지식 기반의 빠른 답변에 강점이 있는 LLM과 스스로 가설을 세우고 검증할 수 있는 문제 해결 능력을 갖춘 추론 AI 모델을 하나로 결합한 모델이다.

 

현재 전 세계적으로 하이브리드 AI를 공개한 곳은 미국의 클로드(Claude) 개발사인 앤스로픽(Anthropic)과 중국의 큐원(Qwen) 개발사인 알리바바(Alibaba) 정도이며, 오픈AI도 GPT-5를 통합 모델인 하이브리드 AI로 개발 중이라고 밝힌 바 있다.

 

LG AI연구원은 지난 3월 국내 첫 추론 AI 모델인 ‘엑사원 딥(EXAONE Deep)’에 이어 4개월여 만에 국내 첫 하이브리드 AI 모델인 ‘엑사원 4.0’까지 공개하며 글로벌 AI 시장에서 경쟁력을 높여가고 있다.

 

‘엑사원 4.0’은 AI 모델의 성능을 평가하는 벤치마크 비교에서 MMLU-Redux/MMLU-Pro(AI의 지식수준과 문제 해결 능력 평가) 92.3점/81.8점, LiveCodeBench v6(코딩 능력 평가) 66.7점, GPQA-Diamond(과학 문제 해결 능력 평가) 75.4점, AIME 2025(수학 문제 해결 능력 평가) 85.3점을 기록하며 미국과 중국, 프랑스의 대표 오픈 웨이트 모델을 제치고 세계 최고 수준임을 입증했다고 LG측은 강조했다. 


LG AI연구원은 ‘엑사원 4.0’이 전문 지식이 필요한 분야에서 높은 수준의 답변이 가능해 고객에게 꼭 필요하고, 기대를 뛰어넘는 가치를 제공해 줄 것으로 기대하고 있다. 특히 온디바이스 모델은 외부 서버와의 연결 없이 전자 기기 내에서 빠르고 안전하게 정보를 처리할 수 있어 개인정보 보호와 보안성 측면에서 강점이 있다.

 

이 모델은 지난해 12월 공개한 엑사원 3.5 2.4B 모델 대비 크기는 절반으로 줄어 가볍고 경제적이면서도 수학, 코딩, 과학 분야 등 전문 분야 평가 지표에서 미국 오픈AI의 GPT-4o mini보다 높은 성능을 보였으며, 유사한 규모의 AI 모델 중 세계 최고 수준의 성능을 보였다고 회사측은 강조했다.

 

한편 LG AI연구원은 AI 기술 대중화를 위해 허깅 페이스의 공식 AI 모델 배포 파트너사인 프렌들리AI와 손잡고 ‘엑사원 4.0’ 상용 API 서비스를 시작했다. 양사는 개인 개발자부터 기업에 이르기까지 누구나 고성능 그래픽처리장치(GPU) 없이도 엑사원을 손쉽게 활용하거나 서비스에 연동할 수 있도록 했다.

 

기업들이 각개 약진하는 가운데 정부 역시 AI 선도국가가 되기 위한 마중물 역할에 나섰다. 전 세계적으로 단일 기업을 넘어 범국가적 인공지능 패권 경쟁이 격화되는 가운데, 세계적인 경쟁력을 갖춘 독자 범용 인공지능 모형(AI 파운데이션 모델) 확보의 중요성이 지속 고조되고 있다.


세계적 수준의 AI 파운데이션 모델이 국내에 공개 소프트웨어(오픈소스)로 확산될 경우 다양한 인공지능 서비스 출시와 경제사회 전반의 인공지능 전환이 가속화되며, 인공지능 기술 발전으로 인한 사회적 편익이 확산되는 기반으로 작용할 전망이다. 이러한 관점에서 과학기술정보통신부는 세계적인 파급력 있는 AI 파운데이션 모델 확보를 목표로 민관 협력 기반의 ‘독자 인공지능 기초 모형(AI 파운데이션 모델)’ 사업 참가 기업을 공모했다.


과기정통부는 22일 총 15개의 정예팀이 이번 사업에 참여했다고 밝혔다. 15개 참가팀은 △네이버클라우드 △루닛 △모티프테크놀로지스 △바이오넥서스 △사이오닉에이아이 △업스테이지 △SK텔레콤 △NC AI △LG AI연구원 △정션메드 △카카오 △KT △코난테크놀로지 △파이온코퍼레이션 △한국과학기술원(KAIST)이다. 


정부는 참가 기업들을 대상으로 제출서류의 적합성 검토, 서면평가(15→10팀 압축), 발표평가(10→5팀 압축), 사업비 심의·조정 등의 절차를 거쳐 정예팀 최종 선정 및 협약 체결 등을 8월 초(목표)까지 진행할 계획이다. 정예팀의 경우 우선 5개 팀을 선발해 단계평가를 통해 최종 정예팀을 압축할 계획이다. 정부는 정예팀을 대상으로 AI 파운데이션 모델 개발에 필요한 그래픽 처리 장치(GPU), 데이터, 인재를 종합 지원한다.


그래픽 처리 장치의 경우 올해부터 내년 상반기까지 민간이 보유한 그래픽 처리 장치를 임차하여 지원하고(1576억 원 규모), 그 이후는 정부 구매분(1만장)을 활용하여 지원함으로써, 팀당 그래픽 처리 장치 500장 등부터 시작하여 단계평가를 거쳐 1000장 이상 규모의 그래픽 처리 장치를 지원할 예정이다.


데이터의 경우 모든 정예팀들의 저작물 데이터 공동구매와 함께 개별 정예팀의 데이터 구축·가공을 지원한다. 팀당 데이터 공동구매는 연간 100억 원, 데이터 구축·가공은 연간 30~50억 원(연도별 정예팀 압축에 따라 상이) 규모로 지원할 계획이다.


인재분야에 있어서도 정예팀이 해외 우수 연구자(팀, 재외한인 가능)를 주도적으로 유치할 경우 인건비, 연구비 등 필요 비용을 정부가 연간 20억 원 규모로 지원한다. 특히 인재 지원은 인재 확보의 연속성 차원에서 정예팀 압축과 관계없이 2027년까지 지속 지원할 방침이다.


송상훈 과기정통부 정보통신정책실장은 “이번 사업은 단순한 독자 인공지능 기초 모형(AI 파운데이션 모델) 개발을 넘어 인공지능 시대 대한민국의 기술주권 확보, 모두의 성장을 도모하는 생태계 구축이 목표”라고 강조하며, “이를 통해 국내 최고 수준의 인공지능 정예팀들이 도전하여 세계적 수준의 독자 인공지능 기초 모형(AI 파운데이션 모델)을 확보, 확산함으로써, 대한민국이 인공지능 강국으로 도약하는 ‘모두의 인공지능’ 출발점이 되기를 기대한다”고 밝혔다.

 


태그

전체댓글 0

  • 40570
비밀번호 :
메일보내기닫기
기사제목
SKT∙카카오, AI 모델 동시 공개…소버린AI 주도 경쟁 치열
보내는 분 이메일
받는 분 이메일