• 최종편집 2026-03-06 (금)
 


294-1.png

 

 

[시큐리티팩트=김상규 기자] 과학기술정보통신부가 추진하는 국가대표 AI사업인 ‘독자 AI 파운데이션 모델' 참가 10개 정예팀이 정해진 가운데, 30일부터 이틀간 최종 발표 평가를 통해 5개 정예팀이 선발된다.


10개 정예팀에는 국내 통신업계를 대표하는 SK텔레콤과 KT가 선정됐다. 이런 가운데 SKT가 29일 자사의 초거대언어모델(LLM)인 A.X(에이닷 엑스)를 기반으로 한 시각-언어모델(VLM1))과 LLM 학습을 위한 범용 문서 해석 기술을 선보였다.


SKT가 이날 ‘A.X Encoder(인코더)’와 ‘A.X 4.0 VL Light(비전 랭귀지 라이트)’ 2종을 오픈소스 커뮤니티 허깅 페이스(Hugging Face)에 공개했다. SKT는 7월 한 달 동안 대규모 학습(CPT)에 기반한 A.X 4.0 모델 2종(표준, 경량)에 이어 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)을 순차적으로 선보였다. 


이번에 LLM을 산업 영역에 보다 폭넓게 활용하기 위한 기술 2종을 추가하면서 총 6개의 모델을 발표했다. SKT는 A.X 모델에 필요한 데이터의 전 과정 처리 프로세스에 적용하기 위해 ‘A.X 인코더’를 개발했다고 밝혔다.


‘A.X인코더’는 긴 문서도 빠르고 효율적으로 처리 가능해 대규모 LLM 학습에 적합하다. 1억4천9백만개의 매개변수를 바탕으로 작동한다. 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다는 게 회사 측 주장이다. 이는 기존 글로벌 오픈소스 모델을 기반으로 한국어 자연어 벤치마크(KLUE)팀에서 공개한 ‘RoBerTa-base’의 성능지표(80.19점)를 상회하는 수준이다.


특히 ‘A.X 인코더’는 1만6384개의 토큰까지 처리가 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있다. 통상적으로 기존 모델들이 512개의 토큰을 처리해 보통 문장 혹은 문단 정도의 처리가 가능했다면 그보다 월등히 큰 문맥을 빠르고 효율적으로 처리한다.


이러한 대규모, 고속 문서 처리 기술은 LLM 학습 외에도 AI 기반의 다양한 문서 처리에 효율적으로 적용할 수 있을 것으로 SKT는 기대한다. 함께 공개한 ‘A.X 4.0 VL Light’는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)이다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라, 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 탁월한 성능을 제공한다.


70억개) 매개변수의 A.X 4.0 Light 모델을 기반으로 개발되어 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 강력한 성능을 자랑한다고 SKT는 설명했다. 한국어 시각 벤치마크에서 평균 79.4점을 기록해 Qwen2.5-VL32B(73.4점)보다 훨씬 작은 모델 크기에도 불구하고 더 우수한 성능을 보였다고 덧붙였다. 


이에 앞서 SKT는 지난 24일 독자 구축 LLM인 ‘A.X(에이닷 엑스) 3.1’을 공개했다. 340억개의 매개변수를 기반으로 하는 ‘A.X 3.1’은 SKT가 프롬 스크래치(From Scratch)1) 방식으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했다.


이번에 공개한 A.X 3.1은 A.X 3.0의 대폭 개선된 버전이다. 한국어 대화 성능에 집중했던 A.X 3.0과는 달리 A.X 3.1에서는 추론모델로의 확장 가능성을 고려해 코드와 수학성능을 대폭 향상시켰다.


A.X 3.1 모델은 대표적인 한국어 능력 평가 벤치마크인 한국어 대규모 다중과제 언어 이해 평가(KMMLU)에서 ‘A.X 4.0’(78.3) 대비 88% 수준을 확인했고, 한국어 및 한국 문화 벤치마크인 CLIcK에서는 ‘A.X 4.0’(85.7) 대비 90% 수준의 성능을 기록했다.


한편 SKT는 이날 그 동안 확보한 우수한 LLM 기술 역량을 바탕으로 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에 지원했다. SKT 컨소시엄은 반도체, 모델, 데이터, 서비스로 이어지는 독자 기술 기반의 풀스택 AI를 구현하고, 개발하는 모델을 국내 AI 생태계의 다양한 기업들에 오픈소스로 개방하는 것을 목표로 하고 있다.


컨소시엄에는 국내 최대 게임 상장사 크래프톤을 비롯, 모빌리티 AI 부분의 강자 포티투닷, 국내 최고 수준의 추론형 AI반도체(NPU) 제작사인 리벨리온, 전문 지식·정보 검색에 특화된 AI 에이전트인 라이너, AI 모델의 데이터 안정성을 확보하는 기술을 갖춘 셀렉트스타 등 다양한 분야를 아우르는 회사들과 함께 학계를 대표하는 서울대학교 연구실들과 KAIST 연구진 등이 참여한다.


또한, SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사들은 SKT 컨소시엄이 만들어낼 AI모델을 사용하기로 의향서를 냈다. 이 밖에 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등이 포함됐다. 


SKT 컨소시엄은 자체 개발 LLM인 A.X와 각 참여사가 보유한 자체 LLM 및 데이터 등을 기반으로 하여 대한민국을 대표하는 독자 파운데이션 신규 모델을 만들어간다는 전략이다..


김태윤 SK텔레콤 파운데이션 모델 담당은 “각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것”이라며, “국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획”이라고 밝혔다.


SKT의 움직임에 KT 역시 가만히 있지 않는다. KT는 29일 자체 개발한 '믿:음 2.0'이 인공지능(AI) 안전성에 대한 글로벌 벤치마크 다크벤치의 한국어 특화 버전 '코다크벤치(KoDarkBench)' 평가에서 1위를 달성했다며 맞불을 놨다.


다크벤치는 오픈 AI와 앤트로픽의 AI 안전평가 관련 협업 기관 연구원들이 개발한 벤치마크다. 세계 최고 권위의 AI 학술대회 ICLR 2025에서도 발표되며 국제적으로 공신력을 인정받고 있다.


이 벤치마크는 언어 모델에 내재된 조작적 설계 패턴을 탐지하기 위해 고안됐다. 위험한 답변, 브랜드 편향, 의인화, 사용자 유지, 아첨·아부·알랑거림, 몰래 하기 등 6개 항목으로 AI 모델의 안전성을 평가한다.


코다크벤치는 이 같은 다크벤치의 문항을 한국 문화와 사회적 맥락에 맞게 번역하고 수정해 구성한 평가 지표다. 한국적 감성과 윤리, 정밀 판단 능력 등을 동반 평가한다.


코다크벤치의 평가 점수는 낮을수록 더 안전한 응답을 생성한다는 것을 의미한다. 믿:음 2.0 베이스는 유해 표현 생성 가능성을 진단하는 위험한 답변 항목에서 0.06, 사용자 편향성을 진단하는 아첨·아부·알랑거림 항목에서 0.18로 종합 점수 0.37(6개 항목의 평균값)을 받았다.


KT는 특히 믿:음 2.0 베이스가 폭력·차별·불법·허위 정보 등 사회에 해악을 끼치는 실질적 위험 요소인 유해 콘텐츠 생성 가능성에 대한 평가에서 상당 수의 모델 대비 10배 가까이 위험 지수가 낮았다고 강조했다. 믿:음 2.0이 공격적이거나 편향된 발언을 생성할 확률이 매우 낮다는 설명이다.


‘믿:음 2.0’은 KT가 ‘한국적 AI’의 철학을 담아 자체 개발한 초거대언어모델(LLM)이다. KT는 이달 초 이 모델을 허킹 페이스를 통해 오픈소스로 공개했다. KT의 믿:음은 사전 학습부터 자체적으로 만든 한국적 독자 AI 모델로서 고품질 한국어 데이터를 준비하는 과정에서 모든 저작권을 확보하여 신뢰성을 높였다.


2023년 믿:음 1.0 버전의 Standard, Premium 2종을 출시한 이래 KT AICC(AI 고객센터), 지니TV, AI 전화, 100번 고객센터 등 다양한 서비스에 폭넓게 활용해 왔다. ‘믿:음 2.0’ 모델은 115억 파라미터 규모의 ‘믿:음 2.0 Base’와 23억 파라미터 규모의 ‘믿:음 2.0 Mini’ 2종으로 모두 한국어와 영어를 지원한다. 


믿:음 2.0 Base는 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반의 질의 응답에서 강력한 성능을 나타낸다. 믿:음 2.0 Mini는 Base 모델에서 증류한 지식을 학습한 소형 모델이다. 110억 파라미터 이상의 한국어 범용 LLM을 누구나 상업적으로 활용할 수 있는 오픈소스로 공개한 것은 KT가 처음으로 국내 AI 생태계 활성화에 긍정적인 역할을 할 수 있을 것으로 기대된다.


KT는 믿:음 2.0은 AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용해 보다 안전하고 투명한 기술을 구현하는 데 힘썼다고 강조했다.


또 믿:음 개발 단계에서 리벨리온과 긴밀히 협력하며 국산 AI 반도체에서의 동작을 최적화했고, 프렌들리AI와 함께 사용자가 별도의 설치 과정 없이도 허깅페이스를 통해 무료로 편리하게 체험해볼 수 있는 환경도 한시적으로 제공한다고 덧붙였다.

 

KT는 믿:음 2.0을 공개하며 본격적으로 국내 AI 생태계에 ‘한국적 AI’ 확산 선도에 나선다. 마이크로소프트와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델 또한 순차 공개할 예정이다.


앞서 KT는 자체 개발한 모델 ‘믿:음’, 글로벌 기업들의 SOTA(State of the Art, 현존 최고 수준 모델) 등을 두루 활용하여 한국의 특수성을 반영한 AI 모델에 집중 투자하고 국내 사용 환경에 특화한 AI의 대중화에 앞장서겠다고 밝혀온 바 있다. 국내 공공 및 민간 여러 분야에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여한다는 복안이다.


신동훈 KT Gen AI Lab장(CAIO, 상무)은 “믿:음 2.0은 일반적인 생성 능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며, “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다.

 

 

태그

BEST 뉴스

전체댓글 0

  • 35006
비밀번호 :
메일보내기닫기
기사제목
[국대AI 대회] 통신업계 SKT vs KT, 승자는?
보내는 분 이메일
받는 분 이메일