T STORY

한국형 LLM
빌드업 연대기

2025.09.04

“우리나라 AI는 지금 어디까지 와 있을까?”
글로벌 빅테크 기업들이 천문학적인 자본을 투입하며 AI 기술 패권 경쟁을 벌이고 있는 지금, SK텔레콤의 AI 모델 ‘A.X(에이닷엑스)’가 바로 그 질문의 대답이 될 것 같습니다. 오래전부터 시작된 연구개발과 전략적 투자가 축적된 결과물이자, AI 기술 독립과 AI 주권(Sovereign AI)이라는 확고한 목표 아래 쌓아 올린 기술의 결정체이기 때문입니다. 그 시작은 2019년으로 거슬러 올라갑니다.

2019년
한국어 AI의 초석을 다지다

2019년 KoBERT  구글 BERT를 기반으로 SK텔레콤이 자체 개발하여 공개한 국내 최초의 한국어 딥러닝 언어 모델.

2019년 당시 자연어 처리(NLP) 분야에서는 구글의 BERT가 혁신을 주도하고 있었습니다. 하지만 영어 데이터 기반인 만큼 한국어의 문법적 특성과 구조를 제대로 반영하긴 어려웠습니다. 한국어는 조사와 어미가 풍부한 교착어*이고, 띄어쓰기나 어순이 비교적 자유롭기 때문에 기존 영어 모델을 그대로 쓰기엔 구조적 한계가 있었습니다.

*교착어: 어근에 조사가 붙어서 단어의 기능과 의미를 결정하는 언어

SK텔레콤은 이를 해결하기 위해 한국어의 구조적 특성을 깊이 반영한 KoBERT를 개발해 공개했습니다. KoBERT는 대규모 한국어 데이터를 기반으로 사전 학습(Pre-training)을 진행한 모델인데요. 문맥을 양방향으로 이해하고 단어의 미묘한 의미를 정교하게 파악하는 능력을 갖췄습니다. KoBERT는 SK텔레콤이 자체 언어 모델을 직접 개발한 첫 사례이자, 이후 한국어 특화 AI 기술 개발의 출발점이 되었습니다.

2020년
생성형 모델로의 도약

2020년 KoGPT2, KoBART  - KoGPT2: 국내 최초의 한국어 GPT-2 모델로, 자연스러운 문장 생성 능력이 강점.  - KoBART: 문서 요약에 특화된 모델로, 실사용 가능성을 증명.

2020년, SK텔레콤은 언어 ‘이해’를 넘어 언어를 ‘생성’하는 단계로 기술력을 한 단계 끌어올렸습니다. 4월, OpenAI의 GPT-2 모델을 국내 최초로 한국어에 맞게 구현한 KoGPT2를 공개했습니다. 문맥을 바탕으로 자연스러운 다음 문장을 생성하는 능력을 갖춘 모델로, 한국어 기반 생성형 AI의 본격적인 시작을 알리는 신호탄이었습니다.

10월에는 문서 요약에 특화된 KoBART를 선보였습니다. KoBART는 페이스북(현 메타)의 BART 모델을 기반으로, 문장의 의미를 압축하고 핵심 내용을 추출하는 능력을 고도화한 모델입니다. 두 모델 모두 오픈소스로 공개되어 국내 개발자와 연구자들이 자유롭게 활용할 수 있도록 했고, 이는 AI 생태계의 단단한 기반이 되었습니다.

2022년
‘에이닷’ 서비스와 A.X의 탄생

2022년 A.X1  SKT의 AI 비서 서비스 '에이닷'에 탑재되어 사용자와 정서적 교감에 특화된 AI.

SK텔레콤은 그동안 축적해 온 AI 기술력을 바탕으로 한국어 LLM 서비스 ‘에이닷’을 출시했습니다. 에이닷에는 GPT-3 구조를 기반으로 한 한국어 특화 LLM이 처음으로 적용되었는데요. 사용자의 요청에 따라 일상 대화는 물론 다양한 과업 수행까지 가능한 형태로 구현됐습니다.

하반기에는 감성 대화에 특화된 모델인 ‘A.X 1’이 추가로 탑재되며, 대화형 AI의 정서적 교감 능력이 한층 강화됐습니다. A.X 1은 단순한 정보 제공을 넘어, 감정을 이해하고 공감하며 친구처럼 자연스러운 대화를 나누는 것을 목표로 설계되었죠.

2023년
지식 기반 대화로의 진화

2023년 A.X2  기존의 감성 대화 능력에 더해, 방대한 지식을 기반으로 한 정보 제공 및 질의응답 기능을 강화한 모델.

2023년 7월, SK텔레콤은 감성 대화에 특화됐던 기존 모델을 한층 더 발전시킨 ‘A.X 2’를 출시했습니다. 이 모델은 단순히 정서를 읽고 공감하는 데 그치지 않고, 복잡한 문맥을 이해하고 방대한 지식을 기반으로 정보를 제공할 수 있는 ‘지식 기반 대화(Knowledge-based Conversation)’ 모델로 설계되었습니다. 사용자 질문에 정확하고 신뢰도 높은 정보를 응답하는 ‘똑똑한 AI 비서’로서의 면모를 갖춘 것입니다.

A.X 2는 표준형과 경량형 모델로 구성되어, 다양한 환경에서도 유연하게 활용될 수 있도록 최적화되었는데요. 덕분에 대화 흐름을 깊이 있게 파악하고 응답 정확도를 대폭 높일 수 있었습니다.

2024년
일상 속으로 들어온 AI

2024년 A.X 3.0  추론 속도와 성능을 개선하고 모바일 환경에 최적화된 모델.

2024년은 SK텔레콤의 AI 기술이 본격적으로 일상 속 서비스로 스며들기 시작한 해입니다. 이때 선보인 ‘A.X 3.0’은 340억(34B) 파라미터의 표준형과 70억(7B) 파라미터의 경량형으로 구성되어, 다양한 디바이스 환경에서도 유연하게 적용할 수 있도록 설계되었는데요. 특히 새로운 아키텍처 도입을 통해 추론 속도와 전반적인 성능이 크게 향상되었고, 대화의 맥락을 더 정교하게 분석하고 논리적으로 재구성하는 능력이 고도화되었죠.

가장 대표적인 상용화 사례는 ‘에이닷 전화’에 적용된 통화 요약 기능입니다. 사용자가 전화를 마친 후, A.X 3.0이 통화 내용을 자동 분석해 핵심 내용을 요약해 주고, 중요한 일정이나 할 일을 정리해 주는 기능입니다. 이어 8월에는 A.X 3.0이 AI 에이전트 기능에도 적용되며 상용 서비스 전반으로 확산되었고, 보다 개인화되고 실용적인 AI 경험을 고객에게 제공하기 시작했습니다.

2025년
‘투 트랙’ 전략의 본격화

2025년은 SK텔레콤이 지난 6년간 축적해온 LLM 기술력을 바탕으로, AI 주권을 향한 비전을 명확히 드러낸 전환점이 되었습니다. 이는 ‘투 트랙(Two-Track)’이라는 명확한 전략 아래 체계적으로 준비된 결과물이었습니다.

2025년 SKT 투 트랙 전략  - A.X 3.x 시리즈: 순수 자체 기술로 설계한 ‘프롬 스크래치(From Scratch)’ 모델  - A.X 4.x 시리즈: 오픈소스 기반에 한국어 데이터를 추가 학습한 CPT(Continual Pre-training) 모델

이 전략은 기술 자립성과 서비스 성능 확보를 동시에 고려한 방식입니다. 특히 2025년 7월 공개된 A.X 4.0은 외부 지식 기반 추론 능력이 강화된 CPT 모델로, 한국어 처리 효율, 데이터 보안, 로컬 운영 측면에서 높은 활용성을 보여주고 있습니다. 해당 모델은 에이닷의 통화 요약 기능 등 실제 서비스에 적용되어 응답 신뢰도를 높였습니다.

같은 시기 공개된 A.X 3.1 모델은 70억(7B) 및 340억(34B) 파라미터 규모로, SKT가 직접 프롬 스크래치 방식으로 개발한 결과물입니다. 특히 코드와 수학 연산 성능이 대폭 강화되었는데요. 고도화된 추론형 AI로의 확장 가능성을 염두에 둔 설계입니다.

➡️ To Be Continued

2019년 KoBERT에서 시작해 2025년 A.X 3.x와 4.x 시리즈에 이르기까지, SK텔레콤의 지난 7년은 ‘AI 기술은 쌓아 올리는 것’이라는 사실을 보여준 시간입니다. 한국어에 대한 깊은 이해를 바탕으로 한 원천 기술 확보, ‘From Scratch’ 방식의 독자 모델 개발, 그리고 CPT 기반의 성능 최적화 전략은 기술 독립성과 시장 경쟁력을 함께 추구한 SK텔레콤만의 해법이었습니다.

이제 SK텔레콤은 텍스트를 넘어 이미지, 음성, 영상까지 아우르는 옴니모달 AI로, 그리고 국내를 넘어 글로벌 시장으로 나아갑니다. 국가대표 AI 기업으로서, ‘AI 주권’과 ‘AI 강국’의 미래를 만들어가고 있습니다.

“꾸준히 쌓아 온 한국형 LLM 개발 역량을 바탕으로 AI 생태계 자립성을 높이고, 국가 AI 경쟁력 제고에 기여하도록 노력할 것입니다.”

김태윤 SK텔레콤 파운데이션 모델 담당