실시간 뉴스



김건희 서울대 교수 "SKT A.X K1, 韓 소버린 AI 미래 선도"


"옴니모달 모델로의 진화, '모두의 AI' 실현 핵심 기반될 것"

[아이뉴스24 안세준 기자] "옴니모달 모델로의 성공적인 진화를 바탕으로 A.X K1(에이뎃엑스 케이원)이 선도할 대한민국 소버린 AI의 미래를 기대한다."

김건희 서울대학교 공과대학 컴퓨터공학부·첨단융합학부 교수. [사진=SKT]
김건희 서울대학교 공과대학 컴퓨터공학부·첨단융합학부 교수. [사진=SKT]

22일 김건희 서울대학교 공과대학 컴퓨터공학부·첨단융합학부 교수는 SK텔레콤 뉴스룸 기고를 통해 이같은 견해를 밝혔다. SK텔레콤 독자 AI 파운데이션 모델인 A.X K1의 기술적 진화 방향과 향후 활용 가능성을 짚은 것이다. 김 교수 연구팀은 SK텔레콤 정예팀과 함께 멀티모달 연구를 지속하고 있다.

SK텔레콤 컨소시엄은 지난 15일 정부의 독자 AI 파운데이션 모델 프로젝트 1차 평가를 통과하며 2단계 진출에 성공했다. 정예팀은 지난해 12월 매개변수 5000억 개 규모의 초거대 AI 모델 A.X K1을 공개한 바 있다. 이 모델은 추론 성능과 다국어 이해 능력에서 경쟁력을 인정받았다.

김 교수는 "A.X K1은 옴니모달 모델로의 진화를 계속해 나갈 계획"이라며 "이는 SK텔레콤 컨소시엄이 추구하는 '모두의 AI' 서비스 실현에 있어 핵심적인 기반이 될 것"이라고 말했다. 1000만명 이상 가입자를 보유한 에이닷(A.) 서비스 등에 이 모델을 적용할 경우 실시간 음성 대화까지 지원할 수 있다는 설명이다.

게임 AI에도 핵심 기술로 활용될 수 있다. 그는 "게임 속에서 여러 사용자가 음성 대화를 통해 공동의 임무를 수행하는 새로운 플레이 경험도 구현할 수 있는 전망"이라며 "42dot은 옴니모달 모델을 기반으로 모빌리티 AI를 고도화해 운전자와 동승자 모두의 주행 경험을 향상시킬 수 있을 것"이라고 내다봤다.

다만 김 교수는 "음성은 단순히 새로운 입력 형식을 추가하는 것을 넘어 여러 기술적인 도전 과제들이 존재한다"고 진단했다. 기존 텍스트 기반 대화는 입력과 응답이 순차적으로 이어지는 단방향 소통 방식에 불과한 반면, 음성 대화는 동시적이고 양방향적인 특성을 가지기 때문이다. 발화 중 끼어들기, 짧은 반응(백채널), 감정 표현 등을 모두 고려해야 한다.

이 한계를 극복하기 위해 하나의 통합된 언어모델이 음성 정보까지 처리할 수 있도록 하는 기술이 발전하고 있다. 엔비디아에서 오픈소스로 공개한 OmniVinci 모델이 대표적이다. 김 교수는 "최근 옴니모달 모델은 사전 학습된 언어모델을 핵심에 두고 음성을 포함한 다양한 데이터로 미세조정하는 방식으로 개발된다"며 "높은 성능의 언어모델을 갖추는 것이 핵심"이라고 했다.

김 교수는 옴니모달 AI가 소버린 AI 전략의 핵심 기반이 될 수 있다고 평가했다. 국가·공공·산업 데이터 대부분이 비정형 데이터인 만큼 텍스트·음성·이미지를 통합 처리하는 모델이 외부 플랫폼 의존도를 낮추고 데이터 주권을 강화할 수 있다는 것이다.

그는 "옴니모달 모델은 산업 전반을 하나의 모델로 연결할 수 있다. 장기적으로는 물리적 세계까지 아우르는 실행형 AI로 진화해 나갈 것"이라며 "성공적인 옴니모달 모델 확보는 디지털 주권을 넘어 물리적 인프라 주권까지 함께 강화하는 기반이 될 것"이라고 전망했다.

/안세준 기자(nocount-jun@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 김건희 서울대 교수 "SKT A.X K1, 韓 소버린 AI 미래 선도"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스