Enterprise

KT, ‘초거대 AI’ 대열 합류…‘실용성’ 앞세워 기존 모델과 차별화
  • 김동원 기자
  • 기사입력 2022.11.16 16:02

    연구 목적 아닌 비즈니스 활용에 초점 맞춘 초거대 AI ‘믿음’ 공개

    • 구현모 KT 대표가 기자간담회에서 초거대 AI ‘믿음(MIDEUM)’을 공개했다. /김동원 기자
      ▲ 구현모 KT 대표가 기자간담회에서 초거대 AI ‘믿음(MIDEUM)’을 공개했다. /김동원 기자

      KT가 올해 초부터 화자 됐던 ‘초거대 AI’ 모델을 공개했다. 후발주자인 만큼 기존 초거대 AI 단점으로 지적됐던 ‘비효율 문제’를 해결하고 비즈니스 활용 측면을 강화했다. KT는 해당 모델을 국내 유망 기업에 공유해 일부 국가와 기업 위주로 활용되는 ‘초거대 AI 쏠림 현상’을 극복하고 AI 산업 문턱을 낮추겠다는 비전을 밝혔다.

      KT는 16일 소피텔 앰배서더 서울 호텔에서 기자간담회를 열고 초거대 AI ‘믿음(MIDEUM)’을 공개했다. 구현모 KT 대표는 “믿음은 KT가 수년 동안 개발해 온 초거대 AI”라며 “합동 융합 지능을 통해 기존 초거대 AI 모델과 차별된다”고 말했다. 이어 “지금까지 공개된 초거대 AI는 성능, 확장성, 비용 면에서 이미 한계가 드러나고 있다”며 “우리는 성능보단 특정 사업에 잘 적용할 수 있느냐에 초점을 맞춰 효용성 높은 모델을 개발했다”고 밝혔다.

      초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습한 AI 모델이다. 기존의 AI가 특정 분야 데이터를 학습해 그 분야에 맞는 결과물만 낼 수 있었다면 초거대 AI는 방대한 양의 데이터를 학습한 만큼 범용적으로 사용할 수 있다. 2020년 미국 연구기관 오픈AI가 ‘GPT-3’를 공개하며 처음 알려졌다. 이후 구글, 마이크로소프트, 메타 등 빅테크 기업이 초거대 AI 모델을 연이어 공개했다. 국내에서는 네이버, LG, 카카오, SKT가 관련 모델을 개발, 선보였다.

      이 모델은 AI 산업의 새로운 가능성을 제시했다. 대규모 데이터를 학습한 만큼 특정 분야가 아닌 다양한 측면에서 결과물을 냈다. 하나의 모델로 소설과 칼럼을 쓰고 사람과 대화 능력을 높이고 본문의 내용을 요약하는 것이 가능해졌다. 하지만 지금까지 모델은 실용적인 측면에선 사용이 어렵다는 평가를 받았다. 언어 이해 능력과 언어 생성 능력이 별도로 있어 실제 비즈니스에선 활용도가 떨어지고 데이터 침해, 보안 등의 문제로 타 서비스에 적용이 어려운 한계가 있었다. 한 번 데이터를 학습할 때마다 막대한 비용이 들어 잦은 서비스 업데이트가 있는 B2B(기업간 거래) 서비스엔 마땅치 않다는 지적도 있었다.

      KT가 공개한 믿음은 이러한 초거대 AI의 한계를 깬 모델이다. ‘인코더-디코더 아키텍처’ 형식으로 언어 이해와 생성을 동시에 가능하게 해 다양한 비즈니스에 쉽게 적용토록 했다. 인코더와 디코더는 기계에 문장을 학습시키는 프로세스다. 문장을 적절한 벡터로 변환하는 것을 인코딩, 벡터를 적절한 문장으로 변환하는 것을 디코딩이라 부른다. 일반적으로 언어를 이해하는 능력은 인코딩 수행방식을 사용한다. 반면 언어 생성능력은 디코딩에 의존한다. 2018년 구글에서 출시한 거대 AI 모델 ‘버트’는 인코더 기능만 있어 언어 이해만 가능했다. 반대로 문자 생성에 중점을 둔 GPT-3는 디코더 기능만 갖췄다. KT 믿음에 탑재된 인코더-디코더 아키텍처는 버트와 GPT-3 모델과는 다른 버전이다. 언어 이해 능력과 생성 능력을 모두 갖췄다. 사람이 하는 언어를 이해하고 데이터를 토대로 언어 생성도 할 수 있다. 

      배순민 KT AI2XL연구소장은 “우리의 초거대 AI는 언어 이해와 생성이 모두 가능한 ‘멀티태스킹’에 최적화된 모델”이라면서 “현실에 있는 다양한 과제를 미리 사전 학습해 새로운 과제가 들어왔을 때도 신속하게 고객한테 ‘맞춤형 AI’를 제공할 수 있다”고 말했다. 이어 “현재 정보통신산업진흥원(NIPA)의 ‘초거대 AI API 서비스 지원사업’에 참여해 믿음 서비스를 제공하고 있는데 고객사로부터 대화나 문체 변환이 쉬워 비즈니스에 손쉽게 적용·확장하고 있다는 긍정적인 피드백을 듣고 있다”고 덧붙였다.

    • 배순민 KT AI2XL연구소장은 KT의 초거대 AI의 경우 언어 이해와 생성이 모두 가능한 ‘멀티태스킹’에 최적화된 모델이라고 설명했다. /김동원 기자
      ▲ 배순민 KT AI2XL연구소장은 KT의 초거대 AI의 경우 언어 이해와 생성이 모두 가능한 ‘멀티태스킹’에 최적화된 모델이라고 설명했다. /김동원 기자

      KT는 이와 더불어 AI 학습과 추론에 사용되는 전력량을 줄이기 위해 하드웨어와 소프트웨어 성능도 높였다. AI 반도체 스타트업 ‘리벨리온’과 협력해 하드웨어 전력 효율을 높였고 래블업의 ‘그래픽처리장치(GPU) 분할 가상화’ 소프트웨어 기술을 활용해 GPU가 낭비되는 일도 줄였다. GPU 가상화는 하나의 GPU를 컨테이너별로 0.1GPU, 0.2GPU, 2.7GPU 등으로 나눠 하나의 GPU에서 여러 추론을 할 수 있게 하는 기능이다. 숙소를 예로 들면 하나의 거대한 건물을 나눠서 사용한다고 보면 된다. 건물이 아무리 크더라도 방이 하나면 한 명의 사용자가 건물을 독점으로 사용하게 된다. 하지만 건물을 여러 방으로 나누면 여러 명이 사용할 수 있다. 이처럼 KT는 GPU에 여러 개의 방을 나눠 효율적인 학습과 추론을 할 수 있는 기능을 믿음에 탑재했다.

      박성현 리벨리온 대표는 “초거대 AI는 구축, 운영, 전력 등의 부문에서 큰 비용이 들어 서비스를 하면 할수록 적자가 되는 문제가 있었다”며 “이 문제를 줄이기 위해 KT와 인프라 부문에서 협력을 이어가고 있다”고 밝혔다.

      KT는 이날 믿음을 활용해 서비스를 개발한 사례도 소개했다. 대표 서비스는 ‘오은영 AI 육아상담 서비스’다. 오은영 박사가 집필한 책과 논문 등을 학습한 AI와 지니TV의 음성 대화 기능을 활용해 실시간 상담할 수 있는 서비스다. 배순민 소장은 “오은영 박사와 더 많은 육아 서비스를 제공하기 위해 해당 서비스를 개발했다”며 “육아 상담 관련 전문 데이터를 학습한 AI가 음성합성 기술을 활용해 오은영 박사의 목소리로 신뢰 있는 상담을 할 수 있다”고 소개했다. 이어 “이 서비스 외에도 KT는 믿음을 활용해 고객센터 상담 요약 서비스와 고객 맞춤 추천 서비스를 개발했다”며 “믿음은 모두에게 열린 기술인 만큼 많은 파트너사와 협력해 글로벌 AI 생태계를 만들어나가겠다”고 밝혔다.

    최신 뉴스

    더보기