AI · Data · Semiconductor

영상 보여주면 ‘알아서 척척’… 급진전 중인 AI의 ‘모방학습’
  • 김동원 기자
  • 기사입력 2023.01.03 16:08

    오픈AI·엔비디아, 학습 데이터 지정 필요 없는 모방학습 개발
    동영상 보고 필요한 작업 스스로 진행… 게임 ‘마인크래프트’에 시범 적용

    • AI 모델이 동영상으로 사람의 행동 패턴을 학습하는 ‘모방학습’이 고도화되고 있다. /게티이미지뱅크
      ▲ AI 모델이 동영상으로 사람의 행동 패턴을 학습하는 ‘모방학습’이 고도화되고 있다. /게티이미지뱅크

      인공지능(AI)이 사람의 행동을 담은 동영상을 보는 것만으로 스스로 학습하고 진화할 수 있을까? 공상과학 영화에 나올법한 이 이야기는 이미 현실이 되고 있다.

      미국 AI 연구소 ‘오픈AI’와 미국 AI·반도체 기업 ‘엔비디아’는 동영상 내용을 AI가 학습해 관련 업무를 수행할 수 있는 새로운 학습 방법을 상용화했다. 이른바 ‘모방학습’이다. AI 모델이 동영상 등으로 사람의 행동 패턴을 학습하면 결국 그와 똑같은 작업을 수행하는 방식을 말한다.

      모방학습 기술은 이전에도 존재했다. 하지만 이 작업에는 사람 손길이 필요했다. 하지만 동영상에서 필요한 정보를 사람이 하나하나 수작업으로 지정(레이블링)해 주어야만 AI가 학습시할 수 있었다. 하지만 오픈AI와 엔비디아가 개발한 학습방식은 사람의 개입이 거의 없다. 일일이 레이블링 작업을 하지 않아도 AI가 동영상에서 필요한 정보를 찾아 학습한다. 사람이 동영상 강의를 통해 지식을 배우는 방법과 비슷하다.

    • 엔비디아는 73만 개의 마인크래프트 동영상을 데이터셋으로 구축해 게임을 하는 AI 모델을 만들었다. /엔비디아
      ▲ 엔비디아는 73만 개의 마인크래프트 동영상을 데이터셋으로 구축해 게임을 하는 AI 모델을 만들었다. /엔비디아

      오픈AI와 엔비디아는 해당 기술을 게임 ‘마인크래프트’에 구현했다. 마인크래프트는 명확한 목표가 없는 개방형 게임이다. 플레이어는 게임 세계를 돌아다니며 다양한 재료를 채굴하고 결합해 새로운 개체를 만드는 등 원하는 것을 자유롭게 할 수 있다. 그만큼 이 게임은 바둑이나 체스, 스타크래프트 등 일반 게임보다 AI를 접목하기 어렵다고 평가됐다. 일반 게임은 명확한 목표가 있어 보상과 처벌을 통해 AI가 올바른 결괏값을 내게 하는 ‘강화학습’으로 AI를 학습시킬 수 있지만, 마인크래프트는 불가능하기 때문이다.

      오픈AI와 엔비디아는 강화학습 대신 모방학습을 통해 AI가 마인크래프트 게임을 할 수 있게 했다. 사람이 마인크래프트 게임을 하는 동영상을 데이터셋으로 활용해 AI 모델을 학습시켰다.

      오픈AI는 이 학습방식을 위해 ‘VPT(Video Pre-Training)’라는 새로운 신경망 모델을 개발했다. VPT는 동영상에 필요한 정보를 자동 레이블링해주는 모델이다. 기존에 사람이 일일이 했던 작업을 AI가 대신해준다고 보면 된다. 오픈AI는 이 모델 만들기 위해 사람이 수작업으로 레이블링한 2000시간 분량의 동영상을 데이터셋으로 활용했다. 이 데이터셋으로 VPT 모델을 학습시켜 AI가 직접 동영상을 레이블링할 수 있게 훈련했다. 이후 인터넷에서 수집한 7만 시간의 동영상을 이 모델로 자동 레이블링했다.

      엔비디아는 마인크래프트 게임을 할 수 있는 AI를 만들기 위해 전용 트랜스포머 모델인 ‘마인클립(MineCLIP)’을 개발했다. 유튜브에서 소개되는 마인크래프트 게임 영상의 동영상과 음성을 모두 이해해 게임 방식을 학습하는 모델이다. 엔비디아는 이 모델을 활용해 73만 개의 마인크래프트 동영상을 데이터셋으로 구축, AI를 학습시켜 게임을 하는 ‘마인도조’라는 새로운 모델을 만들었다. 이 모델은 지난해 11월 미국 루이지애나 뉴올리언스에서 열린 세계 권위의 AI 학회 ‘뉴립스(NeurlIPS, 신경정보처리시스템학회) 2022’에서 ‘데이터셋 및 벤츠마크 논문상’을 수상했다.

    • 마인드조는 별도 레이블 작업 없이 동영상과 음성을 모두 이해해 게임 방식을 학습하는  ‘마인클립’을 기반으로 개발됐다. /엔비디아
      ▲ 마인드조는 별도 레이블 작업 없이 동영상과 음성을 모두 이해해 게임 방식을 학습하는 ‘마인클립’을 기반으로 개발됐다. /엔비디아

      오픈AI와 엔비디아가 개발한 모방학습 방식은 마인크래프트라는 게임에 시범 적용했지만, 앞으로는 다양한 업무에 응용 사용될 것으로 전망된다. 기존 레이블링이 필요한 동영상 학습방식은 사람의 수작업이 들어가 시간과 비용이 많이 투입됐지만, 이번 방식은 별도의 레이블링 작업이 필요 없어 크기와 용량 제한 없이 다양한 동영상을 학습 데이터를 사용할 수 있기 때문이다. 

      이 학습방식은 기존 사람이 하는 단순 반복 업무를 녹화해 그대로 구현하게 하는 ‘로보틱프로세스자동화(RPA)’를 넘어 복잡한 업무까지 기계가 해주는 높은 수준의 업무 자동화를 가능하게 할 수 있다. 기존 RPA가 사무 영역의 업무 자동화만 가져왔다면 모방학습은 하드웨어 기술과 결합해 제조, 의료 등 복잡한 분야까지 업무 자동화 가져올 것으로 예상된다. 또 동영상만으로 AI 모델을 만들 수 있어 기존 AI 상담원이나 안내원 등의 기술도 빠르게 개발할 수 있을 것으로 전망된다.

      엔비디아는 블로그를 통해 “자연어처리(NLP) 기술을 이미지, 비디오에 접목하면 AI 명령을 직관적으로 할 수 있다”며 “비디오 분석 기술과 최신 음성 기술을 결합하면 가까운 미래에 여러 작업을 수행할 수 있는 AI 에이전트를 만들어 낼 수 있을 것”이라고 밝혔다.

    최신 뉴스

    더보기