AI · Data · Semiconductor

AI, 협상 싸움에서도 인간 이겼다
  • 김동원 기자
  • 기사입력 2022.11.25 16:53

    메타, 협상 전략 게임 플레이하는 AI 개발…사람보다 2배 높은 점수 올려

    • 메타가 고전 보드게임 ‘디플로머시’를 사람 수준으로 플레이할 수 있는 AI ‘키케로’를 개발했다고 밝혔다. /메타
      ▲ 메타가 고전 보드게임 ‘디플로머시’를 사람 수준으로 플레이할 수 있는 AI ‘키케로’를 개발했다고 밝혔다. /메타

      인공지능(AI)이 바둑과 체스에 이어 사람과 협상이 필요한 게임에서도 이겼다. 최대 7명이 참여해 전략적으로 협력하고 배신하며 승리하는 게임에서 AI는 사람처럼 대화하고 전략을 수립하며 사람보다 평균 2배 이상 높은 점수로 승리했다.

      메타는 최근 블로그를 통해 고전 보드게임 ‘디플로머시’를 사람 수준으로 플레이할 수 있는 AI ‘키케로’를 개발했다고 공개했다. 디플로머시는 이미 AI가 사람을 이긴 바둑, 체스와 형식이 다른 게임이다. 바둑, 체스가 일대일로 겨루는 게임이라면 디프플로머시는 최대 7명이 참가한다. 게임은 서로 소통을 통해 진행된다. 서로 전략적으로 협력하고 동맹을 맺고 때로는 배신하며 유럽 주요 지역을 차지하는 것이 목표다.

      이러한 게임의 복잡성 때문에 디플로머시는 AI가 이기기 어렵다고 평가됐다. 게임에서 이기려면 다른 사람과 소통하며 상대의 의미를 파악해야 하는데 이를 위해선 자연스러운 대화 기능과 의미를 파악할 수 있는 기술이 필요하기 때문이다.

      사람과의 수 싸움도 문제다. 바둑과 체스에서는 상대방의 둔 수를 볼 수 있지만 이 게임에선 상대방의 행동을 알 수 없다. 따라서 상대의 수를 예측해 가장 좋은 전략을 세워야 한다. 이 전략이 나만 유리해서는 안 된다. 혼자 유리한 경우 다른 사람과 협력을 이끌기 어려워 동맹군에게 집중 공격을 받을 수 있어서다.

    • 메타는 27억 개 파라미터를 가진 자연어처리 모델을 활용해 다른 참가자와 대화하며 원하는 결과를 끌어낼 수 있는 ‘통제적 대화’ 언어모델을 만들었다. /메타
      ▲ 메타는 27억 개 파라미터를 가진 자연어처리 모델을 활용해 다른 참가자와 대화하며 원하는 결과를 끌어낼 수 있는 ‘통제적 대화’ 언어모델을 만들었다. /메타

      메타는 이 게임에서 이기기 위해 게임 보드 상황과 과거 대화 이력을 토대로 다른 참가자의 행동을 예측하는 AI 모델을 개발했다. 여기에 27억 개 파라미터를 가진 자연어처리 모델을 활용해 다른 참가자와 대화하며 원하는 결과를 끌어낼 수 있는 ‘통제적 대화’ 언어모델을 만들었다. 이를 활용해 기존 사람이 플레이한 4만 개의 게임 데이터셋을 학습시켜 키케로가 사람과 자연스럽게 소통하며 전략을 구상하게 했다.

      이렇게 개발된 키케로는 디플로머시 게임을 온라인에서 겨루는 ‘웹디플로머시닷넷’에서 사람과 대결해 평균 2배 이상 높은 점수로 승리했다. 또 한 번 이상 게임에 참여한 전체 참가자 중 상위 10% 성적을 냈다. 게임에 함께 참여한 사람들은 서로 채팅으로 대화했는데 키케로가 AI라는 사실을 알지 못했다.

      메타는 키케로 대결 결과는 AI가 어렵다고 평가됐던 전략과 추론, 협상의 가능성을 높인 사례라고 설명했다. AI 4대 천왕으로 알려진 얀 르쿤 메타 수석 AI 과학자는 “키케로는 AI의 양대산맥인 전략적 추론과 자연어처리를 결합해 낸 성과”라며 “디플로머시라는 복잡한 전략 게임을 AI가 인간 수준으로 한 것은 그만큼 AI가 협업 분야에서 크게 발전했다는 것을 증명한 사례”라고 말했다.

      메타는 키케로에 사용된 통제적 대화 언어모델을 고도화해 AI가 단순한 질의응답을 넘어 길고 복잡한 대화를 이어갈 수 있게 하겠다고 밝혔다. 이를 토대로 게임에서 플레이어의 의도를 이해하고 이에 맞춰 대화하는 도우미 캐릭터 등을 만들 수 있을 것으로 기대했다.

    최신 뉴스

    더보기