최종편집:2024-04-28 00:17 (일)
실시간
올림피아드 금메달 수준… 구글 딥마인드가 선보인 수학 AI 정체

올림피아드 금메달 수준… 구글 딥마인드가 선보인 수학 AI 정체

  • 기자명 구아현 기자
  • 입력 2024.01.19 02:46
  • 수정 2024.01.19 03:41
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

신경언어모델·기호추론엔진 적용 ‘알파지오메트리’ 발표
기존 제시된 수학 풀이 방법보다 논리적인 방법 찾아

전제(왼쪽)가 주어지면 알파지오메트리(가운데)는 먼저 기호 엔진을 사용해 솔루션을 찾거나 새 명령문이 소진될 때까지 다이어그램에 대한 새 명령문을 추론한다. 해결하지 못하면 언어모델을 통해 유용한 구문(파란색)을 추가해 기호추론엔진에 대한 새로운 추론을 추가한다. /딥마인드 블로그 캡처
전제(왼쪽)가 주어지면 알파지오메트리(가운데)는 먼저 기호 엔진을 사용해 솔루션을 찾거나 새 명령문이 소진될 때까지 다이어그램에 대한 새 명령문을 추론한다. 해결하지 못하면 언어모델을 통해 유용한 구문(파란색)을 추가해 기호추론엔진에 대한 새로운 추론을 추가한다. /딥마인드

2016년 알파고를 선보인 구글 딥마인드가 또 한 번 세계를 놀라게 했다. 알파고는 바둑을 두는 인공지능(AI)이었다면, 이젠 수학을 잘하는 AI를 선보였다. ‘알파지오메트리(AlphaGeometry)’다. 국제 수학 올림피아드 기하학 30문제 중 25개를 맞췄다.

구글 딥마인드는 17일(현지시간) 공식 블로그를 통해 국제 학술지 ‘네이처(Nature)’에 올림피아드 금메달 수준의 복잡한 기하학 문제를 해결하는 수학 AI ‘알파지오메트리’를 발표했다.

알파지오메티르니는 주어진 기하학 문제를 푸는 동시에 수학적 정리를 증명할 수 있는 AI다. 수백만개의 수학 증명 데이터를 기계가 읽을 수 있는 데이터로 합성해 스스로 학습하는 ‘신경 언어 모델(neural language model)’을 적용했다.

이 AI는 기존 언어모델과 다르다. 언어모델 기반 AI는 학습 데이터를 통해 언어 패턴을 익히고, 특정 단어 뒤에 나올 단어를 확률적으로 선별한다. I am 다음에 어떤 단어가 나올지를 확률적으로 맞춰간다고 보면 된다. 이 방식은 정답이 하나인 수학 문제를 풀기 어렵고, 더 나아가 증명하는데는 사용하기 어려웠다.

수학에서 증명이란 어떤 명제가 참인지 거짓인지를 밝혀내는 과정이다. 1+1의 답이 2인지를 증명하는 과정이라고 보면 된다. 복잡한 경우 수십 페이지에 달하는 논문을 작성해야 한다. 기존 언어 모델 방식으론 이 증명을 하기 어려웠다. 확률을 맞추는 것이 아닌 정답을 맞추는 추론 과정이 필요했다. 연구진은 “수학 증명에서 어떤 명제가 맞는지를 설명하려면 추론 능력이 필요하다”고 밝혔다.

학습 데이터도 부족했다. 기하학은 여러 단계의 증명이 필요해 많은 양의 데이터가 필요하다. 하지만 기하학 증명 문제는 AI가 학습할 자료가 거의 없다. 데이터만으로 풀 수 없다는 것도 문제였다. ‘이 문제의 답이 왜 맞는지’에 대해 논리적 사고를 하기엔 단순한 데이터 학습으로는 한계가 있어서다. 올림피아드 수학 문제는 단순한 계산 문제를 넘어 논리적 사고를 기반으로 자신의 명제를 수학적으로 증명해야 하는데, 이는 기존 언어모델의 방식으론 한계가 있었다. 많은 기호가 활용돼 AI 학습이 어려운 것도 한계였다.

딥마인드는 이 답을 신경 언어 모델에서 찾았다. 훈련 데이터 대신 자체 합성 데이터를 생성해 1억개의 합성 정리와 다양한 복잡성의 증명을 생성해 문제를 완화했다. 물론 합성 데이터셋을 구축하는 데에는 많은 비용이 든다. 실제로 딥마인드 연구진은 데이터셋을 생성하기 위해 3일 동안 10만개의 중앙처리장치(CPU)를 활용했다. 이 과정에서 구글은 비용 분담을 거부한 것으로도 알려졌다.

알파지오메트리에서 생성된 합성 데이터를 시각적으로 표현한 모습. /딥마인드

딥마인드는 여기에 ‘심볼릭 추론 엔진’을 적용해 수학 기호 문제도 스스로 해석할 수 있게 했다. 심볼릭 추론 엔진은 최근 AI 기술 대부분을 차지한 인공신경망과 다른 방식으로, 여러 규칙을 적용해 AI가 추론할 수 있게 하는 기술이다. AI가 해석할 수 없는 기호를 규칙으로 적용해 학습량을 줄이면서도 풀이 정확도를 높인다. 

이렇게 만들어진 알파지오메트리는 기존에 개발된 수학 AI 모델을 뛰어넘었다. 국제수학올림피아드 문제도 손쉽게 풀어냈다. 연구진은 2000년부터 2020년까지 국제수학올림피아드에 출제된 문제 중 30개를 추려 알파지오메트리에 풀게 했다. 그 결과 25개를 맞춰 뛰어난 성능을 선보였다. 30개 중 25개의 정답률은 국제수학올림피아드에서 금메달을 딸 수 있을 정도의 수준이다. 기존 AI를 사용했을 때는 30개의 문제 중 10개만 해결할 수 있었다.

단순히 문제를 잘 푸는 것만이 아니라 이전에는 생각하지 못했던 새로운 풀이법도 선보였다. 2004년 국제수학올림피아드에는 겹쳐 있는 3개의 원 안에 있는 선분의 위치를 증명하는 기하학 문제가 출제됐다. 알파지오메트리가 이 문제를 풀게 하자 기존에 정답으로 제시된 풀이보다 일반적인 증명 방법을 제시했다. 수학적 증명에서 일반적이라는 의미는 논리에 빈틈이 없으면서도 다양한 상황에서도 적용할 수 있다는 것을 의미한다.

알파지오메트리가 풀이한 문제 사례. /딥마인드
알파지오메트리가 풀이한 문제 사례. /딥마인드

전 올림피아드 금메달리스트인 에반 첸(Evan Chen)은 “알파지오메트리의 풀이는 검증 가능하고 깨끗해 인상적”이라며 “수학 AI는 검증 가능하고 명확하기 때문에 사람의 확인이 필요하지 않다”고 평가했다.

딥마인드 연구진은 “자체 합성데이터 생성으로 수학 AI 개발에 필요한 데이터를 만들 수 있어 데이터 부족 문제를 해결할 수 있다”며 “궁극적으로 인간의 지식을 확장할 수 있는 AI를 만들겠다”고 밝혔다.

저작권자 © THE AI 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전