Featured · Interview
최재식 KAIST 김재철AI대학원 교수, “韓 ‘설명가능한 AI’ 기술력, 글로벌 톱 수준”
-
인공지능(AI)이 모델이 커지면서 할 수 있는 일이 많아졌다. 오픈AI가 개발한 챗GPT는 사람과 자연스럽게 소통할 뿐 아니라 정보 탐색, 코딩, 보고서 작성, 단락 요약, 번역 등 다양한 업무를 수행해 높은 관심을 받고 있다. 챗GPT가 다양한 업무를 수행할 수 있는 것은 초거대 AI 모델로 상당한 양의 데이터를 학습했기 때문이다. 1750억 개 이상 파라미터(매개변수)로 많은 양의 데이터를 학습한 ‘GPT-3.5’에 강화학습을 적용, AI가 사람과 더 수준 높은 대화를 할 수 있게 했다. 강화학습은 보상과 처벌을 통해 AI가 올바른 결괏값을 내게 하는 학습 방식이다.
그렇다면 많은 양의 데이터를 학습한 챗GPT가 항상 옳은 말을 할까? 챗GPT는 현재 한국 대통령을 묻는 질문에 오답을 낼 수 있다. 윤석열 대통령이 아닌, 문재인 대통령이라고 답할 수 있다. 학습한 데이터에 윤석열 대통령보다 문재인 대통령에 관한 내용이 더 많을 수 있어서다. 실제로 챗GPT는 2021년까지 정보만 학습해 그 이후 내용은 틀리는 오류를 범하기도 했다. 많은 기술이 투입된 최신식 AI도 오류를 범할 수 있다는 것을 보여준 사례다.
AI가 내는 오류는 심각한 문제를 가져올 수 있다. 군사 분야에 접목한 AI가 아군을 적으로 판별할 수 있고, 금융 분야에선 큰 금액을 엉뚱한 사람에게 송금할 수 있다. 최재식 KAIST 김재철AI대학원 교수는 이 문제를 ‘설명가능한 AI’로 풀어야 한다고 설명한다. 우등생이 공부할 때 오답을 낸 이유를 분석해 같은 실수를 하지 않듯이, AI도 왜 그러한 결과를 냈는지 설명하고 이를 토대로 같은 오류를 범하는 잘못을 고쳐야 한다는 것이다. 그는 14일 지능정보산업협회(AIIA)와 지능정보기술포럼(TTA ICT 표준화포럼 사업)이 공동 주최한 조찬포럼에서 “비즈니스 AI를 사용하기 위해선 높은 정확도를 보여야 한다”며 “리포트를 AI로 쓴다고 할 때 어떤 것은 맞고 어떤 것은 틀리면 사용할 수 없기 때문”이라고 말했다. 이어 “AI가 범하는 오류는 설명가능한 AI로 풀 수 있다”고 했다.
설명가능한 AI는 AI가 어떤 결과를 냈는지 그 과정을 설명하는 기술이다. 딥러닝은 데이터를 입력하면 결과물을 출력하는 구조다. 챗GPT에 텍스트로 질문하면 원하는 정보를 출력해 제공하는 식이다. 이 딥러닝 방식에선 중간 과정을 설명하지 못한다. AI가 왜 그 결괏값을 냈는지 과정을 알 수 없는 것이다. 유튜브에서 알고리듬이 사용자가 좋아할 것 같은 영상을 추천해주지만, 왜 그 영상들을 추천하는지를 명확하게 알 수 없는 것도 이 문제 때문이다.
-
최 교수는 딥러닝이 내린 결과를 사람이 직접 알기는 어렵고 그 열할을 할 수 있는 도구를 사용해야 한다고 설명했다. AI가 어떤 것 때문에 그러한 결론을 내릴지 예측하는 알고리듬 등이다. 자율주행에서는 이미지와 영상 분석에 자주 사용되는 ‘합성곱 신경망(CNN)’을 분석하는 알고리듬이 사용된다. 자율주행차가 왼쪽으로 움직일 때 오른쪽 장애물 때문이었다는 것을 영상에서 빨간색 등으로 보여주는 기술이다. 탑승자는 이 영상을 보며 차가 왜 왼쪽으로 움직였는지를 알 수 있다. 현재 이러한 설명가능한 AI 도구는 구글, 엔비디아, IBM, 보쉬 등 빅테크 기업이 경쟁적으로 개발 중이다. AI가 내린 결과를 설명할 수 있어야 개발한 기술을 판매해 수익을 창출할 수 있단 계산에서다.
국내에서도 설명가능한 AI 도구 개발이 이뤄지고 있다. AI 스타트업 ‘인이지’의 대표이기도 한 최 교수는 현재 KAIST, 인이지의 기술을 더해 딥러닝 결과를 예측할 수 있는 모델을 만들었다. 딥러닝에 입력한 데이터 중 모델 예측 기여도가 높은 특징만 추출해나가는 알고리듬을 개발해 이 특징이 AI 예측 과정에 기여하는 수치 등을 계산했다. 딥러닝이 어떤 결과를 낼 때 여기에 높게 기여한 데이터가 무엇인지 등을 알려주는 모델이다.
최 교수는 이 기술을 툴킷으로 만들어 상용화할 계획이다. 기술 경쟁력은 높다. 그는 “현재 우리 모델은 구글, 메타 등의 플랫폼과 경쟁하고 있다”며 “지난해 국제 AI 학회 신경정보처리학회에서 발표될 정도로 성능을 인정받았다”고 말했다. 이어 “챗GPT가 등장하면서 많은 AI 관계자들이 우리나라는 언제 저런 AI 엔진을 만들 수 있을까 고민한 건 사실”이라면서 “설명가능한 AI는 비록 작은 분야일 수 있지만, 미국과 경쟁해 밀리지 않을 만큼의 엔진을 갖추고 있다”고 강조했다.