그래픽 처리장치서 출발… 이젠 ‘신경회로’ 넘본다

[THE_KAT_2023/Phase_Two_④] 진화하는 인공두뇌, AI 반도체
GPU지나 1세대 AI 반도체 인기, 2세대 ‘뇌신경 모방칩’ 연구도 활발

인공지능(AI)의 두뇌는 반도체입니다. 반도체 기술이 발전하면서 AI 성능도 부쩍 좋아지고 있습니다. 특히 AI 처리에 적합한 ‘AI 반도체’가 등장하면서 AI의 성능은 기하급수적으로 높아지고 있습니다. 인공지능 전문매체 더에이아이(THE AI)는 본지의 2023년 1/4분기 신년 기획 ‘THE KAT 2023’의 두 번째(Phase Two) 순서로 ‘AI 반도체’의 발전상황과 국내외 기술 수준에 대해 알아볼 계획입니다. 기사는 총 6회에 걸쳐 연재되고 있습니다. 독자 여러분들의 많은 관심 부탁드립니다. - 편집자 주

인공지능(AI) 반도체는 ‘인공신경망(ANN)’ 알고리듬 연산 능력을 극대화시켜주는 초고속·저전력 반도체다. AI기술 성능을 좌우하는 ‘두뇌’역할을 하기 때문에 관련 기술 확보를 위한 세계 각국의 경쟁도 치열하다. 글로벌 시장조사업체 ‘가트너’에 따르면 AI 반도체 시장 규모는 2030년 1179억 달러(약 155조 원)에 이를 것으로 전망된다. 우리 정부 역시 올해 국산 AI 반도체 기술 확보에 1조 원의 예산을 지원한다.

하지만 AI 반도체에 관한 관심은 많지만, 실제로 ‘어떤 기술’이 있는지는 의외로 잘 잘 알려져 있지 않다. AI 반도체는 어떤 종류가 있고, 어떻게 발전하고 있는지 짚어봤다.

◇AI 반도체 산업의 절대 강자 ‘GPU’

현재 가장 보편적으로 사용되는 AI 반도체 유형은 ‘기존 반도체 진화형’이다. 상용화된 반도체를 AI데이터 처리에 특화해 사용하는 모델을 의미한다. 이 AI 반도체 유형의 대표적 모델은 ‘그래픽처리장치(GPU)’다. GPU는 이름 그대로 컴퓨터 그래픽 데이터를 처리하는 장치다. AI 반도체 업계를 미국의 GPU 제조 기업 ‘엔비디아’가 장악하고 있는 것도 이 때문이다. ‘옴디아’ 등 시장조사기관에 따르면 전체 AI 반도체 시장 중 엔비디아의 GPU가 차지하는 비중은 90%에 달하는 것으로 알려졌다.

GPU가 AI에 사용되는 이유는 ‘병렬처리’ 능력 때문이다. 이는 대용량 데이터를 동시에 연산하는 능력을 말한다. 중앙처리장치(CPU)의 경우, 데이터를 한 번에 하나씩 빠르게 처리한다. 반면 수천 개의 코어가 집약된 GPU는 여러 개 데이터를 동시에 처리할 수 있다. 때문에 AI가 답을 구할 때까지 같은 연산을 수없이 반복하는 ‘심층신경망(DNN)’ 구현에 효과적이다.

다만 GPU로는 초거대 AI 등 미래형 고성능 AI의 연산능력을 감당하기 어렵다는 한계가 있다. 애당초 AI특화용으로 개발된 반도체가 아니기 때문이다. 이로 인해 고성능 AI를 구동할 경우, 엄청난 열이 발생해 성능 저하가 일어날 수 있다. 또 이 열을 제어하기 위해선 고가의 냉각시스템을 구축해야 한다.

GPU의 한계를 개선하고자 AI 반도체 모델이 ‘프로그래머블 반도체(FPGA)’다. FPGA는 프로그래밍이 가능한 비메모리 반도체의 일종이다. 회로 변경이 불가능한 일반 반도체와 달리 용도에 맞춰 회로를 다시 새겨 넣을 수 있다는 장점이 있다. 기본 연산 능력도 GPU보다 우수하다. FPGA기반 AI는 GPU기반 모델보다 연산 속도가 약 1.5배 빠르다. 또 전력 사용량도 GPU보다 20% 적게 든다.

하지만 전문가들은 FPGA가 ‘애매’하다는 평가를 내놓는다. FPGA 자체가 GPU와 그 다음 세대인 AI 특화 반도체의 중간 단계에 있는 ‘프로토타입’의 형태에 가깝기 때문이다. 성능이 GPU에 비해 우수하긴 하지만 월등히 차이 나는 수준이 아닌데다, 고비용·고난이도 공정방식으로 인해 대량 생산이 어렵다.

KIST 인공뇌융합연구단에서 개발한 디지털 뉴로모픽 반도체 KIST 'Neu+'의 실물 모습/ 한국과학기술연구원

◇GPU 왕좌를 넘보는 ‘AI 반도체’

기존 반도체 진화형 모델들의 한계를 넘고자 연구·개발이 한창인 것이 ‘AI 반도체’다. 이 모델군은 AI연산 고속화를 위해 반도체 구성을 최적화시킨 것이다. 기업 및 사용자의 요구에 따라 특수 기능 회로를 설계하는 ‘주문형 반도체(ASIC)’타입으로 만들어진다. GPU 계열도 AI 반도체로 사용되지만 전문가들은 보통 전용으로 개발된 AI 반도체만을 ‘완전한 AI 반도체’로 분류하는 경우가 많다.

1세대 AI 반도체로는 구글이 자체 개발한 ‘텐서 처리 장치(TPU)’를 대표적으로 꼽을 수 있다. 2016년 처음 공개된 TPU는 일반적인 GPU보다 약 15~30배 이상 연산속도가 빠르다. 때문에 DNN뿐만 아니라 합성곱 신경망(CNN), 순환신경망(RNN) 등 고성능 AI머신러닝 알고리듬 구현 능력도 우수하다. 구글에 따르면 TPU로 AI를 구현할 경우, GPU기반 모델보다 약 30~80배 정도 성능이 우수하다고 한다.

TPU가 GPU의 연산 능력을 압도할 수 있는 비결은 ‘물리적 구조’차이에 있다. GPU의 경우 데이터 연산을 담당하는 수리논리연산장치(ALU)와 사이에 ‘데이터패스(Data path)’라고 하는 통로가 연결돼 있다. 때문에 GPU의 연산 과정은 ‘메모리에서 데이터 받기→GPU로 연산→다시 메모리로 데이터 전송→AI서비스로 구현’ 단계로 진행된다.

반면 TPU는 이 연산 과정에 필요한 수리 논리 연산 장치(ALU) 2개가 딱 붙어있는 구조로 설계됐다. 때문에 연산 과정에서 메모리에 데이터를 적재·로딩하는 과정이 없어, 훨씬 빠른 연산능력 구현이 가능하다. 구글의 ‘딥마인드’와 카카오브레인의 ‘KoGPT’, LG AI리서치의 ‘엑사원’ 등 초거대 AI모델에 TPU가 사용되는 이유도 이 때문이다.

TPU의 라이벌로는 영국의 AI 반도체 전문기업 ‘그래프코어’가 개발한 ‘지능처리장치(IPU)’도 있다. TPU와 마찬가지로 프로세서 내부에 직접 메모리가 탑재된 형태의 AI 반도체다. 때문에 데이터 전달 과정에서 발생하는 연산 지연을 최소화했다.

IPU가 타 AI 반도체와 갖는 차별점은 여러 명령을 동시에 수행할 수 있는 ‘다중 명령 다중 데이터 처리(MIMD)’ 프로세서라는 점이다. 예를 들어 GPU나 TPU의 경우, 100명의 일꾼에게 ‘나무를 잘라라’라는 명령이 가능하다. 반면 IPU는 100명의 일꾼에게 ‘나무를 자른 다음 가구를 만들어라’라는 2가지 명령을 내릴 수 있는 것이다. 그래프코어 측에 따르면 IPU 2세대 모델의 연산 능력은 일반 GPU 대비 600배 높다고 한다.

◇인간의 뇌 모방한 ‘뉴로모픽 반도체’

다만 TPU, IPU 모두 아직 ‘1세대’인 만큼 한계도 있다. 이 반도체 모델들은 한정된 AI알고리듬 모델에서만 최고 성능을 낼 수 있다. TPU 만해도 구글이 개발한 AI모델인 ‘텐서플로우(Tensor Flow)’에 최적화된 반도체다. 때문에 최근엔 어떤 AI모델에서든 적용가능한 AI 반도체 기술이 주목받고 있다. 바로 2세대 AI 반도체로 불리는 ‘뉴로모픽 반도체’다. 인간의 뇌신경을 모방한 회로를 가진 이 반도체는 자체적으로 데이터 저장 및 연산을 수행할 수 있다.

특히 뉴로모픽 반도체는 ‘스파이킹 신경망(SNN)’ 구현을 위해선 필수적이다. SNN은 생물학적 신경망 네트워크 구조를 유사하게 모방한 AI알고리듬이다. AI의 데이터 분석·저장이 동시에 이뤄지기 때문에 DNN이나 CNN 등 기존 인공신경망보다 훨씬 강력한 연산 능력을 보여준다. 연산 장치와 메모리 간 데이터 전송 과정에서 발생하는 전력 손실도 없어, 에너지 효율 측면에서도 타 AI 반도체와 궤를 달리한다. 글로벌 반도체 제조기업 ‘인텔’은 자체 제작한 뉴로모픽 반도체 ‘로이히(Loihi)’로 DNN 기반 AI모델보다 3000배 이상 우수한 데이터 분석 능력을 가진 SNN 기반 AI모델을 만드는데 성공했다. 또 로이히의 전력 소모량은 일반 GPU 대비 109분의 1 수준에 불과하다고 한다.

뉴로모픽 반도체 산업 전망도 밝다. 글로벌 시장조사업체 ‘얼라이드 마켓리서치’는 오는 2030년 뉴로모픽 반도체 산업 규모가 85억 8398만 달러(한화 10조 5462억 원) 규모에 이를 것으로 내다봤다. 연평균 시장 성장률은 무려 79%에 달할 것으로 예상했다.

이런 추세에 맞춰 국내 기업과 연구기관 역시 뉴로모픽 반도체 관련 기술 확보에 열을 올리는 추세다. 대표적 예는 한국과학기술연구원(KIST) 인공뇌융합연구단에서 개발한 디지털 뉴로모픽 시스템 ‘뉴플러스'(Neu+)’이다. 이 반도체는 인간 신경세포인 ‘뉴런’을 모방한 100만 개의 스파이킹 뉴런과 10억 개의 인공 시냅스로 구성돼, SNN 기반 AI 구현에 최적화됐다. 또 삼성전자 종합기술원에서는 지난해 1월 뉴런의 전기 신호를 측정해 뇌 신경망 구조를 구현한 다음 이를 메모리 반도체에 재현하는 기술도 개발했다. 해당 연구 결과는 국제학술지 ‘네이처 일렉트로닉스’에 게재되기도 했다.

완벽해 보이는 뉴로모픽 반도체에도 단점은 있다. 아직 개발 초기 단계인 만큼 기술 성숙도가 낮다는 점이다. 또 현재 사용되는 일반 컴퓨터들엔 적용이 어려워 범용성도 떨어진다.

최민석 한국전자통신연구원(ETRI) 인공지능프로세서연구팀 책임연구원은 “뉴로모픽 반도체는 성능은 GPU나 1세대 AI 반도체보다 월등한 것은 맞지만 아직 기술적인 성숙도가 뛰어나진 않아 학술적 연구에 주로 사용되는 편”이라며 “현재는 TPU 등 1세대 AI 반도체가 뉴로모픽 반도체의 기술 발전과 기존 반도체 성능 향상 단계의 연결고리가 돼주고 있다”고 말했다.

박설민 기자 ainews@chosun.com

다른기사 보기

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

댓글삭제

삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?

댓글수정

댓글 수정은 작성 후 1분내에만 가능합니다.

내 댓글 모음

티티테크오토, 차세대 SW 솔루션 '모션와이즈 스케줄' 출시

딥노이드, 미국영상의학회서 ‘폐암 검진’ 연구 초록 발표

제네시스랩, AI 영상면접 솔루션에 직무역량 평가 기능 추가

3D익스피리언스 플랫폼은 ‘카티아 버전5’와 무엇이 다를까?

[AI융합혁신대학원] 인하대, ‘인천 AI’ 제물포로 집결

[인터뷰] 남상봉 서울교대 교수, AI 시대 작곡을 얘기하다

GIST, ‘실시간 환경 적응 AI’ 개발

“AI 활용 높인다”…연합학습 기반 신약개발 가속화 사업단 출범

그래픽 처리장치서 출발… 이젠 ‘신경회로’ 넘본다

[THE_KAT_2023/Phase_Two_④] 진화하는 인공두뇌, AI 반도체
GPU지나 1세대 AI 반도체 인기, 2세대 ‘뇌신경 모방칩’ 연구도 활발

[THE_KAT_2023/Phase_Two_④] 진화하는 인공두뇌, AI 반도체 GPU지나 1세대 AI 반도체 인기, 2세대 ‘뇌신경 모방칩’ 연구도 활발

[THE_KAT_2023/Phase_Two_④] 진화하는 인공두뇌, AI 반도체
GPU지나 1세대 AI 반도체 인기, 2세대 ‘뇌신경 모방칩’ 연구도 활발