[칼럼] AI의 이미지 생성 능력과 예술적 창의성

<사이보그 퀸>, 김상민 via DALL-E 2 /중앙대학교 인문콘텐츠연구소

2022년 8월 미국 콜로라도주 주최의 예술 공모전 디지털 예술 부문에서 사람이 아닌 AI가 생성한 이미지를 리터칭한 작품이 우승했다. 이후 아티스트는 수상 사실을 소셜미디어를 통해 알렸는데, 대중들의 반응은 그의 의도와는 무관하게 예술에 대한 논쟁으로까지 이어졌다. AI가 만든 작품을 예술이라고 부를 수 있는지, 그것을 공모전에 출품해도 되는지, AI의 예술적 가치를 인정하고 상을 수여할 수 있는지 등 다양한 질문들이 쏟아졌다. 물론 게임 디자이너인 아티스트는 모든 과정을 AI가 생성한 작품을 제출한 것이 아니고 자신의 이름 뒤에 “via Midjourney”라고 명확하게 자신이 사용한 AI 툴의 명칭을 표기해놓았으며 이 사실을 공모전 제출 시 공식적으로 언급했기에 수상에 전혀 문제가 없다고 주장했다.

최근 몇 년에 걸쳐 AI는 여러 다양한 분야에서 인간 고유한 능력이라 여겨져 온 것들을 뛰어넘고 있다고 간주한다. 계산과 분석은 물론이고 사유와 인지, 예술과 창작에 이르기까지 AI는 탁월함을 보여주고 있다. 이러한 AI의 일취월장하는 능력 앞에 과연 인간의 고유한 능력이라고 부를 만한 것이 이제는 남아있을지 모를 일이다. 예술적 창작이라고 한다면 창의적 글쓰기(writing), 음악 작곡과 이미지 제작을 대표적으로 들 수 있겠는데, AI에 의한 시의 창작이나 대중음악의 작곡은 이제 그리 놀라운 일이 아니다. AI의 알고리즘을 사용하면 이미 신문 기사 작성이나 소설의 집필이 손쉽게 가능하고 특정한 예술가의 스타일을 흉내 낸 음악의 작곡과 시각 이미지의 제작도 전혀 어려운 일이 아니다.

앞의 아티스트가 사용한 미드저니 AI 알고리즘은 우리가 원하는 이미지의 형식, 스타일, 그리고 이미지에 대한 묘사나 키워드 등을 텍스트로 입력하면 그에 대한 결과물을 네 가지 스케치화 된 이미지로 보여준다. 이 네 가지 이미지 중에서 원하는 것은 해상도를 높여 업스케일(upscale)할 수도 있고 변화(variations)를 주어 조금 다른 결과물을 더 요청할 수도 있다. 또 이렇게 해서 나온 결과물에 변화를 더 주거나 최대한으로 업스케일하는 것도 가능하다. 이처럼 처음의 스케치처럼 제시된 이미지 중에서 우리가 원하는 이미지를 골라 변형시키고 해상도를 높여가면서 계속 새롭고 정교한 이미지들로 만들어 나갈 수 있는 것이다.

또 다른 이미지 발생 AI 알고리즘인 달리(DALL-E) 또한 거의 유사한 방식으로 이미지를 만들어 내고 변화시키며 또 일부 이미지의 위치를 수정할 수 있다. 기존의 이미지, 예컨대 실존 인물의 사진을 텍스트 대신 입력하고 그에 걸맞은 예술 표현의 스타일을 부여할 수도 있다. 이와 유사하지만 다소 단순한 형태의 AI 이미지 알고리즘으로는 한 때 소셜미디어를 통해 유행하기도 했던 포트레이트 AI를 들 수도 있다. 셀피 인물 사진을 업로드하면 과거 18세기 서양 회화에 등장했을 법한 인물의 이미지로 변형시키는 것이다. 이 이외에도 여러 AI 이미지 생성 알고리즘이 있지만 대표적으로 달리와 미드저니의 텍스트 입력을 통한 이미지 생성이 현재 가장 활성화되어 있고 높은 수준의 결과물을 제공하는 것으로 보인다.

이러한 이미지 생성 알고리즘에 입력하는 텍스트 묘사는 그것이 실존하는 사물이든 아니든 상관없다. 알고리즘은 그저 그 입력된 텍스트에 기반해 그럴듯한 이미지를 생성해낸다. 예컨대 직접 달리에 ‘A futuristic neon lit cyborg face queen, cinematic’이라고 입력했더니 비록 그 대상이 실존하는 것이 아니라 해도 아래와 같은 결과물을 내놓았다. 설명문에 조금씩 변화를 주거나 이미지 스타일에 관련되는 단어를 입력하면 그에 걸맞은 방식으로 색다른, 전혀 예상치 못했을 수도 있는 결과물을 내놓을 것이다.

사태가 이러하다 보니, 순수 예술 창작자들을 포함해 상업적 광고나 홍보물, 웹 등에 들어가는 이미지를 제작하는 디자이너들도 이와 같은 AI를 사용해 손쉽게 원하는 이미지들을 상당한 퀄리티로 만들어 내는 데 도움을 얻는다. 게다가 종종 우리가 전혀 예상치 못한 이미지들을 생성하기도 하므로 이미지 생성 AI는 그야말로 누구도 생각하거나 상상하지 못한 이미지들을 제작해내는 데 유용하다. 그런데 이렇게 ‘누구도 생각하거나 상상하지 못한 이미지들을 제작’하는 AI의 능력은 우리가 흔히 예술가의 창의적 능력, 창의성과 상상력에 비견할 수 있을까? 불과 몇 초 만에 뚝딱, 내가 상상한 뭔가 그럴듯한 이미지들을 생성해내는 것도 놀랍지만, 내가 상상조차 하지 못했던 이미지들이 튀어나올 때는 AI가 마치 예술가적 창의성을 지니고 있는 듯 생각지 않을 이유가 없는 것이다.

그러나 과연 우리가 이런 놀라운 결과들에 기반해 AI가 창의적이라고 말할 수 있는 근거는 무엇일까? 달리 2는 CLIP이라는 자연어 처리 과정을 통해 입력된 텍스트로부터 어떤 특징들을 찾아내고 확산모델(diffusion model) 신경망을 이용해 입력된 텍스트를 만족시키는 이미지를 생성해 낸다. 이 과정은 궁극적으로는 우리가 입력한 텍스트를 우리가 생각하고 상상할 것으로 판단되는 이미지로 대체할 수 있도록 만든 매우 복잡한 알고리즘들의 조합이다. 창의적인 것은 사실 AI에 있다기보다는 AI가 새로운 시도를 해보도록 만드는 독창적인 인간적 언어의 사용과 상상에 있는 것은 아닐까?

발 빠른 몇몇 기업들은 이미지 생성 AI에 어떤 텍스트를 입력했을 때 보다 더 창의적이고 새로운 이미지 결과물을 얻을 수 있는지 잘 아는 이들을 직원으로 채용하려고 한다는 소식이 들린다. 그리고 우리나라 웹툰 산업에서도 이러한 종류의 AI를 활용해 기존의 웹툰 캐릭터를 변형하고는 마치 새로운 캐릭터인 것처럼 도용하는 경우도 발생하고 있다고 한다. AI의 이미지 생성 및 변형 능력은 특이하고 예측을 벗어나는 경우를 종종 빚어내지만, 이를 반드시 예술적 창의력을 갖춘 것으로 보기는 어렵다. AI가 창의력을 갖추었다기보다는 우리가 이러한 도구들을 사용하는 과정에서 창의력을 발휘할 더 많은 기회가 생겨난다고 볼 수 있지 않을까? AI의 창의력을 이야기하기 위해서는 아마도 우리 인간의 것과는 전혀 다른 측면에서 설명해내어야 할 것이다. 그것은 여전히 남아있는 과제다.

김상민 (연세대학교 커뮤니케이션대학원 강사)

다른기사 보기

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

댓글삭제

삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?

댓글수정

댓글 수정은 작성 후 1분내에만 가능합니다.

내 댓글 모음

[인터뷰] 남상봉 서울교대 교수, AI 시대 작곡을 얘기하다

GIST, ‘실시간 환경 적응 AI’ 개발

“AI 활용 높인다”…연합학습 기반 신약개발 가속화 사업단 출범

“EU AI법 너무 포괄적, 국내 기업 대응은 필요”

[더AI 현장] “멀티모달 AI가 트렌드”…국내서 처음 열린 ‘ICASSP2024’ 가보니

“다쏘시스템 ‘카티아’씨, AI 옷 입고 가실게요”

마이크로소프트, AI 기회의 땅 중동에 2조 원 투자

이성환 고려대 교수, 세계 권위 학회 ICASSP서 ‘BTS’를 외치다

[칼럼] AI의 이미지 생성 능력과 예술적 창의성