Commentary

‘오픈AI’는 검색 왕국 ‘구글’을 몰락시킬 것인가
  • 장새아라 기자
  • 기사입력 2023.01.25 16:53

    [張기자의 해외뉴스 엿보기] 美 ‘포브스’ 보도

    • 필요한 정보를 빠르고 정확하게 검색할 수 있는 능력은 정보화 시대를 살아가는 인간에게 가장 기본이 되는 소양 중 하나일 것이다. 미국의 대표적 빅테크 기업 구글(Google)은 인터넷 검색의 혁명과 진화 속에서 ‘구글 검색 왕국’이라고 불리며 확고하게 시장 자리매김을 해왔다.

      2023년은 ‘검색 전쟁’의 시기다. 단순 키워드 검색에서부터 시작한 검색기술은 이제 대형 언어 모델(LLMs; Large Language Models)을 지나 생성 AI 시스템까지 적용되고 있다. 이런 상황에서 미국 경제 전문지 ‘포브스(Forbes)’는 1월 18일(현지시간)자 기사를 통해 검색 기술의 세대 전환에 대한 분석 기사를 게재했다. 검색 기술의 발전사를 통해 관련 인사이트를 얻을 수 있는 내용으로 여겨져, 그 내용을 아래에 축약, 소개한다.

    • 2020년 2월 28일 폴란드 크라쿠프에서 찍은 이 일러스트레이션 사진에서는 깨진 유리를 통해 구글(Google) 로고가 보인다. /GETTY IMAGES
      ▲ 2020년 2월 28일 폴란드 크라쿠프에서 찍은 이 일러스트레이션 사진에서는 깨진 유리를 통해 구글(Google) 로고가 보인다. /GETTY IMAGES

      ◇검색의 혁명과 진화

      인터넷 시대 이전에는 간단한 질문에 답을 얻기 위해 많은 수고가 필요했다. 지식을 가진 사람에게 직접 물어보거나, 도서관에 가거나, 전화번호부(Yellow Pages)를 사용했다. 인터넷의 등장은 우리 삶의 모든 것을 바꿔 놓았다. 1995년부터 2001년까지 불과 6년 만에 우리는 게시판 시스템(BBS)에서 브라우저로 액세스할 수 있는 웹 사이트로 발전했다. 애그리게이터(Aggregator; 검색포털, 여러 회사의 상품이나 서비스에 대한 정보를 모아 하나의 웹사이트에서 제공하는 인터넷 회사•사이트)와 온라인 디렉터리를 연결하고 검색할 수도 있게 된 것이다. 바로 야후(Yahoo)와 오픈 디렉터리 프로젝트(ODP; Open Directory Project)와 같은 무료 선별 디렉터리 링크가 어떻게 전체 인터넷에서 지배적인 온라인 "옐로우 페이지"가 되었는지 그 변화를 실감했다. 그 후, 원하는 디렉터리로 이동하여 찾고자 하는 자세한 정보가 있는 관련 웹사이트 링크를 찾는 검색 엔진의 시대가 도래했다. 그 당시 야후는 페이지 상단에 검색 창을 추가했으나, 웹페이지는 무겁고 느렸으며 부정확했다.

    • 알타비스타(AltaVista Company)의 사장 겸 CEO인 로드 슈록(Rod Schrock)은 1998년 1월 26일 뉴욕에서 열린 기자 회견에서 요점을 밝혔다. 컴팩 컴퓨터 주식회사(Compaq Computer Corporation)가 완전히 소유한 새로 설립된 자회사인 알타비스타는 마이크로소프트(MS)의 MSN 인터넷 서비스에서 주요 검색 엔진이 됐다. / GETTY IMAGES
      ▲ 알타비스타(AltaVista Company)의 사장 겸 CEO인 로드 슈록(Rod Schrock)은 1998년 1월 26일 뉴욕에서 열린 기자 회견에서 요점을 밝혔다. 컴팩 컴퓨터 주식회사(Compaq Computer Corporation)가 완전히 소유한 새로 설립된 자회사인 알타비스타는 마이크로소프트(MS)의 MSN 인터넷 서비스에서 주요 검색 엔진이 됐다. / GETTY IMAGES

      그 후, 빠르고 관련성 높은 결과를 제공하는 알타비스타(Altavista)라는 간단한 한 줄 검색 인터페이스가 시장을 강타했다. 또한 많은 검색 엔진이 정확성과 적용 범위를 놓고 경쟁했다. 사람들은 원하는 링크를 찾을 수 없을 때 야후, 알타비스타, 빙(Bing)에서 검색했다. 그리고 이러한 검색엔진의 각축장 속에서, 우리는 관련 결과를 신속하고 정확하게 제공하는 구글(Google)로 갈아타기 시작한다.

      ◇'구글 검색 왕국'의 부상

      구글은 1998년 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 캘리포니아 스탠퍼드대에서 박사 과정 중 설립했다. 이들은 검색 품질을 높이기 위해 월드 와이드 웹(World Wide Web) 링크 구조의 힘을 사용한 페이지랭크(PageRank)라는 새로운 유형의 검색 엔진을 개발했다. 이것은 검색 결과를 제공하기 위해 키워드 매칭에 의존했던 알타비스타, 야후와 같은 기존 검색 엔진과 비교했을 때 매우 괄목할만한 발전이었다.

      구글은 빠르게 인기를 얻었고 많은 자금을 유치하여 운영을 확장했다. 이러한 환경 속에서 검색 기술을 전략적으로 개선할 수 있었던 구글은 2000년에 알타비스타, 야후와 같은 경쟁업체를 능가하는 인터넷 최고의 검색 엔진이 됐다.

      2003년 구글은 이미지와 뉴스를 검색하고, 개인의 검색 기록을 기반으로 맞춤 검색 결과를 제시하는 등 여러 가지 새로운 기능을 도입했다. 이러한 기능은 구글이 최고의 검색 엔진으로서의 위치를 확고히 하는 데 도움을 주었고, 이때쯤 구글은 시장에서 독점적인 위치를 차지하게 됐다.

      또한 구글은 2005년에 출시된 구글맵스(Google Maps)와 같은 새로운 제품 및 서비스를 지속해 혁신하고 소개했다. 이 온라인 지도 서비스는 기존 지도 서비스보다 크게 개선되며 사용자들 사이에서 빠르게 인기를 얻었다.

      구글맵스는 위성 이미지, 항공 사진, 거리 수준 이미지를 조합하여 전 세계 위치의 상세하고 정확한 지도를 제공했다. 또한 단계별 내비게이션(turn-by-turn navigation)과 실시간 교통 정보 업데이트와 같은 기능을 제공하여 운전자와 통근자에게 유용한 도구가 됐다.

      온라인 지도 시장에서 구글의 지배력은 2007년 인기 지도 서비스인 웨이즈(Waze)를 인수하면서 더욱 확고해졌다. 이 인수로 구글은 웨이즈의 대규모 사용자 기반, 그리고 크라우드소싱(crowd-sourced) 교통 데이터에 액세스할 수 있게 되었으며, 이를 통해 지도의 정확성과 유용성을 더욱 향상할 수 있었다.

      오늘날 구글맵스는 가장 널리 사용되는 온라인 지도 서비스이며, 시장에서 거의 독점적인 위치를 차지하고 있다. 그들은 경쟁사보다 앞서 나가기 위해 실내 지도와 증강 현실과 같은 혁신적인 새로운 기능을 지속해 도입하고 있다.

      ◇“검색에서 지식 생성으로 - 대형 언어 모델(LLMs; Large Language Models)의 시대”

      구글은 지난 20년 동안 크게 변하지 않았다. 더 많은 기능, 넓은 적용 범위와 함께 조금 더 빨라지는 정도였다. 기본 기능과 사용자 경험은 동일하게 유지됐다.

      그러다가 2022년 챗GPT(ChatGPT)가 패러다임을 다시 바꿨다. 복잡한 질문을 하거나 할 일을 지정하면, 검색엔진은 질문에 대해 완전한 답변을 하거나 지정된 일을 완료할 수 있다. 검색의 결괏값으로 링크를 제공받을 필요가 없어진 것이다. 또한 시스템도 빠르고 신속하다. 거의 실시간으로 답을 얻을 수 있다. 챗GPT의 인터페이스와 사용 편의성 등 관련 전체 경험은 경이롭기까지 한 수준이다.

      오픈AI(OpenAI)는 간단하고 빠르며 유용하다는 점에서 구글을 이겼다고도 볼 수 있다. 심지어 1년 넘게 GPT-3를 사용했던 생성 시스템(generative systems) 전문가들조차 챗GPT의 성능에 감탄했다. 예를 들어, 회사는 표적 발견 및 생성 화학을 위해 생물학 및 화학 플랫폼 모두에서 트랜스포머 모델(transformer)을 사용하고 있으며, 이러한 도구는 산업 전반에서 활용되고 있다. 또한 챗GPT와 공동 저자로 학술 기사를 발간해 복잡한 철학적 문제를 토론하기도 한다. 마이크로소프트(MS)는 현재 오픈AI를 대대적으로 지원하고 있기 때문에, 이것은 시작에 불과할 가능성이 높다.

      ◇'구글 검색 왕국'의 멸망?

      사실, GPT-3의 길을 닦은 트랜스포머 모델 신경망에서, 획기적인 돌파구를 만들어 낸 것은 구글의 과학자였다. 2017년 신경 정보 처리 시스템(NIPS, 나중에 NeurIPS로 개명) 콘퍼런스에서 구글의 과학자들은 "당신에게 필요한 것은 바로 어텐션이다(Attention is all you need)"라는 중요한 논문을 발표했다. 여기서 어텐션(Attention)은 하나의 벡터값이 문장의 모든 정보를 제대로 담지 못해 발생하는 문제를 해결하기 위해 등장한 기술로, 하나의 벡터값에 문장 정보를 모은 다음 보내는 것이 아니라 단어별로 매번 문장의 정보 전부를 보내는 방식이다.

      2023년 1월까지 이 논문은 6만2000회 이상 인용되며 AI 분야에서 많이 인용된 논문 중 하나가 됐다. 그리고 생성 AI 분야의 위대한 과학자 중 한 명인 GAN(생성적 적대 신경망)의 발명가인 이안 굿펠로우(Ian Goodfellow)는 오픈AI에서 일하기 위해 구글을 떠나 애플로 이직했으며, 그 후 구글의 AI 자회사인 딥마인드(DeepMind)로 돌아왔다. 구글 브레인(Google Brain)의 사내 AI 팀과 딥마인드는 트랜스포머에 대한 여러 논문을 발표했으며, 구글은 람다(LaMDA)라는 봇을 출시하기도 했다.

    • 트랜스포머 신경망에 관한 중요 논문의 화면 캡처 /ALEX ZHAVOVONKOV
      ▲ 트랜스포머 신경망에 관한 중요 논문의 화면 캡처 /ALEX ZHAVOVONKOV

      구글의 대형 언어 모델에 대한 집중은 MS와의 새로운 거래와 함께 오픈AI가 시장을 선점할 가능성을 남겼다. 이는 구글에 확실한 경고 신호가 될 것이라는게 시장의 전망이다. 2000년 야후와 마찬가지로 구글은 빠르게 변화하는 스타트업의 속도에 맞추기에는 너무 크고 관료적으로 변화했다. 데미스 허사비스(Demis Hassabis)는 최근 과학 자문위원회 발표를 기반으로 추측한 노벨상 수상과 아이소모르픽(Isomorphic) 연구소를 구축하는 데 집중하는 것으로 보이는데, 딥마인드가 단순히 다른 모든 것을 버리고 사용자 친화적 대형 언어 모델 개발에 집중할 수는 없다. 하지만 우리는 구글이 2023년에 오픈AI에 대응하여 일부 경쟁 도구를 출시할 것으로 예상해볼 수 있다.

      ◇양대 빅테크 기업, 전투 준비 한창

      챗GPT와 MS의 발표로 오픈AI 툴에 대한 인기가 높아지면서, 대형 언어 모델을 전문으로 하는 많은 팀이 순수한 연구에서 신속한 애플리케이션 개발로 전환할 것으로 예상된다. 구글은 검색 엔진, 문서 및 어시스턴트에 GPT 기능을 추가할 가능성이 높다. 또한 애플과 아마존(Amazon)의 새로운 GPT 지원 도구는, 아마존이 클라우드를 통해 GPT 기능으로 전체 AWS 생태계를 활성화할 것으로 기대된다. 이 경주는 트랜스포머 신경망 전쟁에 총알을 공급할 뿐만 아니라, 클라우드 기반 트랜스포머 솔루션을 개발하고 있는 엔비디아(NVIDIA)에도 긍정적일 것이다.

    • 구글 로고를 들고 있는 고릴라의 미드저니 AI 생성 이미지 /ALEX ZHAVORONKOV AND MIDJOURNEY
      ▲ 구글 로고를 들고 있는 고릴라의 미드저니 AI 생성 이미지 /ALEX ZHAVORONKOV AND MIDJOURNEY

      어느 기업이 가장 많은 사용자를 확보하고 1위를 차지하는지 여부와 상관없이 2023년은 모든 산업에서 생성 AI 분야의 멋진 해가 될 것이며, 구글은 전 세계 인구에 대한 더 깊은 기술 침투로 인해 전반적으로 승리할 가능성이 높아 보인다.

      ◇”생성 AI는 출판 기업에 다가 온 큰 기회”

      거의 모든 AI 회사가 벤처 투자가에게 듣는 질문은 “당신은 얼마나 많은 독점 데이터를 가지고 있느냐?”는 것이다. 챗GPT는 위키피디아(Wikipedia) 및 서적 저장소와 같이 공개적으로 사용 가능한 데이터에 대해서는 학습된 알고리듬의 힘을 보여주었지만, 일부 특정 지식과 관련된 문의에 대해서는 정확한 응답을 생성하지 못하는 경우가 많다. 이것은 논문 등을 출판하는 기업에게 큰 기회를 제공할 것으로 보인다.

      예를 들어 홀츠브링크 출판(Holtzbrinck Publishing) 그룹은 네이처(Nature), 엘스비어(Elsevier) 등을 소유하고 있다. 이 출판사는 수백만 개의 전문 과학 기사 및 서적에 대한 저작권을 소유한다. 이러한 독점 텍스트는 훨씬 더 가치 있게 됐다. 우리는 마침내 의료 분야에서도 데이터 경제의 시대에 접어들고 있으며, 이러한 출판사가 생성된 콘텐츠의 출처를 추적하고 독점 데이터에 대한 새로운 라이센스 모델을 발명할 수 있는 도구를 개발할 것으로 예상된다. 빅 테크 기업이 이같은 출판사를 인수한다고 하더라도 이는 놀라운 광경이 아니다.

    • 상하이 주식 시장 가격 표시 디스플레이 /GETTY IMAGES
      ▲ 상하이 주식 시장 가격 표시 디스플레이 /GETTY IMAGES

      ◇“중국 AI 기술, 서구와 분리돼 진화할 것”

      집중해서 보아야 할 것은 중국이다. 14억 명이 넘는 인구의 중국은 엄청난 양의 데이터를 생성한다. 그리고 구글은 서양과 동일한 방식으로는 이 데이터에 접근할 수 없다. 텐센트(Tencent), 바이두(Baidu), 알리바바(Alibaba) 등 중국의 대규모 기술 업체는 대형 언어 모델을 연구해 자체 도구를 개발하고 있다. 중국 고유한 데이터가 풍부한데다, 서구의 공공 데이터까지 가용할 수 있다. 중국 기업들은 매우 정교한 지식 생성 도구를 개발하고 전 세계적인 AI 시장에서 경쟁력을 가질 수 있으리라는 예상도 내 놓을 수 있다. 포브스의 관련 기사 원문은 링크를 통해 볼 수 있다.

    최신 뉴스

    더보기