본문 바로가기
Issues

Chat'GPT' vs Google 'Bard' vs Meta 'LLaMa'

by 누름돌 2023. 1. 30.
반응형

아이폰 등장에 비견될 사건으로 불리는 인공지능(AI) 챗봇 ‘챗지피티(ChatGPT)’가 글로벌 돌풍을 일으키고 있다. 2022년 11월 30일 시범 서비스를 처음 출시한 챗지피티가 2달여 만에 이용자가 1억 명을 넘어설 정도로 큰 인기를 누리고 있다. 틱톡이 1억 명에 도달하는 데 9개월, 인스타그램은 2년6개월이 걸렸다는 점을 고려하면 대단히 빠른 속도다. 오는 4월 ‘GPT4’가 출시되면 인공지능 열풍은 폭풍이 될 듯하다. 

 

 

 

 


 

Chat'GPT'란?

 

고도화된 언어 생성 인공지능 기술인 챗지피티는 통상적인 챗봇 수준을 넘어 각 분야의 수준 높은 리포트 작성, 시 짓기, 코딩까지 가능해 ‘아이폰의 등장’에 비견될 만큼 각계에서 화제를 낳고 있다. 챗지피티 개발사인 ‘오픈 에이아이’(Open AI)는 일론 머스크 테슬라 최고경영자(CEO)와 실리콘밸리의 유명투자자 샘 올트먼 등이 공동 설립한 비영리법인이다.

 

 

출처: 한겨레

 

 

생성 인공지능 모델(generative AI)이란 말 그대로 스스로 무언가를 만들어내는 인공지능 모델을 뜻한다. 이용자가 입력한 음성이나 텍스트, 이미지 등을 인식해 의미를 분석하는 ‘인식 모델’에서 한발 더 나아가, 생성 모델은 이용자가 필요로 하는 결과물을 직접 만들어낸다. 여기엔 방대한 양의 데이터를 바탕으로 학습한 기계학습(머신러닝) 알고리즘이 쓰인다.

 

오픈에이아이의 챗지피티는 생성 인공지능 모델, 그 가운데서도 언어 생성 인공지능 모델의 수준을 급속도로 끌어올렸다는 평가를 받는다. 이용자가 입력한 텍스트의 여러 가지 맥락과 조건을 고려해 맞춤형 대답을 내놓는데 특화됐다는 평가가 많다.

 

생성 인공지능 모델의 위협을 가장 크게 느끼는 분야는 단연 검색엔진이다. 현재 검색 시장 규모는 1200억달러 수준이다. 스태티스타에 따르면 2023년 현재 검색 시장 점유율은 구글이 84%로 절대적이고 그다음 MS 빙 8.9%, 야후 2.6%, 얀덱스 1.5%, 덕덕고 0.8%, 바이두 0.6% 순이다.

 

방대한 데이터를 바탕으로 학습한 덕에 뛰어난 검색 능력을 갖춘 챗지피티는 이용자가 질문을 입력하면 정제된 맞춤형 답변을 친근한 대화체로 내놓는다. 반면 검색엔진을 이용해 정보를 찾으려면 키워드를 입력한 뒤 나오는 수많은 자료에 일일이 들어가 개중에 쓸모 있는 것을 이용자가 직접 추려내야 한다.

 

챗봇이 내놓는 정보가 얼마나 믿을 만한지는 논외로 하더라도, 챗봇을 활용하면 정보 습득 방식이 훨씬 간편하고 매끄러워질 것이라는 점은 부인하기 어렵다. 텍스트보다 영상과 이미지에 익숙한 엠제트 (MZ) 세대가 궁금한 걸 검색할 때 구글이나 네이버 검색창 대신 유튜브나 틱톡, 인스타그램 등 을 찾는 것처럼, 앞으로 ‘챗봇 네이티브 ’ 세대가 등장한다면 전통적인 형태의 검색엔진은 설 자리가 사라질 수 있다.

 

다만 아직 데이터 및 언어·논리적 한계로 부정확한 답을 내놓는 등 구글 검색 엔진을 대체할 단계에는 미치지 못한 상태다. 그리고 챗봇을 이용한 논문 표절, 사기 행위, 거짓 정보 유포 등에 대한 우려가 커지고 있다.

 

최근 ‘챗지피티’(ChatGPT)는 서비스 시작 불과 두 달 만에 유료 서비스를 추가했다. 2월 1일부터 월 20달러(2만4000원) 구독 서비스인 ‘챗지피티 플러스’를 시작한다고 밝혔다.

 

오픈에이아이는 챗피티 플러스를 구독하면 더 빠른 응답을 받을 수 있으며, 이용자가 몰리는 시간대에도 일반적인 접속을 할 수 있고, 새로 선보이는 서비스가 있으면 우선적으로 접근할 수 있다고 밝혔다. 챗지피티 플러스는 우선 미국 사용자를 대상으로 시작하고 다른 국가 및 지역에서도 확대할 예정이라고 밝혔다. 다만 기존 챗지피티 서비스는 무료로 계속 이용할 수 있다. 

 

 

 

 Google 'Bard' 그리고 Meta 'LLaMa'

 

챗지피티 등장과 이에 대한 마이크로소프트(MS)의 100억 달러(약12조 4,000억) 추가 투자가 발표됐다. 이어서 MS가 검색 엔진 ‘빙(Bing)’에 대화형 인공지능 기술을 적용한 새 검색 엔진으로 구글의 텃밭인 검색 서비스에 도전장을 던졌다. MS는 웹 브라우저 ‘엣지 브라우저’에도 인공지능 기술을 탑재하고 있다고 밝혔다. MS에 이어 중국의 바이두와 알리바바도 인공지능 챗봇을 다음 달 발표하겠다고 예고하는 등 세계 정보기술 업계는 인공지능 검색 서비스 경쟁을 본격화하고 있다. 물론 네이버·카카오 등 국내 빅테크 기업들도 엘엘엠(LLM·Large Language Model)을 이용한 생성형 인공지능 개발에 박차를 가하고 있다.

 

구글 경영진은 ‘위기 경보’(code red)를 발령하고 즉각 대응하고 있다. 구글은 챗GPT와 본격 경쟁할 ‘바드(Bard)’라는 인공지능을 전격 공개했다. 구글의 바드는 초거대 언어 모델인 LaMDA(Language Model for Dialogue Applications)를 기반으로 하고 있다. 람다는 1370억 개에 달하는 매개 변수로 학습한 인공지능으로 30억 개에 달하는 문서 11억 개에 달하는 대화를 익힌 것으로 알려졌다.

 

순다르 피차이 알파벳(구글) 최고경영자(CEO)는 이 서비스가 2021년까지의 데이터만 학습한 ChatGPT와 달리 웹 정보를 바탕으로 가장 최신의 정보를 제공할 수 있다고 설명했다. 설명대로라면, BardChatGPT보다 정보의 최신성과 신뢰성에서 앞설 가능성이 있다.

 

그리고 연이어 구글에 이어 페이스북 운영사 메타까지 ‘라마(LLaMa.Large Language Model Meta AI)’라는 이름의 대규모 인공지능 언어 모델을 개발자들에게 공개했다. 

 

가장 눈길을 끄는 대목은 라마를 다른 연구자나 엔지니어들이 이용할 수 있도록 ‘오픈소스’로 공개한다는 것이다. 이는 챗지피티 엔진이랄 수 있는 오픈에이아이의 ‘지피티-3.0’과 구글의 ‘람다’는 소스코드가 공개되지 않는 것과 차별되는 지점이다. 

 

라마는 엘엘엠에서 가장 중요한 매개변수(파라미터) 수를 70억개, 130억개, 330억개, 650억개 등으로 나눠서 운영할 수 있다. 이는 오픈에이아이(AI) 지피티-3.0의 매개변수 1750억 개보다는 적은 숫자다.

 

매개변수란 인공지능이 정확한 결과 값을 만들기 위해 계산에 고려해야 하는 다양한 변수(가중치·절편)로, 그 수가 클수록 추론 능력이 향상되고 더 정교한 모델이 된다. 다만, 매개변수는 적은 대신 사용 용량이 다른 모델의 10분의 1 수준이라 스마트폰 같은 개인 단말기에서도 활용도가 높아질 수 있다.

 

 

 

 

챗봇 테마주

 

챗지피티 등 인공지능 챗봇 테마주(14개 종목)는 주로 아래의 기업들이 언급되고 있다.

 

 

출처: 미래에셋증권

 


전문가들 사이에선 생성 인공지능 모델이 인간의 창작 활동을 완전히 대체할 수는 없을 것이라는 의견이 아직 지배적이다. 생성 인공지능 모델이 인간의 창작 활동을 대체하는 게 아니라, 인간과 협업해 창작 활동의 효율성을 끌어올리는 유용한 도구가 될 것이라는 이야기다.

 

그리고 무엇보다 돈이 많이 든다. 수많은 데이터를 학습하고 검색해 맞춤형 콘텐츠를 빠르게 만들어내려면 대규모 컴퓨팅 파워를 갖춰야 하기 때문이다.

 

또한 생성 인공지능 모델이 만들어낸 창작물의 정확도와 윤리성을 높이는 일 또한 숙제다. 챗지피티를 이용해 본 이들은 겉으로 그럴싸해 보이는 문장을 만들어내는 데에는 능하지만, 틀린 정보를 보여주는 경우도 적지 않다고 입을 모은다.

 

 

반응형

댓글