윤기영 한국외국어대 경영학부 미래학 겸임교수, 에프엔에스컨설팅 미래전략연구소장
챗GPT는 거대 인공지능인 GPT-3를 기반으로, 여기에 인간의 피드백을 이용한 자기강화 학습 모델을 더한 것으로 GPT-3.5라고도 한다. 벌써부터 챗GPT를 보고 일반인공지능(Artificial General Intelligence)을 전망하는 전문가도 나타났다. 이 글에서는 챗GPT의 거대 인공지능 개념, 한계 및 미래를 짧게 다루고자 한다. 미래 전망은 3단계 전략시계인 스리 호라이즌(Three Horizons)을 이용했다.
챗GPT는 오픈AI가 2020년 공개한 GPT-3를 기반으로 한다. GPT-3는 ‘Generative Pre-trained Transformer 3’의 줄임말로 우리말로 번역하면 ‘생성 사전학습 트랜스포머 버전 3’를 뜻한다. ‘생성’이란 인공지능을 통해 문자열, 음악, 화면 등을 만든다는 뜻이며, ‘사전학습’이란 인공지능이 학습되어 있어, 여기에 목적에 따라 추가학습이 가능하다는 의미다. 트랜스포머는 인공지능 모델의 하나로 2017년 구글의 논문에 처음 등장했다. ‘3’은 버전 3을 의미한다.
GPT 버전 1에서 버전 3까지 인공지능의 규모가 급격하게 증가했다. 인공지능의 규모는 매개변수의 크기로 가늠한다. 매개변수는 뇌의 시냅스(synapse)에 대응한다. 참고로 인간 뇌의 시냅스는 대략 100조 개에 달한다. GPT-1의 매개변수 규모는 1억1000만 개, 2는 15억 개, 3은 1750억 개다. 현재 개발 중인 GPT-4의 매개변수는 1조 개에 달한다. 초기 GPT-4의 매개변수가 100조 개에 달할 것이라는 전망도 있었으나 데이터의 취합, 컴퓨터 하드웨어의 규모 및 소프트웨어 등이 기술적, 경제적 장애가 될 수밖에 없다.
매개변수가 10억 개가 넘어서면서부터 거대(massive) 인공지능이란 표현이 등장했다. GPT-3의 매개변수가 비약적으로 증가했으므로 이를 초거대(super-large) 인공지능이라고도 한다. 그렇게 되면 GPT-4에 대해서는 초초거대 인공지능이라 부를 수도 있겠다.
챗GPT는 장점도 있으나 한계도 명확하다. 우선 지속적인 학습이 필요하다. 2023년 1월 16일 현재 2021년까지 학습되어 있다. 영어로 질문하면 한국의 2022년 대통령은 알지 못한다고 답한다. 한국에 관한 내용에는 적지 않은 오류가 있다. 이러한 오류를 수정하기 위해 오픈AI 개발자가 피드백하여 수정하지만, 수정항목이 많아질수록 복잡성이 증가할 것으로 보인다. 이는 또 다른 오류와 편향의 원인이 될 수 있다. 답이 진부하며 늘어지기도 한다. 이로 인해 일부 전문가는 챗GPT는 도구가 아니라 장난감에 불과하다고 평가절하하기도 했다.
챗GPT를 화두로 거대 인공지능의 미래를 2035년까지 3단계로 간략하게 전망해 보자. 1단계(호라이즌 1)는 2023년~2024년, 2단계(호라이즌 2)는 2025년~2028년, 3단계(호라이즌 3)는 2029년~2035년으로 했다.
호라이즌 1에서 거대 인공지능 경쟁이 격화될 것이다. 네이버, LG 등도 거대 자연어 인공지능을 개발하고 있으며, 엔비디아는 매개변수 5300억 개에 달하는 자연어 처리 인공지능을 개발했다. 2023년 GPT-4가 공개될 것이라는 전망도 있었으나, 작년 말 오픈AI의 공식적인 입장에 따르면 신뢰성 확보 등으로 공개 일정은 아직 정해지지 않았다고 한다. 호라이즌 2에서 거대 인공지능 기반의 다양한 응용이 개발될 것이다. 현재 오픈AI는 자연어 서술로 그림을 만들어 주는 DALL.E를 공개했는데, 그 이상의 다양한 응용이 폭발적으로 등장할 것으로 전망된다. 앞에서 언급한 거대 자연어 인공지능의 한계와 제약이 크게 문제되지 않는 영역에서부터 응용이 개발될 것이다. 법률 서비스, 의료 자문, 회계 자문 등의 전문 영역에서부터 예약 서비스와 같은 단순 인지 노동까지 개발될 것이다. 호라이즌 3에서는 신경망 알고리즘의 취약점을 극복하는 차세대 인공지능이 등장할 가능성이 있다. 그렇다고 호라이즌 3에 일반인공지능이나 초지능이 등장하지는 않을 것이다. 그 가능성은 매우 낮다.
만약 한국이 거대 인공지능 개발에서 취약점을 보인다면 디지털 주권에 영향을 미칠 것이다. 거대 인공지능의 개발은 데이터, 소프트웨어, 컴퓨터 하드웨어가 융합되어야 가능하다. 융합적, 통합적, 다학제적, 전체적 접근이 한국 사회의 면면부절(綿綿不節)한 전통으로 자리 잡아야 할 때다.