“챗GPT는 인간처럼 텍스트를 생성할 수 있습니다.”
눈치채셨나요? 이 문장은 챗GPT가 자신을 한 문장으로 소개한 겁니다. 한국어에 최적화돼 있지 있지만 이투데이 기자가 독자들을 위해 다듬었습니다. 본래 조사 등이 조금 어색했지만, 내용은 자연스웠죠. GPT(Generative Pre-trained Transformer)는 ‘생성적 사전 학습 변환기’라는 뜻인데요. 딥러닝을 이용해 마치 사람처럼 자연스러운 문장을 생성하고 추론하는 것이 특징입니다.
초기 모델인 GPT-1은 2018년 개발됐습니다. 이후 세 차례 업그레이드를 거쳐 출시된 GPT-3.5가 화제의 ‘챗GPT’이죠. 대화는 한층 자연스러워졌습니다. 이에 구글, 메타, 마이크로소프트 등 전 세계 정보기술(IT)기업은 촉각을 곤두세우고 있는데요. 특히 전 세계 검색엔진 서비스 업체는 대응에 총력을 다하고 있죠.
지난달 31일(현지시간) 미국 경제 매체 CNBC방송에 따르면 구글은 자사 AI 언어 모델 ‘람다(LaMDA)’를 활용한 새 AI 챗봇 ‘견습 시인’의 본격 테스트에 돌입했습니다. 윤리적 타당성 검토 절차를 단축하는 ‘녹색 차선(green lane)’ 제도 도입도 검토 중이죠. 모회사 알파벳의 최고경영자(CEO) 순다르 피차이는 이르면 수주 내에 AI 기반 광범위한 언어를 사용하는 프로그램을 출시하겠다고 밝혔습니다. 메타 역시 AI 관련 내부 승인 절차를 간략하게 하기 위한 논의를 시작했습니다.
중국 최대 검색 엔진 업체 바이두는 3월 중으로 챗GPT와 유사한 AI 챗봇을 출시할 예정으로 알려졌습니다. 네이버도 올해 상반기 새로운 검색 서비스 ‘서치 GPT’를 선보이겠다고 발표했습니다.
이런 와중에 1일(현지시간) 오픈AI는 유료 버전인 ‘챗GPT 플러스’ 출시를 예고했습니다. 월 20달러(약 2만4000원)을 내면 사용자가 몰리는 시간에도 챗봇 이용이 가능하고, 질문에 더 빠른 답을 받을 수 있는데요. 무료로 챗GPT를 사용해 본 이용자들은 “구매하지 않을 이유가 없다”고 말합니다.
챗GPT가 실제 사람의 업무를 대체할 수도 있을까요. 미국 워싱턴포스트(WP)는 실제 업무에서 챗GPT를 활용할 수 있을지 분야를 나눠 시험해 봤는데요. WP의 총평은 “도움이 되었지만 때로는 직접 하는 게 낫다”는 것이었습니다. 오류나 표절, 지나치게 장황한 표현 때문에 실생활에서 이용하기 부적합하다는 거죠.
WP의 실험에서 챗GPT는 우선 “오늘 어때?”라는 직장 동료의 메시지에 대개 “물어봐 줘서 고맙습니다! 저는 오늘 괜찮습니다, 문의 주셔서 감사합니다”라고 답했습니다. 질문의 의도를 파악하지 못하면 때론 장황한 답이 이어지기도 했습니다.
챗GPT에서 새로운 아이디어를 얻어가는 건 어려울 것으로 보입니다. 챗봇이 내놓은 결과물의 표절 여부를 확인할 수 없기 때문입니다. 제이콥 안드레아스 메사추세츠공대(MIT) 컴퓨터과학 및 AI 연구소 조교수는 WP와 인터뷰에서 “내 연구물에 대한 아이디어를 개발하도록 유도했을 때 챗GPT가 표절한 건 확실해 보였다”고 설명했습니다.
챗GPT는 까다로운 대화 상황에서도 제법 잘 작동했습니다. ‘흥분한 어조’를 지정하자 캐주얼한 표현과 느낌표를 포함한 답변이 출력됐죠. 동료와 갈등 상황을 가정했을 때는 “당신을 이해한다”며 부드럽게 말을 시작하기도 했습니다. 다만 회사의 해고 이유를 묻자 “현재의 경제 동향과 코로나19 팬데믹의 영향”에 대해 답변하는 등 논점에서 벗어난 문장이 나오기도 했습니다.
2021년까지의 정보만을 텍스트 생성에 이용한다는 것도 한계점입니다. 2022년 이후의 정보는 등록되어 있지 않아 날씨를 묻는 간단한 질문에도 답변하지 못합니다.
챗GPT는 IT업계를 넘어 학계, 예술계, 교육계, 법조계 다방면에 충격을 안기고 있습니다. 업무 중 문서 작성을 맡기거나 간단한 자문을 구할 때는 AI 챗봇을 활용하게 될 거라며 업무 지형의 대대적 변화를 예측하는 의견도 나오는데요.
세계적인 작가 겸 역사학자 유발 하라리는 대표작 ‘사피엔스’의 출간 10주년 기념 특별 서문을 챗GPT에 맡겼는데, 챗GPT는 ‘하라리처럼 쓰라’는 주문까지 완벽하게 소화했습니다. 하라리는 “글을 읽는 동안 충격으로 입을 다물지 못했다”고 말했죠.
실제로 챗GPT는 데이터를 활용해 빠른 속도로 시나 단편 소설, 게임 시나리오 등을 창작해냅니다. 의학 면허 시험, 대학 리포트, 로스쿨 시험 등에서도 유의미한 성적을 내고 있죠. 2일(현지시간) 콜롬비아의 한 판사는 챗GPT를 활용해 판결문을 작성했다고 밝혀 논란이 일기도 했습니다.
물론 비판적인 시각도 존재합니다. 챗GPT의 결과물은 결국 ‘데이터 짜깁기’에 불과하다는 건데요. 언어학자 놈 촘스키 MIT 명예교수는 “챗GPT는 첨단 기술 표절 시스템”이라고 일축했습니다. 그는 지난달 21일 교육 관련 유튜브 ‘에듀키친’에 출연해 챗GPT에 대해 “천문학적인 양의 데이터와 규칙성, 문자열 등에 기반해 문장을 만들 뿐”이라며 “언어, 인지, 인간 이해와 관련해서 가치가 없다”고 평가했습니다.
촘스키는 챗GPT의 등장으로 인문학과 사회과학 등 글쓰기에 기반한 학문에서 표절이 빈번해질 것을 우려했는데요. 챗GPT 열풍과 함께 그림, 음악, 단편 소설 등을 창작하는 ‘생성 AI’가 주목받고 있는 만큼, 전문가들은 저작권과 표절에 대한 논의가 이뤄져야 한다고 조언합니다.
이러한 우려를 인지한 오픈AI도 지난달 31일(현지시간) ‘AI 텍스트 분류기’를 공개했는데요. 검토하고 싶은 글을 입력하면 AI가 작성했는지를 판별해 ‘매우 낮음’부터 ‘꽤 높음’의 5단계로 나눠 알려줍니다. 하지만 오픈AI 자체 테스트 결과, AI가 작성한 텍스트 중 26%만을 ‘가능성 높음’으로 분류했으며 사람이 쓴 글의 약 9%는 AI가 쓴 것으로 잘못 판정했습니다.