기계가 사람처럼 이해하는 MRC 기술 업그레이드
지난 5월 LG AI연구원은 ‘초거대 AI’ 연구를 선언하고 이를 위해 인프라 투자를 아끼지 않겠다는 목표를 밝힌 바 있다.
'초거대 AI'는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습해 종합적이고 자율적으로 사고, 학습, 판단, 행동하는 인간의 뇌 구조를 닮은 AI이다.
3일 LG그룹에 따르면 LG AI 연구원 랭귀지 랩은 최근 MRC(Machine Reading Comprehension) 프로젝트의 연구를 확장하고 있다.
LG 측은 "LG AI연구원 랭귀지 랩은 초거대 AI 연구를 통해 확보한 딥러닝 모델을 이용해 MRC 성능을 지속적으로 개선해 나가고 있다"고 밝혔다.
MRC는 기계가 사람처럼 문서를 읽고, 이해할 수 있게 하는 기술이다. 예를 들어 사람이 주어진 문서에 대해 질문을 하면, 기계가 질문에 대한 정답을 문서에서 찾을 수 있다.
LG AI연구원 랭귀지 랩이 지난해 개발한 한국어 모델은 현재 사람의 독해력을 뛰어넘는 수준의 성능을 기록하고 있다.
또 문서에서 정답을 찾는 MRC 기술을 TV 영상 콘텐츠 검색에 적용한 ‘TV MRC’ 기술도 완성도를 점차 높이고 있다.
기존 TV의 음성 검색은 검색어와 답변을 미리 준비하여 키워드를 매칭하는 방식이기 때문에 데이터베이스에 없는 검색어가 입력될 경우 답변이 불가능했다.
예를 들어 예능 프로그램 명인 ‘나 혼자 산다’를 검색하면 검색이 되지만, ‘혼자 사는 연예인들이 나오는 예능’이라고 프로그램의 내용을 입력하면 답이 나오지 않았다.
하지만 여기에 MRC 기술을 적용하면 TV가 질문의 의미를 이해하여 답을 찾기 때문에 이런 경우에도 정답인 ‘나 혼자 산다’를 찾을 수 있다.
LG 관계자는 "TV MRC 기술은 스마트 TV 사용자의 콘텐츠 관련 궁금증을 바로 해결해 주고, 원하는 콘텐츠를 쉽고 빠르게 찾아줄 수 있다"고 설명했다.
LG AI연구원은 챗봇 성능 개선을 위한 ‘테이블(Table) MRC’ 기술 연구 또한 진행 중이다. 문서에서 중요한 정보가 테이블(표)로 표기된 경우가 많기 때문에 테이블에 포함된 정보를 자연어 질의로 검색하는 기술이다.
MRC 기술은 문서 내에 일반 텍스트 형식으로 표기된 정보는 잘 찾지만 표나 리스트 형식으로 표기된 내용에서 답을 찾는 데는 한계가 있었다. 테이블 MRC는 자연어 질의와 테이블 구조의 관계를 이해해 테이블에서 답을 가져올 수 있게 한다.
한편, LG AI연구원은 글로벌 최신 AI 원천기술을 확보하고 AI 난제 해결 역할을 수행하는 LG의 AI 싱크탱크로 지난해 12월 설립됐다.
세계적인 AI 석학 이홍락 미국 미시간 대학교 교수를 C레벨급 AI 사이언티스트로 영입하고, 서울대, 캐나다 토론토대, 글로벌 AI 연구기관 등과의 협력을 통해 글로벌 AI 생태계 조성에 힘쓰고 있다.