네이버는 24일 진행된 ‘데뷰(DEVIEW) 2016’에서 새로운 기계 번역 방식이 적용된 통역앱 ‘파파고’에 대해 소개했다. 이날 발표는 네이버랩스의 김준석 파파고 리더가 맡았다.
네이버가 개발한 통역앱 파파고에 적용한 NMT(인공신경망 번역, Neural Machine Translation) 방식은 최근 딥러닝 기반으로 주목 받고 있는 기술이다. 기존에 많이 활용되고 있는 SMT(통계 기반 번역, Statistical Machine Translation) 방식보다 진화한 기술로 알려졌다.
자연어처리(NLP) 기술 중 기계번역 기술의 난이도는 높은 편이 아니어서 언어마다 존재하는 다양한 관용구, 신조어, SNS에 등에서 쓰이는 비표준 언어, 중의어 등을 번역하기 힘들었다. 이런 언어들은 기존의 기술이 문자 그대로 충실히 번역하면 번역자 의도와는 관계 없는 우스꽝스런 결과를 산출해내곤 했다.
몇 년 전 SMT 방식을 활용한 번역이 보편적일 때는 이런 문제들은 해결하기 힘든 고질적 문제로 여겨졌다. 하지만 약 3년여 전부터 이런 문제를 해결하고자 SMT 방식의 일부가 딥러닝으로 대체되기 시작했고 네이버가 이번에 전체 번역 과정에 NMT 방식이 적용한 파파고앱을 내놓게 됐다.
NMT 방식은 단어나 몇 개의 단어가 모인 구(phrase) 단위를 학습해 번역하는 SMT 방식과는 달리, 문장 전체의 맥락에서 문장의 구성 요소들을 변환하며 해석해주는 방식을 채택해 정확성을 높였다. 이 방식을 적용하면 문맥 안에서 단어의 순서와 의미 등을 감지해 번역 결과물에 반영할 수 있다.
또 네이버의 파파고 통역앱에는 복합적인 기술이 적용된다. 통역 과정은 인식과정과, 번역과정, 표현과정으로 나뉘는데 각각의 과정에는 음성인식(ASR)·문자인식(OCR)·필기인식(HWR) 기술, 기계번역(MT)기술, 음성합성(TTS)기술이 필요하다. 이날 세션에서 김준석 리더는 “네이버가 필기인식(HWR)기술을 제외하고 전 과정에 필요한 기술들을 자체 보유하고 있었기 때문에 이번 파파고앱의 개발이 가능했다”고 설명했다.
이어 그는 “매뉴얼 제공 업체와의 제휴 등을 통해 관련 데이터를 넘겨받아 매뉴얼에 특화한 번역기를 만드는 작업도 진행 중”이라며 “점차 일반적인 영역의 통번역 외에도, 영역별로 특화된(domain-specific) 번역기를 만들고 잘되면 넓혀나갈 계획을 갖고 있다”고 밝혔다.