[인터뷰] 정승환 라이언로켓 대표 "20분 목소리 데이터면 누구 목소리든 만들 수 있어요"

입력 2019-11-20 18:00

  • 작게보기

  • 기본크기

  • 크게보기

▲정승환 라이언로켓 대표가 회사에 대해 설명하고 있다. (김정웅 기자 cogito@)

“20분 목소리 데이터만 얻을 수 있으면 하루 정도의 시간 정도로 어느 누구의 목소리든 충분히 만들 수 있습니다”

정승환 라이언로켓 대표(28)의 목소리엔 자신이 묻어났다. 올해 3월 갓 만들어진 직원 4명의 신생 스타트업. 창업 8개월 여 만에 팁스(TIPS, 민간투자 주도형 기술창업지원 프로그램) 운용사로부터 투자받은 스타트업이 될 만큼 견실한 비즈니스모델을 갖춘 데 기인하는 자신감이다.

라이언로켓은 딥러닝 기술에 기반한 TTS(Text to Speech) 음성합성 기술을 가진 스타트업이다. 라이언로켓의 기술은 단순히 텍스트를 목소리로 바꾸는 것이 아니라 특정 인물의 목소리, 말투까지도 완벽에 가깝게 모사할 수 있는 수준이다. 인공지능 기반의 딥러닝 기술이 접목된 덕분이다.

“일반적인 TTS 음성합성 기술로 특정 인물의 목소리를 모사해내려면 몇 십 시간이 걸립니다. 한글로 예를 들면 가, 갸, 거, 겨 … 하는 식으로 그 사람이 내는 모든 패턴의 음성을 다 녹음한뒤 이걸 짜깁는 방식으로 제작되기 때문입니다. 저희는 단 20분만 녹음 데이터만 확보하면 다시 그 인물이 녹음할 필요가 없기 때문에 다른 TTS 기술에 비교해 효율성 측면에서 압도적인 강점이 있습니다.”

현재 라이언로켓의 기술은 개인방송 플랫폼 트위치에서 쓰이고 있다. 라이브 스트리밍을 진행하는 인터넷 방송인에게 시청자가 후원금을 기부(도네이션)를 할 때 ‘VJ특공대’의 성우 목소리, 과거 인기를 끈 프로그램 ‘롤러코스터’의 성우 목소리, 혹은 여러 유명 인터넷 방송인들의 목소리를 송출할 수 있게 해주는 서비스다.

또한 오디오북 등 음성합성 기술이 쓰이는 분야가 점차 늘어날 수 있는 시장성에, 뛰어난 기술력을 인정받은 것이 팁스 운용사인 매쉬업엔젤스로부터 시드투자를 받을 수 있는 원동력이었다.

이 기술이 악용될 소지에 대한 소지에 대해서도 물었다.

정 대표는 “저희는 주로 B2B 사업을 하고 있는데, B2B 계약은 특정한 상황에 한해서만 이 기술을 사용할 수 있게 제한하기 때문에 안전장치가 되 줄 것이라고 보고 있습니다”라면서도 “TTS는 향후 반드시 이용될 기술이기 때문에 오히려 악용될 여지를 막는 것에 대한 새로운 시장이 열릴 것이라고도 생각합니다”라는 역발상의 견해를 내놓기도 했다.

이 대표의 최종 목표는 완벽한 목소리의 재현만이 아니다. 훗날 영상 사업으로까지 진출해 특정 인물의 목소리, 말투, 제스처, 표정, 궁극적으로는 인물의 감성까지도 재현해내는 꿈을 가지고 있다.

“저희는 이 목표를 ‘디지털라이즈 휴먼 아이덴티티’라는 슬로건으로 내세우고 있습니다. 저희 사업이 성공적으로 자리잡는다면, 가까운 미래에는 돌아가신 부모님의 모습도 만나볼 수 있게 되지 않을까 싶습니다.”

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소