인공지능(AI) 챗봇 ‘이루다’에 쓰인 개인정보가 제대로 익명화(비식별화)되지 않았다는 의혹이 제기된 가운데 개인정보보호위원회(개인정보위)가 위법 여부를 밝혀내기 위한 사전 조사에 착수했다.
성희롱 및 차별ㆍ혐오 표현 논란을 일으킨 이루다는 11일 개인정보 유출 의혹까지 받고 있다.
애플리케이션(앱)에서 수집된 개인 간 카카오톡 대화 내용이 이루다에 입력됐는데, 데이터에 포함돼 있던 이용자들의 이름·주소 등이 걸러지지 않고 노출되고 있다는 지적이 나온 것이다.
개발사인 스캐터랩은 이루다가 실제 사람처럼 대화할 수 있도록 방대한 대화 데이터를 입력해 딥러닝 방식으로 학습시켰다. 이 같은 학습을 위해 업체는 실제 연인들 간 대화 데이터를 활용했다. 기존에 이 업체가 서비스했던 ‘연애의 과학’ 앱을 통해 수집한 데이터였다.
‘연애의 과학’은 연인과 나눈 카카오톡 대화를 입력하면 상대방의 감정을 분석해주는 서비스도 제공했다. 연인 또는 호감 가는 사람과 나눈 카카오톡 대화를 넣고, 소액을 결제를 하면 답장 시간 등의 대화 패턴을 분석해 애정도 수치를 보여 준다. 이 앱은 구글 플레이스토어에서만 약 10만 명이 넘게 다운로드 받았다.
현재 이루다에서는 이루다가 갑자기 동호수까지 포함된 주소 등을 말하는 사례가 발견되고 있다. 사용자들은 누군가의 실명으로 보이는 이름을 말하거나, 옛날 애인 애칭을 집어넣자 그 애인 말투로 이루다가 말하는 모습도 발견됐다고 전했다.
연애의 과학 이용자들은 오픈채팅방을 만들어 집단 소송을 준비하자며 자료를 수집하고 있다. 이용자들은 해당 데이터가 AI 챗봇에 활용된다는 점을 고지받지 못했다고 분개했다.
이 같은 논란이 일자 개인정보위는 개인정보보호법에 따라 사실관계를 파악한 뒤 위법 여부가 드러날 시 조사 절차에 따라 공식 조사에 돌입할 것이라고 밝혔다. 개인정보위 관계자는 “스캐터랩 측에 자료 요청을 하려고 준비하고 있다”고 말했다.
앞서 개인정보위는 페이스북, LG유플러스 등을 대상으로 개인정보 보호 규정 위반 책임을 물어 과징금과 과태료를 부과했다.
논란이 일자 스캐터랩 측은 연애의 과학 앱 내 공지에서 “이루다는 개인정보취급방침의 범위 내에서 (연애의 과학 이용자들의 데이터를) 활용했다”며 “그럼에도 연애의 과학 사용자들이 이 점을 명확히 인지할 수 있도록 구체적으로 고지하지 못했다”고 사과했다.
이어 “데이터에서 개인을 특정할 수 있는 정보는 알고리즘을 통해 제거했다”고 밝혔다.