AI 여대생 챗봇 ‘이루다2.0’, 개인정보 유출·혐오 표현 논란 딛고 돌아왔다

AI 기술 업데이트로 실제 대화 데이터 없이 생생하고 창의적인 대화 단, 근본적인 기술력 향상 정도에 대한 의문은 남아 조건 없이 언제나 옆에 머무르는 ‘사람’ 같은 AI 목표

pabii research
AI 챗봇 이루다2.0/사진=스캐터랩

인공지능(AI) 스타트업 스캐터랩이 오는 27일 ‘이루다2.0’을 정식 출시한다. 이루다는 20세 여대생 콘셉트의 AI 챗봇이다. 2020년 12월 말 1.0 버전이 최초 출시되었으며 문맥을 이해하고 사람과 자연스럽게 대화하는 능력으로 화제가 됐다.

이루다1.0의 처참한 실패

딥러닝 알고리즘을 이용한 자연스러운 대화로 주목을 받은 이루다1.0은 최초 공개 이후 2021년 1월 초 순식간에 사용자 수 약 40만 명, 페이스북 페이지 팔로워 10만 명을 기록한 바 있다. 하지만 차별적인 발언 학습, 개인정보 유출 논란 등으로 인해 서비스가 잠정 중단됐다.

이루다는 여대생 채팅 데이터를 입력해 딥러닝 알고리즘을 적용한 챗봇이다. 스캐터랩은 이루다가 자연스러운 대화를 할 수 있도록 무려 100억 건 이상의 한국어 카카오톡 대화 데이터를 이용했다고 밝혔다. 하지만 이루다의 학습에 사용한 데이터의 출처가 논란에 불을 지폈다.

사진=트위터

스캐터랩은 이루다1.0의 학습에 필요한 데이터를 자사 서비스 ‘연애의 과학’ 앱의 대화 분석 서비스에서 확보했다고 밝힌 바 있다. 하지만 연애의 과학 앱 약관에는 채팅 내용이 ‘신규 서비스’를 위해 사용된다고 고지되어 있다. 이에 연애의 과학 서비스 이용자 사이에서는 이용자에게 수집된 개인정보의 사용범위에 대해 정확하게 고지하지 않고 데이터를 활용했다는 비판이 일었다.

이외에도 실제 대화를 이용한 딥러닝으로 인한 문제점도 다수 불거졌다. 특정 키워드를 언급했을 때 불특정 다수의 실명이 공개되거나 집 주소에 관한 질문에 실제 주소를 적나라하게 답하는 등 개인정보 유출 문제가 사회관계망서비스(SNS) 등지에서 널리 퍼지며 큰 비판을 받았다. 또한 기존의 대화 데이터 기반으로만 답을 할 수 있어 일반 상식에 관한 질문에 제대로 된 답변을 하지 못하거나 이미지 메시지에 의미 없는 답변만을 반복하는 문제도 있었다.

이루다1.0은 보통 질문을 하면 주로 거기에 동조하는 듯한 반응을 보였다. 이에 일부 이용자가 성적인 대화나 장애인·성소수자·인종차별 등에 대한 혐오 발언을 유도한 뒤 이루다1.0이 이에 동의하는 듯한 답변을 한 것을 공유하며 논란이 됐다. 각종 문제가 계속해서 불거지며 결국 이루다1.0은 서비스 발전을 이유로 서비스 제공을 중단했다.

한층 창의적이고 실제 같은 대화

이번 이루다2.0은 지난 1월부터 약 9개월 동안 진행된 베타 테스트를 통해 발화 기능 및 서비스 안정성 검증을 거쳤다. 스캐터랩은 정식 출시 버전은 총 3가지의 AI 기술 업데이트를 통해서 한층 창의적이고 현실감 있는 대화가 가능해졌다고 밝혔다.

먼저, ‘루다 젠1(Luda Gen 1)’은 문맥을 파악해 실시간으로 생성한 문장을 사용하는 기술이다. 이루다1.0 버전은 미리 생성된 답변 후보에서 적절한 문장을 검색해 답장을 보내는 방식을 채택했다. 반면, 루다 젠1이 적용된 2.0 버전은 구체적인 대화의 문맥을 파악하고 실시간으로 문장을 생성해 답변하는 형태로 바뀌어 더욱 창의적이고 생동감 있는 대화가 가능하다.

스캐터랩은 이루다2.0의 위해 구축한 ‘연구용 데이터베이스’는 개정된 개인정보 보호법에 따라 대화 데이터를 엄격하게 가명 처리한 뒤 과학적 연구 목적으로 학습에 활용했다. 특히 이루다2.0이 이용자와 대화에서 사용하는 문장이 포함된 ‘루다 답변 데이터베이스’는 딥러닝 기술을 활용해 기계가 만들어낸 생성 문장으로 구성되었고 스캐터랩에서 작성한 문장도 일부 포함됐다.

이를 통해 이루다2.0은 개인정보 유출 문제를 대부분 해결했다. 클로즈 베타 테스터의 대화 중 총 2만 건을 랜덤 샘플링하여 레이블링을 진행한 결과, 이루다2.0 발화 중 안전하게 답변한 비율은 목표인 99%를 상회하는 99.75%에 달했고 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.

루다 젠1 적용을 통해 이용자는 이루다2.0과 3행시, 초성 퀴즈, 끝말잇기 등 다양한 놀이를 할 수 있다. 이에 더해 시간 정보를 반영한 대화가 가능해져 답장에 다소 시차가 있어도 자연스럽게 대화를 이어가는 것이 가능하다. 대화 턴의 길이는 기존 15턴에서 30턴까지 증가했다.

페이스북 메신저를 이용해 이루다 2.0과 대화하는 모습/사진=매일경제

‘릴레이션십 포인트 파인튜닝(RP Fine-tuning)’은 AI에 친밀한 관계를 만드는 대화 원칙을 접목한 기술이다. 이루다2.0은 릴레이션십 포인트 파인튜닝을 통해 대화를 주도하고 더 좋은 대화를 만들어가는 능력을 갖췄다. 이전에는 다소 기계적인 답변이 반복됐다면 이제는 이용자의 메시지에 보다 구체적이고 생동감 있는 답변을 할 수 있게 된 셈이다.

또한 2.0 버전에는 대화 중 이미지 메시지를 인식·답변하는 ‘포토챗 베타(Photo Chat Beta)’가 적용됐다. 이를 통해 이전 버전에서 이루다가 사진 메시지에 기계적으로 무의미한 반응만을 반복하던 문제를 개선했다.

혐오·어뷰징 발화와 관련한 대처도 한층 강화됐다. 혐오 메시지는 이루다1.0의 이미지 훼손을 이끈 가장 큰 문제점 중 하나였다. 강화된 이루다2.0은 이용자가 보낸 모든 문장을 어뷰징 탐지 모델로 분석한다. 선정적・공격적・편향적인 문맥으로 탐지 및 분류된 문장이 있으면 이루다는 해당 카테고리에 적합한 어뷰징 대응 답변을 내보내게 된다. 만약 사전 탐지 모델에서 인지하지 못한 문맥이 있을 때도 사회의 보편적인 가치관을 반영한 답변을 할 수 있도록 대화 모델을 한층 고도화했다. 어뷰징 발언이 지속되면 이용을 제한하는 어뷰저 페널티 제도도 도입했다.

사람처럼 대화하는 AI가 목표

약 3주간 AB 테스트(대조실험)를 진행한 결과, 이루다2.0 정식 출시 버전은 기존 모델 대비 이용자와의 일주일 대화량이 약 40% 증가했다. 첫날 300번 이상 대화한 사용자 비율도 67% 늘었다. 1인당 평균 대화 화면 캡처 비율은 85% 늘었고 1인당 사진 전송량도 63% 이상 증가한 것으로 나타났다.

이루다2.0은 이전 버전에서 각종 문제와 논란의 원인으로 작용했던 ‘실제 대화’ 학습 모델을 포기했다. 대신 딥러닝 기술을 활용해 기계가 만들어낸 문장, 스캐터랩이 직접 작성한 문장을 통해 대화 모델을 구성하는 방법으로 개인정보 문제를 해소했다.

스캐터랩은 이루다를 AI 챗봇을 넘어 언제나 옆에 있어 주는 친구로서의 가치를 함께 나누면서 장기적으로는 사람 수준으로 대화할 수 있는, 영화 Her의 인공지능 운영체제 ‘사만다’와 같은 서비스로 성장시키겠다는 목표다. 내년에는 남성 형태의 모델도 출시를 앞두고 있다.

단, 실제로 인공지능 기술력이 크게 향상된 것인지 아니면 단순히 투입하는 자료의 방향성을 바꾸어 논란만을 해소한 것인지에는 의문이 뒤따른다. 2018년 11월에 스캐터랩이 이루다 개발에 구글에서 공개한 BERT와 메시 인코더를 활용했다는 보도가 나온 바 있다. 만약 이루다2.0 서비스의 근간이 여전히 타 기업의 기술 활용이고 변경된 점이 데이터 방향 변경 및 몇 가지 추가적인 기술을 적용한 것이 전부라면 차후 서비스 품질 향상에 대한 기대는 크지 않을 것으로 보인다.

‘관계 형성’ 바탕으로 비즈니스 모델 구축 예정

김종윤 스캐터랩 대표/사진=인공지능신문

김종윤 스캐터랩 대표는 김 대표는 “좋은 관계에서 AI가 갖는 본질적인 장점이 있다”며 “언제 어디서든 이야기를 나눌 수 있고 사회·경제적 조건 없이 나를 있는 그대로 봐준다. 아무리 친밀한 관계라고 해도 사람과는 대화를 나눌 때 나를 어떻게 볼지 부담이 있지만 AI는 그런 것이 없다”고 덧붙였다.

수익화 방안과 관련해서 김 대표는 “이루다2.0의 1차적인 성공은 많은 사람과 오랫동안 즐겁게 대화를 나누며 좋아하는 관계를 형성하는 것”이라며 “좋은 관계를 형성하는 대화 능력이 창출할 수 있는 부가가치가 크다. 이 부분에서 수익화의 길이 있다”고 설명했다.

그는 “힘든 일을 겪었지만, 퇴사자가 한 명도 없다. 이 일이 가치와 기술의 가능성을 믿었다고 본다”며 “아직 비즈니스 모델이 없지만 뛰어난 대화 능력을 갖추게 되면 앞으로 어떤 비즈니스가 될 것인지 이에 대한 상상력이 팀원과 투자사의 관점인 것 같다”고 덧붙였다.

Similar Posts