[해외DS] AI 소믈리에, 병 안 따고도 와인 맛본다

‘AI 소믈리에’ 개발, 맥주 및 와인 산업에 새로운 바람 불러올 것이란 기대 높아 테스트 결과 사람은 인공지능이 작성한 리뷰와 사람의 리뷰를 구분하지 못했다 AI에는 명과 암 동시에 존재해, 여론 조작의 가능성 배제할 수 없는 건 문제

20
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소(MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=fotek/Getty Images

와인 소믈리에는 와인에 대한 전문적인 지식을 기반으로 와인의 맛을 감별하고, 특정한 음식과 잘 어울리는 와인이나 소비자 취향에 맞는 와인을 추천합니다. “깊이 농축된 와인은 아니지만 피니시에서 여운을 남기는 레몬-라임 산미가 완벽하게 균형을 이룹니다.”라는 식으로 와인을 평가하죠.

어떠신가요? 혀에서 터지는 감귤의 맛이 느껴지시나요? 그런데 사실 이 리뷰를 쓴 소믈리에는 이 와인을 마셔본 적이 없습니다. 인간이 아니라 인공지능이기 때문입니다.

최근 다양한 분야의 연구원들이 힘을 합쳐 사람이 작성한 것과 구별이 불가능한 수준의 와인 및 맥주 리뷰를 쓸 수 있는 ‘리뷰 생성 인공지능 알고리즘’을 개발했습니다. 이 결과는 국제 마케팅 연구 저널(International Journal of Research in Marketing)에 발표됐습니다.

연구진은 자신들의 알고리즘이 맥주나 와인 생산자에게는 수많은 리뷰를 확인해 제품을 개발할 수 있게 하고, 비평가에게는 편하게 리뷰를 작성할 수 있는 일종의 템플릿을 제공하기를 바란다고 밝혔습니다. 또한 향후 다른 “경험적인” 제품, 즉 커피나 자동차처럼 다른 사람의 리뷰가 실제 소비에 중요한 역할을 하는 제품에 대한 리뷰로도 확장될 수 있다고 덧붙였습니다. 하지만 일각에서는 이러한 알고리즘이 다른 방식으로 악용될 수 있다는 우려의 목소리도 나오고 있습니다.

이론적으로 알고리즘은 모든 제품에 대한 리뷰를 생성할 수 있습니다. 하지만 연구원들이 맥주와 와인에 대한 리뷰를 생성하는 알고리즘에 주목한 데에는 몇 가지 이유가 있습니다. 우선 이번 연구에 참여한 다트머스 대학교의 컴퓨터 엔지니어 케이스 칼슨(Keith Carlson)에 따르면 맥주와 와인 리뷰는 “굉장히 독특한 데이터 셋”입니다. 다른 데이터와 다르게 생성 인공지능 학습에 있어서 매우 유리한 측면이 있다는데, 구체적으로 재배 지역, 포도 혹은 밀의 품종, 발효 스타일 그리고 생산 연도 같은 특정한 변수가 많이 존재하고, 비평가들도 ‘oaky(오크향)’, ‘floral(꽃향)’, ‘dry(당분이 적은)’ 같은 제한적인 단어를 반복적으로 사용하는 경향이 있다고 합니다.

칼슨을 비롯한 연구진은 미국의 와인 잡지 ‘Wine Enthusiast’에 수록된 125,000개의 와인 리뷰와 맥주 평가 사이트 레이트비어(RateBeer)에 올라온 143,000개의 맥주 리뷰로 인공지능을 가르쳤습니다. 인공지능은 이를 보고 와인이나 맥주 리뷰의 일반적인 문장 구조와 스타일을 배웠죠. 또한 인공지능은 양조장 이름, 스타일, 알코올 비율 및 가격대와 같은 특정한 와인 또는 맥주의 세부 정보도 학습했습니다. 그 결과 AI는 마치 인간 전문가가 작성한 것과 같은 수준의 리뷰를 생성해냈습니다.

인공지능의 성능을 테스트하기 위해 연구원들은 와인 300종을 대상으로 사람 한 명이 작성한 리뷰와 한 개의 AI 생성 리뷰를 비교했고, 맥주 69종에 대해서는 사람 열 명이 작성한 리뷰와 한 개의 AI 생성 리뷰를 비교했습니다. 연구 참가자들은 이 두 종류의 리뷰를 모두 읽고, 그 리뷰의 작성자가 누구일지 추측해야 했죠. 그 결과 실험 참가자 대부분은 AI가 생성한 리뷰와 사람이 쓴 리뷰를 구별하지 못했습니다.

이렇게 보면 마치 인공지능이 와인을 마시지 않고도 와인 리뷰를 뚝딱 만들어내는 것처럼 보이지만, 사실 적어도 맥주와 와인 영역에서는 사람의 리뷰 데이터가 여전히 필수적입니다. 다트머스의 마케팅 전문가이자 논문의 공동 저자인 프라빈 코팔레(Praveen Kopalle)는 “(AI) 모델은 현재의 기술로는 사람이 한 번도 맛본 적이 없고, 리뷰에도 기술된 적이 없는 주류의 리뷰를 작성할 수 없다.”라고 설명하며 “미래에는 알고리즘이 아직 사람이 평가하지 않은 와인의 맛이 어떨지 직접 추측하고, 알고리즘의 리뷰를 사람의 리뷰와 비교할 수 있게 되기를 기대한다”고 전했습니다.

하지만 위에서도 한 번 언급했듯이 이러한 ‘언어 생성 AI(Language-generation AI)’에는 명과 암이 공존합니다. 시카고 대학의 머신 러닝 및 사이버 보안 전문가인 벤 자오(Ben Zhao) 교수는 “리뷰 생성 AI로 해당 제품에 대한 긍정적인 리뷰를 과장하고 부정적인 리뷰를 제거하거나, 그 반대의 일을 할 수도 있을 것”이라며 “제품 리뷰에 대한 여론을 악의적으로 바꿔 경쟁기업을 공격할 가능성”을 우려했습니다. 이에 대해 코팔레 연구원과 칼슨 연구원은 제품을 소개하는 글을 직접 쓸 여력이 없는 중소기업 창업자를 도와줄 수 있다는 점에서 리뷰 생성 인공지능의 이익은 해악을 뛰어넘는다고 생각한다며 논란을 일축했습니다.

우리는 이미 스포티파이(Spotify) 추천, 검색 엔진, 신호등에 이르기까지 그야말로 알고리즘으로 만들어진 세상에 살고 있습니다. 자오 교수는 “인간은 여러 측면에서 조작되기 쉬운 존재입니다.”라며 “AI 알고리즘의 장점과 악용 가능성을 인지하고 신중하게 선택하는 것”이 이런 세상에서 우리가 할 수 있는 최선이라고 경고했습니다.


In the world of wine reviews, evocative writing is key. Consider the following: “While the nose is a bit closed, the palate of this off-dry Riesling is chock full of juicy white grapefruit and tangerine flavors. It’s not a deeply concentrated wine, but it’s balanced neatly by a strike of lemon-lime acidity that lingers on the finish.”

Reading the description, you can almost feel the cool glass sweating in your hand and taste a burst of citrus on your tongue. But the author of this review never had that experience—because the author was a piece of software.

An interdisciplinary group of researchers developed an artificial intelligence algorithm capable of writing reviews for wine and beer that are largely indistinguishable from those penned by a human critic. The scientists recently released their results in the International Journal of Research in Marketing.

The team hopes this program will be able to help beer and wine producers aggregate large numbers of reviews or give human reviewers a template to work from. The researchers say their approach could even be expanded to reviews of other “experiential” products, such as coffee or cars. But some experts warn that this type of application has potential for misuse.

Theoretically, the algorithm could have produced reviews about anything. A couple of key features made beer and wine particularly interesting to the researchers, though. For one thing, “it was just a very unique data set,” says computer engineer Keith Carlson of Dartmouth College, who co-developed the algorithm used in the study. Wine and beer reviews also make a great template for AI-generated text, he explains, because their descriptions contain a lot of specific variables, such as growing region, grape or wheat variety, fermentation style and year of production. Also, these reviews tend to rely on a limited vocabulary. “People talk about wine in the same way, using the same set of words,” Carlson says. For example, connoisseurs might routinely toss around adjectives such as “oaky,” “floral” or “dry.”

Carlson and his co-authors trained their program on a decade’s worth of professional reviews—about 125,000 total—scraped from the magazine Wine Enthusiast. They also used nearly 143,000 beer reviews from the Web site RateBeer. The algorithm processed these human-written analyses to learn the general structure and style of a review. In order to generate its own reviews, the AI was given a specific wine’s or beer’s details, such as winery or brewery name, style, alcohol percentage and price point. Based on these parameters, the AI found existing reviews for that beverage, pulled out the most frequently used adjectives and used them to write its own description.

To test the program’s performance, team members selected one human and one AI-generated review each for 300 different wines and 10 human reviews and one AI review each for 69 beers. Then they asked a group of human test subjects to read both machine-generated and human-written reviews and checked whether the subjects could distinguish which was which. In most cases, they could not. “We were a little bit surprised,” Carlson says.

Although the algorithm seemed to do well at collecting many reviews and condensing them into a single, cohesive description, it has some significant limitations. For instance, it may not be able to accurately predict the flavor profile of a beverage that has not been sampled by human taste buds and described by human writers. “The model cannot taste wine or beer,” says Praveen Kopalle, a marketing specialist at Dartmouth and a co-author of the study. “It only understands binary 0’s and 1’s.” Kopalle adds that his team would like to test the algorithm’s predictive potential in the future—to have it guess what an as-yet-unreviewed wine would taste like, then compare its description to that of a human reviewer. But for now, at least in the beer and wine realm, human reviewers are still essential.

Language-generation AI is not new, and similar software has already been used to produce recommendations for online reviewing platforms. But some sites allow users to screen out machine-generated reviews—and one reason is that this kind of language generation can have a dark side. A review-writing AI could, for example, be used to synthetically amplify positive reviews and drown out negative ones, or vice versa. “An online product review has the ability to really change people’s opinion,” notes Ben Zhao, a machine learning and cybersecurity expert at the University of Chicago, who was not involved in the new study. Using this type of software, someone with bad intentions “could completely trash a competitor and destroy their business financially,” Zhao says. But Kopalle and Carlson see more potential for good than harm in developing review-generating software, especially for small business owners who may not have adequate time or grasp of English to write product descriptions themselves.

We already live in a world shaped by algorithms, from Spotify recommendations to search engine results to traffic lights. The best we can do is proceed with caution, Zhao says. “I think humans are incredibly easy to manipulate in many ways,” he says. “It’s just a question of needing to identify the difference between correct uses and misuses.”

Similar Posts