[해외DS] AI, 화학 물질 냄새 인간이 어떻게 받아들일지 예측한다 (1)

여전히 미지의 세계인 분자의 냄새 결정 과정에 AI 활용하는 연구 이어져 윌츠코 박사 등, 인간 냄새 분자 어떻게 받아들이는지 예측하는 그래프 신경망 AI 모델 구축 메인랜드 박사 연구팀, 컴퓨터 모델 냄새 예측이 인간 패널 한 명 예측보다 정확하다 밝혀

Policy Korea

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 파비 데이터 사이언스 연구소(Pabii Data Science Institute)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=janiecbros/Getty Images

분자의 화학 구조가 냄새를 결정한다는 사실은 오래 전부터 알려져 있었지만, 그 구체적인 과정은 아직까지도 베일에 싸여 있습니다. 물론 공기 중의 분자에 어떤 특성이 존재한다면 인간의 코와 뇌가 그 분자의 냄새를 어떻게 받아들인다는, 몇 가지 특정한 규칙이 확인되기는 했습니다. 황 함유 화합물 일부는 마늘 냄새가 나고, 특정한 암모니아 유래 아민은 비린내 냄새가 난다는 연구 결과를 예로 들 수 있죠. 하지만 이건 어디까지나 예외입니다.

어떤 분자들은 구조적 연관성이 없어도 비슷한 냄새를 풍깁니다. 예를 들어 사이안화수소와 벤즈알데하이드는 둘 다 아몬드 냄새가 납니다. 그렇지만 분자 구조는 완전히 다른데, 벤즈알데하이드는 사이안화수소보다 크고 사이안화수소에는 없는 복잡한 고리 구조를 갖습니다. 한편 이중 결합 위치 하나가 이동하는 정도의 정말 사소한 분자 구조 변화가 분자의 향을 완전히 바꾸기도 합니다.

정말 어디로 튈지 예측하기 쉽지 않은데요, 최근에는 인공 지능의 계산 능력을 여기에 적용하려는 시도가 이어지고 있습니다.

한 연구팀은 인간이 냄새 분자의 화학적인 특징을 어떻게 받아들이는지(예: 장미 향, 약 냄새, 흙 냄새) 예측하는 그래프 신경망 AI 모델을 구축했습니다. bioRxiv에 게재된 해당 연구의 프리프린트에 따르면 이 모델은 인간 수준의 신뢰도로 새로운 향기를 평가할 수 있습니다.

논문의 공동 저자이자 구글 산하 벤처 캐피탈 GV에서 일하고 있으며 구글 리서치에서 디지털 후각 팀을 이끈 경력이 있는 알렉스 윌츠코(Alex Wiltschko) 박사는 “(이번 연구를 통해) 세상이 어떻게 냄새를 맡고, 냄새가 어떻게 작용하는지에 대한 근본적인 무언가를 실제로 배웠습니다. 놀라운 경험이었죠.”라고 말했습니다.

인간의 코에는 평균적으로 약 350종류의 후각 수용체가 존재합니다. 이들은 공기 중에 존재하는 굉장히 다양한 분자와 결합할 수 있는데, 분자와 결합한 뒤 뇌에 신경 신호를 보냅니다. 뇌는 이 신경 신호를 받아들여 커피, 휘발유, 향수 냄새 등으로 분류하죠. 바로 이것이 대략적인 냄새 수용 과정입니다. 하지만 많은 세부 사항, 예를 들어 냄새 수용체의 정확한 모양이나 시스템이 이러한 복잡한 신호를 인코딩하는 방식 같은 정보는 앞서 언급했듯이 여전히 알려지지 않았습니다.

다양한 향기에 대한 ‘후각 레퍼런스 키트’/사진=조엘 메인랜드

컬럼비아대 교수이자 후각 신경학자인 스튜어트 파이어스타인(Stuart Firestein)은 이 연구에서 개발한 그래프 신경망 모델을 “전산 생물학의 역작”으로 평가했습니다. 하지만 그렇다고 해서 “일이 어떻게 돌아가는지에 대한 더 깊은 의미를 제공”하지는 않는다고 선을 그었죠. (참고로 파이어스타인 교수는 이 연구에 참여하지 않았습니다.) 사실 이건 머신 러닝 기반 연구에 대한 일반적인 비판론입니다. 기술 자체의 고유한 특성 때문인데, 이러한 신경망은 일반적으로 해석할 수 없습니다. 즉 인간 연구자는 모델이 문제를 해결하기 위해 어떤 추론을 사용하는지 알 수 없다는 뜻입니다. 게다가 이 모델은 분자와 냄새를 직접 연결하는 대신 신경계의 불가해한 작동 방식을 무시합니다.

그럼에도 불구하고 파이어스타인 교수를 비롯한 다른 학자들은 이 모델이 후각과 화학 간의 복잡한 관계를 연구하는 데 잠재적으로 유용한 도구라고 생각합니다. 아울러 이 모델은 후각을 디지털 세계에 들이고자 노력하는 연구원들에게도 의미가 있습니다. 결국 “냄새의 세계”를 좀더 정확하게, 수치화해서 표현하려는 시도의 일환이기 때문입니다.

윌츠코 박사는 현재 이 기술의 상용화 방법을 찾고 있는데, “미래에는 컴퓨터가 (인간과) 흡사하게 보고, 듣고, 냄새를 맡을 수 있을 것입니다.”라고 단언하기도 했습니다.

후각 관련 연구에서는 한동안 전산 모델링이 이용됐습니다. 지난 2017년 발표된 한 논문에서는 분자 구조와 인간이 느끼는 향(“달콤한 향”, “타는 냄새”, “꽃 향기” 등)을 연결할 수 있는 모델이 소개됐습니다. (참고로 이 모델은 크라우드 소싱 공모를 통해 개발됐습니다.) 윌츠코 박사 연구팀은 이 모델을 활용한 후속 연구를 진행했는데, 양질의 분자 관련 데이터 약 5,000개로 모델을 훈련시켰습니다. 이 데이터에는 분자를 구성하는 원자의 특징이나 분자 내에서의 원자 결합 등이 포함됐다고 합니다. 그 결과, 모델은 냄새 지도(odor map)’를 만들어냈습니다. 아, 여기서의 지도는 일반적인 2차원 지도가 아닙니다. 무려 256차원 공간에 냄새 분자를 배치한, 엄청나게 복잡한 지도이죠. 이 지도에 기반해 분자를 구별할 수 있는 알고리즘이 만들어졌습니다.

냄새 지도 이미지/사진=알렉산더 B. 윌츠코

윌츠코 박사 연구팀은 이 지도가 실제 인간의 인식과 동일한지를 확인하고자 모넬 케미컬 센스 센터(Monell Chemical Senses Center) 소속 후각 신경과학자 조엘 메인랜드(Joel Mainland) 박사를 찾아갔습니다. 메인랜드 박사는 “’어떤 냄새를 어떻게 정의할 수 있는가?’라는 점 때문에 성공을 정의하는 게 조금 어렵다”며 “(향수) 산업과 우리 연구는 기본적으로 사람을 모아 냄새가 어떤지 설명하라고 지시하는 과정이다.”라고 덧붙였습니다. 즉, 냄새를 평가한다는 것 자체가 주관성을 갖기 때문에 모델이 인식한 냄새와 사람이 느끼는 냄새가 동일한지를 확인하는 작업이 쉽지 않다는 것입니다.

우선 메인랜드 박사는 동료들과 함께 ‘문서화되지 않은’ 냄새를 가진 분자 세트를 검토했습니다. 냄새에 대한 인식은 유전적 차이, 개인적인 경험 그리고 선호도 때문에 사람마다 크게 다를 수 있습니다. 따라서 이들은 최소 15명의 훈련된 연구 참여자에게 각각의 냄새를 맡으라고 지시한 뒤 참가자들의 평가를 평균하고 그 평균을 모델의 예측과 비교했습니다. 분석 결과, 분자의 53%에서 모델의 예측이 개별 패널리스트의 예측보다 패널의 평균에 더 가깝다는 것이 확인됐습니다. 결국 이 연구에서는 모델의 예측이 인간의 예측보다 정확했다는 것입니다. 연구팀에 따르면 이 모델의 성능은 기존의 레이블 기반 모델을 능가합니다.

[해외DS] AI, 화학 물질 냄새 인간이 어떻게 받아들일지 예측한다 (2)로 이어집니다. 


Researchers have long known that the chemical structure of the molecules we inhale influences what we smell. But in most cases, no one can figure out exactly how. Scientists have deciphered a few specific rules that govern how the nose and brain perceive an airborne molecule based on its characteristics. It has become clear that we quickly recognize some sulfur-containing compounds as the scent of garlic, for example, and certain ammonia-derived amines as a fishy odor. But these are exceptions.

It turns out that structurally unrelated molecules can have similar scents. For example, hydrogen cyanide and larger, ring-shaped benzaldehyde both smell like almonds. Meanwhile tiny structural changes—even shifting the location of one double bond—can dramatically alter a scent.

To make sense of this baffling chemistry, researchers have turned to the computational might of artificial intelligence. Now one team has trained a type of AI known as a graph neural network to predict what a compound will smell like to a person—rose, medicinal, earthy, and so on—based on the chemical features of odor molecules. The computer model assessed new scents as reliably as humans, the researchers report in a new draft paper posted to the preprint repository bioRxiv.

“It’s actually learned something fundamental about how the world smells and how smell works, which was astounding to me,” says Alex Wiltschko, now at Google’s venture capital firm GV, who headed the digital olfaction team while he was at Google Research.

The average human nose contains about 350 types of olfactory receptors, which can bind to a potentially enormous number of airborne molecules. These receptors then initiate neuronal signals that the brain later interprets a whiff of coffee, gasoline or perfume. Although scientists know how this process works in a broad sense, many of the details—such as the precise shape of odor receptors or how the system encodes these complex signals—still elude them.
Stuart Firestein, an olfactory neuroscientist at Columbia University, calls the model a “tour de force work of computational biology.” But as is typical for a lot of machine-learning-based studies, “it never gives you, in my opinion, much of a deeper sense of how things are working,” says Firestein, who was not involved in the paper. His critique stems from an inherent feature in the technology: such neural networks are generally not interpretable, meaning human researchers cannot get access to the reasoning a model uses to solve a problem.

What’s more, this model skips over the inscrutable workings of the nervous system, instead making direct connections between molecules and smells. Even so, Firestein and others describe it as a potentially useful tool with which to study the sense of smell and its fraught relationship with chemistry. To the researchers involved, the model also represents a move toward a more precise, numbers-based means to describe the odor universe, which they hope could eventually bring this sense to the digital world.

“I deeply believe in a future where, in much the same way that computers can see, they can hear, they can smell,” says Wiltschko, who is now exploring commercializing this technology.

For a while now, researchers have been using computational modeling to investigate olfaction. In a paper published in 2017 a crowdsourcing competition generated a model capable of matching molecular structures with some labels—including “sweet,” “burnt” and “flower”—that describe their scents in terms of what humans experience. In the new follow-up effort, Wiltschko’s team trained its model with data from about 5,000 well-studied molecules, including features of their atoms and the bonds between them. As a result, the model generated an immensely complex “map” of odors. Unlike a conventional paper map, which plots locations in two dimensions, the model placed odor molecules at “locations” based on 256 dimensions—attributes the algorithm determined it could use to differentiate among the molecules.

To see if this map held up to actual human perception, Wiltschko’s team turned to Joel Mainland, an olfactory neuroscientist at the Monell Chemical Senses Center. “Defining success here is a little hard in that ‘How do you define what something smells like?’” Mainland says. “What [the fragrance] industry does—and what we’re doing here—is basically you get a panel of people together, and they describe what it smells like.”

First, Mainland and others identified a set of molecules with scents that had not been documented. At least 15 trained study participants sniffed each. Because perceptions of odor can differ significantly from person to person, thanks to genetic differences, personal experience and preferences, the researchers averaged the participants’ assessments and compared that average with the model’s predictions. They found that for 53 percent of the molecules, the model came closer to the panel’s average than the typical individual panelist did—a performance they say exceeded the earlier label-based model.

Similar Posts