[해외DS] AI, 화학 물질 냄새 인간이 어떻게 받아들일지 예측한다 (2)

단일 분자 냄새 인식 한정됐다는 한계 존재, 향료 데이터 편향성 문제도 있어 냄새 지도, 향료 화학자 등에게 도움 주거나 특정한 향기 기록하거나 생성하는 신기술 도입에 활용될 수 있어 슈무커 박사, 후각 등가물 개발은 아직까지 “공상 과학 소설이다”

pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=janiecbros/Getty Images

[해외DS] AI, 화학 물질 냄새 인간이 어떻게 받아들일지 예측한다 (1)에서 이어집니다. 

단 이 연구 결과만을 가지고 컴퓨터 모델의 냄새 인식 능력이 인간보다 낫다고 할 수는 없습니다. ‘단일 분자’의 냄새 인식에 한해서 진행된 연구이기 때문입니다. 장미 향기에서 담배 냄새에 이르기까지, 실제 세계에 존재하는 냄새는 대부분 혼합물입니다. 또한 연구팀이 모델 훈련에 향료 데이터를 이용한 점도 문제가 됩니다. 향료 데이터는 기분 좋은 냄새가 대부분이고, 혐오스러운 냄새는 거의 없습니다. 결국 데이터에 편향성이 있다는 뜻입니다.

하지만 이러한 한계에도 불구하고 이 모델은 ‘냄새의 화학’에 관심 있는 이들에게 도움이 됩니다. 예를 들면 제대로 연구되지 않은 나쁜 냄새를 식별하거나, 분자 구조가 바뀌면 인식에 어떤 변화가 생기는지 테스트하는 데 이용될 수 있죠. 또한 향료 화학자들은 향료 공식을 정제하거나 잠재적인 이용 가치를 갖는 새로운 성분을 찾아낼 때 이 모델을 참고할 수 있습니다.

윌츠코 박사 연구팀은 이미 이 모델을 이용해 화학 물질의 구조와 사람 및 다른 생물이 냄새를 인식하는 방법이 어떻게 연결되는지에 대한 이론을 테스트한 바 있습니다. 지난 8월 bioRxiv에 올라온 또다른 프리프린트에 따르면 이 모델은 동물의 신진대사 과정(음식을 에너지로 전환하는 것과 같이 생명을 유지하기 위한 화학적 과정)을 설명할 수 있습니다. 연구원들은 데이터베이스에서 냄새를 유발할 것으로 예상되는 대사 화합물을 골라낸 뒤 냄새 지도 모델을 참조해 해당 화합물의 분자 구조를 분석했습니다. 분석 결과, 반응에서 밀접하게 관련된 역할을 하는 분자는 구조가 다르다 할지라도 비슷한 냄새를 갖는 경향이 있었습니다. 메인랜드 박사는 이 논문의 공동 저자는 아니지만 연구팀과 의견을 나눈 적이 있는데, 이 결과를 두고 “정말 흥미진진하다”라는 반응을 보였습니다. 메인랜드 박사는 “단순히 어떤 문제를 해결하는 모델을 구축하려는 게 아닙니다.”라며 “이 모든 것 뒤에 어떤 논리가 숨겨져 있는지를 알아내고자 노력하고 있습니다.”라고 덧붙였습니다.

이 모델은 어떤 특정한 향기를 기록하거나 생성하는 신기술을 도입하기 위해 이용될 수도 있습니다. 윌츠코 박사는 자신의 연구팀이 인간 냄새 인식 지도를 완성하는 데 기여하고 있다고 설명했는데, 이 지도의 완성형은 국제 조명 위원회(International Commission on Illumination)에서 정의한, 눈으로 볼 수 있는 색을 매핑한 ‘색상 공간’과 유사하다고 합니다.

하지만 옥스퍼드대에서 인지 과학을 가르치는 아시파 마지드(Asifa Majid) 교수의 생각은 다른데, 마지드 교수에 따르면 색 공간은 새로운 후각 지도와 달리 단어에 의존하지 않습니다. 마지드 교수는 인간의 감각 지각을 구체화하기 위해 언어를 활용한다는 점 자체에 의문을 제기하며 “언어가 다르면 세상을 바라보는 방식도 달라집니다. 또 (인간 감각의) 범주를 항상 정확하게 번역할 수 있는 것도 아닙니다.”라고 말했습니다. 예를 들어, 영어를 쓰는 사람들은 냄새를 설명할 때 ‘커피 냄새 같다’ 라든지 ‘계피 같은 냄새가 난다’ 같은, 다른 냄새를 빌려오는 표현을 자주 사용합니다. 반면 말레이시아와 태국 일부 지역에 사는 사람들의 토착 언어인 자하이(Jahai)에서는 냄새를 표현할 때 기본적인 후각 단어 12개만을 쓸 수 있습니다.

마지드 교수는 이러한 ‘언어의 활용’을 검증하기 위한 경험적 연구가 없다면 “이 작업이 다른 언어로 어떻게 확장될지 알 수 없다”고 주장했습니다. ‘라벨링되지 않은’ 냄새를 정의하는 건 이론적으로는 가능합니다. 패널리스트가 냄새에 반응하는 시간을 측정하면 되는데, 메인랜드 박사에 따르면 이러한 ‘행동적 접근 방식’은 현실성이 굉장히 떨어지는 방법입니다. 메인랜드 박사는 마지드 교수와 달리 이 모델이 ‘냄새 세계’를 구성하는 근본적인 요소를 학습했기 때문에 세계 어디에서나 적용될 수 있다는 견해를 가지고 있습니다.

만약 단어에 의존하지 않고 냄새 인식을 연구할 수 있다고 하더라도 이러한 ‘경험’을 중요하고 보편적인 언어, 즉 숫자로 표현하는 게 쉽지 않을 것입니다. 연구자들은 좀더 정확하게 냄새를 설명하고, 궁극적으로는 냄새를 디지털화하기 위해 색상 공간 좌표나 16진수 코드(색상을 RGB 체계로 인코딩하는 것) 같은 ‘후각 등가물’을 개발하고자 노력하고 있습니다.

이번 연구에는 참여하지 않았지만 영국 하트퍼드셔대에서 화학 정보학을 활용해 후각을 연구하고 있는 마이클 슈무커(Michael Schmuker) 박사는 뇌의 시각 및 청각 처리 방식에 대한 연구와 달리 후각 처리 방식에 대한 연구는 “당장 해결해야 할 부분이 많은” 분야라고 지적했습니다.

이 분야의 주요 과제 중 하나는 기본 향기를 식별하는 것입니다. 디지털 이미지화된 후각 등가물을 개발하려면 혼합됐을 때 안정적으로 다양한 냄새를 생성하는 일련의 ‘냄새 분자’를 찾아내야 합니다. RGB로 모든 색조를 표현할 수 있는 것처럼, 후각에 있어서의 RGB를 찾아내야 한다는 뜻입니다.

슈무커 박사는 “사람들이 연구에 매진하고 있는 건 맞지만, (후각 등가물을 개발하는 건) 아직까지는 굉장히 먼, 공상 과학 소설과 다름없는 이야기입니다.”라고 말했습니다.


While the new model may have proved capable of mimicking human odor perception when given single molecules, it would not fare so well in the real world. From roses to cigarette smoke, most smells are mixtures. Also, the team trained the new model using perfumery data, which skew toward pleasant odors and away from repellent ones.

Even with these limitations, the model could still help those interested in the chemistry of smell by, for example, guiding researchers who want to identify understudied bad smells or test how tweaks in molecular structure change perception. And fragrance chemists could consult it when refining perfume formulas or identifying potential new ingredients.

Wiltschko’s team has already used the model to test a theory about the connection between a chemical’s structure and how people and other creatures perceive its smell. In another preprint paper that was posted on bioRxiv in August, the researchers suggest that an animal’s metabolism—the chemical processes that sustain its life, such as turning food into energy—could hold the explanation. From a database, they selected metabolic compounds predicted to evoke smells and analyzed the molecules using their smell-map model. The team concluded that molecules that play closely related roles in metabolic reactions tend to smell alike, even if they differ in structure. Mainland, who was not a co-author of this separate preprint paper but consulted with the team on the project, calls its finding “really exciting.” “We’re not just building a model that solves some problem,” he says. “We’re trying to figure out what is the underlying logic behind all of this.”

The model may also open the door to new technology that records or produces specific scents on demand. Wiltschko describes his team’s work as a step toward “a complete map” of human odor perception. The final version would be comparable to the “color space” defined by the International Commission on Illumination, which maps out visible colors. Unlike the new olfactory map, however, color space does not rely on words, notes Asifa Majid, a professor of cognitive science at the University of Oxford, who was not involved in the studies. Majid questions the use of language as a basis for plotting out human sensory perception. “Speakers of different languages have different ways of referring to the world, and the categories do not always translate exactly,” she says. For example, English speakers often describe a smell by referring to a potential source such as coffee or cinnamon. But in Jahai, an indigenous language spoken in Malaysia and parts of Thailand, one selects from a vocabulary of 12 basic smell words.

Without empirical research to validate it, “we simply do not know how this work would scale to other languages,” Majid says. In theory, researchers could have defined odors without labels by measuring panelists’ reaction times when asked to compare smells: it is more difficult to differentiate between similar odors, so participants need more time to do so. According to Mainland, however, this behavioral approach proved much less realistic. Because the model has learned something fundamental about the organization of the odor universe, he says he expects the map to be applicable elsewhere in the world.

Even though it is possible to study human perception of odors without relying on words, researchers still lack the ability to represent these experiences in a crucial universal language: numbers. By developing the olfactory equivalents of color space coordinates or hex codes (which encode colors in terms of red, green and blue), researchers aim to describe smells with new precision—and perhaps, eventually, to digitize them.

For vision and for hearing, researchers have learned the features to which the brain pays attention, explains Michael Schmuker, who uses chemical informatics to study olfaction at the University of Hertfordshire in England and was not involved in the studies. For olfaction, “there are many things to resolve right now,” he says.

One major challenge is the identification of primary scents. To create the olfactory equivalent of digital imagery, in which smells (like sights) are recorded and efficiently re-created, researchers need to identify a set of odor molecules that will reliably produce a gamut of smells when mixed—just as red, green and blue generate every hue on a screen.

“It’s very far-out science fiction at the moment, although people are working on it,” Schmuker says.

Similar Posts