[해외DS] AI, 이제는 인간이 세상을 이해하는 방식까지 따라한다

딥마인드 연구팀, 인간의 선천적인 물리학 지식 AI 시스템에 통합하는 “직관적인 물리학” 모델 플라토 개발 플라토, 갓난아이처럼 직관적인 물리학 법칙 위반하는 것 보고 “놀라움” 표시해 헤스포스 교수, 모델이 인지 심리학과 발달 과학에서 증명된 사실과 밀접하게 관련돼 있다는 점 독특하다는 평가 내려

20
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소(MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=olesiabilkei/Getty Images

펜을 떨어뜨리면 그 펜은 공중에 떠 있지 않고 바닥으로 떨어집니다. 마찬가지로 만약 펜이 떨어지는 경로에 책상이 있다면 펜은 책상 표면을 통과하는 게 아니라 책상 위로 떨어집니다.

인간은 이와 같은 물리적 객체의 기본 속성을 직관적으로 이해합니다. 생후 3개월만 돼도 더 이상 볼 수 없는 공이 여전히 어딘가에 존재하고, 공이 소파 뒤에서 냉장고 위로 순간이동할 수 없다는 사실을 알게 됩니다.

하지만 인공 지능 시스템은 그렇지 않습니다. 체스나 포커 같은 복잡한 게임을 완벽히 이해하고 있음에도 불구하고 인간의 아이가 생후 몇 개월 동안 아무런 노력을 하지 않아도, 단지 태어나서 보기만 해도 배울 수 있는 “상식”을 AI는 이해하지 못한다는 것입니다.

미국의 명문대 MIT의 인지과학 교수 조슈아 테넨바움(Joshua Tenenbaum)은 “과거에 비해 AI 관련 기술이 비약적으로 발전한 지금 시기에도, 인간의 직관적인 상식을 탑재하고 있는 AI 시스템이 아직까지 없다는 사실은 놀랍다”며 “우리가 그 지점에 도달한다는 의미는 곧 (인간의 상식이) 어떻게 작동하는지, 인간은 그것을 어떻게 알게 되는지 이해하게 되는 것과 같다”고 말했습니다.

지난 7월 11일 알파벳(Alphabet)의 자회사 딥마인드(DeepMind) 소속 연구팀이 ‘네이처 인간 행동(Nature Human Behavior)’ 저널에 발표한 연구는 이러한 상식을 기계에 통합하는 방법을 고도화하고 인간이 어떻게 상식을 갖게 되는지를 더 깊게 이해하는 성과를 거뒀습니다. 연구팀은 발달심리학자들이 아기가 태어날 때부터 갖고 있다고 보는 선천적 지식을 AI 시스템에 통합한 “직관적인 물리학” 모델을 고안했고, 인간 유아의 인지를 평가할 때 사용하는 방법과 유사한 모델 테스트 방법도 제시했습니다.

딥러닝은 일반적으로 입력된 장면의 픽셀 패턴을 식별하는 훈련을 거칩니다. 그 결과 시스템은 얼굴이나 공을 인식할 수 있게 되지만, 움직이고 서로 부딪히는 역동적인 장면을 보았을 때 그 물체에 어떤 일이 일어날지 예상하지는 못합니다. 이러한 까다로운 문제를 해결하기 위해 연구원들은 플라토(PLATO, Physics Learning through Auto-encoding and Tracking Objects)라는 모델을 개발하여 개별적인 픽셀이 아니라 객체 전체에 초점을 맞췄습니다. 이후에는 약 30만개의 영상으로 플라토를 훈련시켜 물체가 어떻게 동작하는지를 학습할 수 있도록 했습니다. 공이 떨어지거나 다른 물체에 부딪히거나 장벽 뒤에서 굴러가서 반대편에 다시 나타나거나 하는 영상이 여기에 포함됐습니다.

연구팀의 목표는 플라토가 객체 영속성(객체가 보이지 않더라도 여전히 존재함), 견고성(객체가 물리적으로 견고함), 연속성(객체가 연속적인 경로로 이동하며 갑자기 먼 곳에서 사라졌다가 다시 나타날 수 없음), 불변성(객체의 속성은 항상 동일하게 유지됨) 및 방향성 관성(객체는 관성의 법칙에 따라 방향만 변경됨)이라는 다섯 가지 기본 개념에 기반해 무엇이 직관적인 물리학의 법칙을 위반하는지 이해하도록 하는 것이었습니다. 그 결과, 플라토는 어떤 충격을 받았음에도 뒤로 튕겨 나가지 않고 다른 물체를 뚫고 움직이는 물체를 봤을 때 “놀라움”을 보였습니다. 마치 갓난아이처럼 말입니다.

딥마인드 소속 과학자로 이번 연구를 이끈 루이스 피로토(Luis Piloto)는 기자회견을 통해 “심리학자들은 사람들이 물리적 세계를 이해하기 위해 물체를 사용한다고 여긴다. 따라서 우리가 그런 시스템을 구축한다면 (AI 모델)이 물리적 세계를 실제로 이해할 가능성 역시 극대화될 것”이라고 밝혔습니다. 인간이 인지하는 것처럼 AI가 물체를 통해 직관적인 물리학 개념을 이해하도록 하겠다는 것입니다.

사실 다양한 수준의 선천적 혹은 후천적인 물리학 지식을 시스템에 통합해 AI에게 직관적인 물리학을 가르치려는 시도는 이전에도 있었습니다. 부분적인 성공을 거두기도 했죠. 하지만 이번 연구는 발달심리학자들의 견해를 참고했다는 점에서 기존의 연구와 차별화됩니다. 유아가 물체가 무엇인지를 구별하는 선천적인 인식 능력을 우선 활용하면서 직관적인 물리학을 이해한다는 견해를 모델에 그대로 반영한 것입니다. 이후 아이들은 물체가 세상을 움직이는 것을 관찰하면서 물체의 행동을 지배하는 물리적 규칙을 배우게 됩니다.

노스웨스턴 대학교의 심리학 교수 수잔 헤스포스(Susan Hespos)는 “이 논문의 흥미롭고 독특한 점은 모델의 기반이 인지 심리학과 발달 과학에서 확인된 것들과 굉장히 밀접하게 관련되어 있다는 것”이라며 “우리는 선천적인 지식을 갖고 태어나지만 태어났을 때부터 완벽하지는 않고, 아기는 이 컴퓨터 모델처럼 경험과 환경을 통해 그 지식을 정교화한다”고 말했습니다.

한편 딥마인드 연구진은 자신들의 연구 성과가 로봇 공학, 자율 주행 자동차 혹은 다른 최신 AI 응용 프로그램을 고도화하는 데 이용될 만한 수준이 아니라고 강조했습니다. 이들이 개발한 모델은 실제 시나리오와 관련된 개체에 대한 교육을 훨씬 더 많이 받아야 AI 시스템에 통합될 수 있습니다. 하지만 모델이 더 정교해지면 유아가 세상을 이해하는 방식에 대한 발달 심리학 연구에 도움이 될 수도 있습니다. 발달심리학자들은 거의 100년 전부터 “상식”이 선천적인지 후천적인지를 논의하고 있는데요, 스위스 심리학자 장 피아제(Jean Piaget)의 인지 발달 단계 연구가 그 시초입니다.

헤스포스 교수 역시 “발달 과학에서 아이디어를 가져오고, 이를 모델링에 통합하는 인공 지능 간에 유의미한 협업이 일어날 수 있다”라며 “양쪽 모두가 이익을 얻는 관계가 될 수 있다고 생각한다”라고 말했습니다.


If I drop a pen, you know that it won’t hover in midair but will fall to the floor. Similarly, if the pen encounters a desk on its way down, you know it won’t travel through the surface but will instead land on top.

These fundamental properties of physical objects seem intuitive to us. Infants as young as three months know that a ball no longer in sight still exists and that the ball can’t teleport from behind the couch to the top of the refrigerator.

Despite mastering complex games, such as chess and poker, artificial intelligence systems have yet to demonstrate the “commonsense” knowledge that an infant is either born with or picks up seemingly without effort in their first few months.

“It’s so striking that as much as AI technologies have advanced, we still don’t have AI systems with anything like human common sense,” says Joshua Tenenbaum, a professor of cognitive sciences at the Massachusetts Institute of Technology, who has done research in this area. “If we were ever to get to that point, then understanding how it works, how it arises in humans” will be valuable.

A study published on July 11 in the journal Nature Human Behaviour by a team at DeepMind, a subsidiary of Google’s parent company Alphabet, takes a step toward advancing how such commonsense knowledge might be incorporated into machines—and understanding how it develops in humans. The scientists came up with an “intuitive physics” model by integrating the same inherent knowledge that developmental psychologists think a baby is born with into an AI system. They also created a means of testing the model that is akin to the methods used to assess cognition in human infants.

Normally, the deep-learning systems that have become ubiquitous in AI research go through training to identify patterns of pixels in a scene. By doing so, they can recognize a face or a ball, but they cannot predict what will happen to those objects when placed in a dynamic scene where they move and bump into each other. To tackle the trickier challenge presented by intuitive physics, the researchers developed a model called PLATO (Physics Learning through Auto-encoding and Tracking Objects) to focus on whole objects instead of individual pixels. They then trained PLATO on about 300,000 videos so that it could learn how an object behaves: a ball falling, bouncing against another object or rolling behind a barrier only to reappear on the other side.

The goal was to have PLATO understand what violates the laws of intuitive physics based on five fundamental concepts: object permanence (an object still exists even if it’s not in view), solidity (objects are physically solid), continuity (objects move in continuous paths and can’t disappear and reappear in an unexpectedly distant place), unchangeableness (an object’s properties always remain the same) and directional inertia (an object only changes direction under the law of inertia). PLATO, like an infant, exhibited “surprise” when it, say, viewed an object that moved through another one without ricocheting backward upon impact. It performed significantly better at distinguishing physically possible versus impossible scenes than a traditional AI system that was trained on the same videos but had not been imbued with an inherent knowledge of objects.

“Psychologists think that people use objects to understand the physical world, so maybe if we build a system like that, we’re going to maximize our likelihood of [an AI model] actually understanding the physical world,” said Luis Piloto, a research scientist at DeepMind who led the study, during a press conference.

Previous efforts to teach intuitive physics to AI by incorporating varying degrees of built-in or acquired physical knowledge into the system have achieved mixed success. The new study attempted to obtain an understanding of intuitive physics in the same manner that developmental psychologists think an infant does by first displaying an inborn awareness of what an object is. The child then learns the physical rules that govern the object’s behavior by watching it move about the world.

“What’s exciting and unique about this paper is that they did it very closely based on what is known in cognitive psychology and developmental science,” says Susan Hespos, a psychology professor at Northwestern University, who co-wrote a News & Views article accompanying the paper but was not involved with the research. “We are born with innate knowledge, but it’s not like it’s perfect when we’re born with it…. And then, through experience and the environment, babies—just like this computer model—elaborate that knowledge.”

The DeepMind researchers emphasize that, at this stage, their work is not ready to advance robotics, self-driving cars or other trending AI applications. The model they developed will need substantially more training on objects involved in real-world scenarios before it can be incorporated into AI systems. As the model grows in sophistication, it might also inform developmental psychology research about how infants learn to understand the world. Whether commonsense knowledge is learned or innate has been debated by developmental psychologists for nearly 100 years, dating back to Swiss psychologist Jean Piaget’s work on the stages of cognitive development.

“There’s a fruitful collaboration that can happen between artificial intelligence that takes ideas from developmental science and incorporates it into their modeling,” Hespos says. “I think it can be a mutually beneficial relationship for both sides of the equation.”

Similar Posts