"인공지능"이라는 사기는 그만둡시다

지금 우리가 만나고 있는 “인공지능”은 사실 “지능”이 아니라, 데이터에서 뽑아낸 패턴들로 이뤄낸 고급 자동화라는 사실을 여러번 강조하고 있다. 이전에는 단순한 규칙만을 입력한 자동화였다가, 이제는 데이터에서 더 다양한 규칙들을 뽑아내서 자동화를 좀 더 복잡한 수준으로 할 수 있는 정도에 불과하니 이건 “지능”이 아니라 “규칙”을 “저장”하는 것에 불과하다고 했다.

본 블로그에서 여러번 강조하듯이, 단순히 데이터의 용량이 커져서가 아니라, 예전 데이터는 랜덤 데이터였는데 반해, 요즘 우리가 IT업계에서 뽑아내는 데이터는 여러가지의 패턴들을 포함하고 있기 때문에, 패턴을 매칭하는 통계 알고리즘들로 “고급 자동화”를 구현하고 있는 상태다. 단순한 선형이 아니라 비선형의 복잡한 패턴을 잡아내는데 (Deep) Neural net이 (그나마) 빠르고 효과적으로 계산하기 때문에 활용하고 있는 것일뿐, 이 시대의 “인공지능”은 그냥 통계적인 계산들 중 하나에 불과한 상태다.

신경과학자 (Neuroscientist)인 Pascal Kaufmann이 빅 데이터 기반의 딥러닝 알고리즘 광풍에 대해서 이렇게 표현했다.

“If you need 300 million pictures of cats in order to say something is a horse or cat or cow, to me that’s not so intelligent, It’s more like brute-force statistics.”

필자가 그동안 이야기했던 것과 완벽하게 일맥상통하는 이야기다. 참고로 Kaufmann 박사는 Starmind라는 “진짜” 인공지능 스타트업을 운영하고 있는 중이다. 이 분의 주장은 머신러닝, 딥러닝 같은 통계 프로그래밍은 인공지능이라고 부르지말고, “Computing statistics”라고 불러야한단다. (또 공감했다. 캬~)

진정한 인공지능이라고 하려면, 어마어마한 데이터를 입력해서 패턴을 매칭해내는 통계 알고리즘이 아니라, 사람들의 “생각”하는 방식을 구현해내야하지 않겠냐고 반문하는데, 얼마나 공감하실 수 있으신가?

“I think it’s impressive what statistics is capable of, but it’s definitely not what we’re looking for when it comes to human intelligence.”

Brain Code를 알아내야 – 뇌 매커니즘을 복제해야

알파고 이후 약 2년 남짓 동안 정말 수많은 사람들이 “인공지능”이라는 노래를 불러댔고, 몇 백조의 자금이 투자됐다. 곳곳에서 인공지능이 곧 인류를 지배하는 시대가 온다고 설레발을 치는 “전문가(?)”들이 신문 지면을 장식했고, 이틈에 개발자라는 직군의 사람들 중 일부는 자기네들이 “인공지능” “기술”을 갖고 있다는 말도 안 되는 뻥을 치며 4차 산업 혁명은 코딩 기반으로 가야된다고 언론 플레이를 했었다.

그 결과는? 지금까지 필자가 줄곧 주장해왔던대로, 개발자들은 코드나 Copy & Paste하는 수준에 불과했고, 글로벌 IT 회사들이 인공지능 시스템을 도입한다는데 정작 수준은 데이터 패턴 매칭에 지나지 않았다. 바둑에서 컴퓨터가 인간 최고수를 이겼으니, 이제 스타크래프트같은 쉬운(?) 게임은 어렵지 않다고 그랬다가, 프로게이머도 아니고 일반인 수준도 안 되는 것 같다는 혹평을 들으며 졸전을 치르는 “인공지능 플레이어”도 만나봤다. 데이터로 매칭해야하는데, 바둑은 1개 유닛을 어디에 놓을지만 고민하면 되는 (상대적으로) 단순한 패턴 매칭만 하면 됐는데, 스타크래프트는 무려 200개 유닛을 어떤 방향과 어떤 속력으로 어떤 조합으로 움직여야할지 고민해야하는 Super Mega Ultra 복잡한 패턴 매칭을 해야하니 답이 있을리가 있나

정말로 “인공지능”이라고 부를려면 인간의 머리 속이 어떻게 움직이는지 이해하고, 그 움직임 방식을 따라갈 생각을 해야하지 않을까?

(Source: thinkerstank)

이걸 영어권에서는 Craking the “Brain Code“라고 부른다.

글로벌 대형 IT 회사들은 아무도 이런 이야기를 안 하는데, 필자같은 변방의 Data Scientist, Pascal Kaufmann 같은 유럽의 외딴 지역에서 이름도 모르는 스타트업 운영하는 사람들만 이런 이야기를 하냐고?

“It’s not about decoding random thoughts….We’re talking about decoding the words you’ve already decided to share by sending them to the speech center of your brain.”

Facebook의 Building 8 매니저인 Regina Dugan이 뇌파를 읽어내는 프로젝트를 이야기하면서, 위와 같은 이야기를 하더라. 비슷한 주제에 대해서 Elon Musk는 Neuralink 라는 회사를 설립하고, 뇌파를 전달해주는 스마트폰 비슷한 기계를 만든다는 이야기를 했었다.

솔직히 말하면, 글로벌 대형사들이 저렇게 한심한 이해와 답답한 투자를 하고 있는 덕분에 스타트업들이 성공하는 것 같아서 한참을 웃었다. (필자와 같이 실망한 연구 인력들이 많을 것이다.)

당장 뇌가 사용하는 언어가 뭔지를 알아야 그 뇌파를 읽어서 뭔가 다른 작업을 할 수 있지 않을까? 현재 인간이 뇌파를 읽어서 해석하는 수준은 팔, 다리, 손가락의 움직임에 대한 전기 신호 자극을 “번역”하는 수준 밖에 안 된다.

이것도 데이터가 더 많아지면 “인공지능”이 “Learning”하는 거 아니냐고? 글쎄다. 팔, 다리, 손가락 움직임은 하나하나 매칭해가면서 데이터 셋을 만들 수 있을지 모르겠는데, “저 여자가 나를 보는 눈빛을 보니 내가 아까 몰고 온 싸구려 국산차가 마음에 안 들었나보다.”, “저 남자의 팔 동작은 나한테 호감이 있는걸 감추려는 억지가 들어간 어색한 동작인 것 같다.” 와 같은 판단을 하는 뇌파의 움직임은 어떻게 될까? 그런걸 알아내야 진짜 “인공지능” 뇌파 분석기 아닌가?

그럼 인공 지능이 아니라 뭘까? – 집합 지능 vs. 통합 지능

집합 지능 (Collective Intelligence)
– “민주주의의 수준은 그 나라 평균의 수준이다”

대의제 민주주의에서 리더를 뽑는 투표를 보통 집합 지성 (Collective Intelligence)라고 표현한다. (다만 이번 글의 맥락상 집합 “지능”으로 바꿔서 쓴다.) 여러 사람의 생각을 모으면 집단 전체에게 가장 큰 이익이 되는 결정을 내릴 수 있다는 맥락에서 나온 용어다. 역사적으로 멀리가면 고대 그리스 사회의 도편 추방제가 있고, 민주주의 국가들에서 다수결의 원칙에 따라 의사 결정을 하는 것도 모두 집합 지성이다.

물론 집단의 구성원들이 수준이 낮으면 낮은 수준의 정부 밖에 못 갖는다고 혹평도 받을만큼 집합 지성이 항상 우월한 것은 아니다. 노벨 경제학상 후보 중 한 사람이었던 Stephen Ross 교수님은 매번 이렇게 농담하셨다.

Collective intelligence is no more than AVERAGE intelligence of the society. You know yours is at least above the average, but you are also aware of how awful yours is. What’s more terrible is that half the population has BELOW average intelligence.

집합 지성이란 평균 지성인데, 평균이 얼마나 멍청한지, (그런데 그 평균이 매일 멍청하다고 놀림듣는 너보다 더 멍청하고) 그리고 인구의 절반은 평균 아래니 얼마나 더 멍청할까는 우스갯소리다.

통합 지능 (Integrated Intelligence)
– “뭉치면 살고, 흩어지면 죽는다”

요즘 말하는 인공 지능 (Artificial Intelligence)의 냉정한 정의를 따지면 통합 지능이 아닐까 싶다. 수 많은 사람들의 작업 데이터를 입력해서, 그 중 반복적으로 나타나는 패턴을 골라내는 계산법, 여러 사람의 데이터를 모아서 전체의 대형 데이터 셋을 만드는 작업이 2018년 시점에 사람들이 알고 있는 인공지능이고 빅데이터이기 때문이다.

다른 글에서 소개했듯이, 수백만 명이 네비게이션을 쓰면서 실시간으로 차량 정보를 보내주면 그 정보를 바탕으로 다른 운전자가 현재 차량 정체 상황과 도로 상황을 쉽게 이해할 수 있다. 개인은 한 순간에 한 지점에 있지만, 집단은 한 순간에 수 많은 지점에 퍼져 있기 때문에 더 많은 정보를 갖고 있기 때문이다. 필자의 수업 시간에 얼굴 인식하는 알고리즘이 PCA 작업이라는 걸 보여주고, Neural Net은 그런 PCA의 아이디어를 형상화한 알고리즘이라는 걸 보여주면서 결국은 깨끗하게 정리된 얼굴 사진 데이터를 얼마나 많이 집어 넣느냐에 따라 모델의 성능이 바뀌는 걸 보여주면 많은 분들이 놀란다. 알고리즘이 아무리 좋아봐야 주변 친구들 열댓명의 얼굴 정보 데이터로는 한계가 있고, 대한민국 사람들 모두의 얼굴 사진, 그것도 똑같은 프레임 속에 집어넣은 얼굴 사진을 모아야 얼굴 이미지를 더 잘 인식할 수 있다는 이야기다.

물론 통합 지능이라고 표현했으면 이렇게 사람들의 관심과 투자를 끌어모을 수 있지 않았을 것이기 때문에 용어를 변경한 부분은 이해되지만, 필자처럼 그 계산의 매커니즘을 다 알고 있는 사람 입장에서 “인공 지능”이라는 단어를 입에 올리는 것은 굉장히 거북한 일이다. 우리 회사 이름을 Predictive Analytics by Integrated Intelligence 라고 한 이유도 회사 비지니스 모델의 핵심을 정확한 표현으로 옮기고 싶었기 때문이다. 모든 걸 다 떠나서, 필자는 “인공” 이라는 단어를 붙여서 “사기”를 치고 싶지 않다.

(Source: Analytic India Magazine)

Cracking the Brain Code – 인공지능이 나아갈 길

지금까지 인류는 아무런 인공지능도 만들어내지 못했다. 그냥 자동화 알고리즘만 좀 더 복잡하게 만들어내는 방향으로 진화했을 뿐, 정작 인간을 비롯한 고등 생명체가 어떤 방식으로 사고하고 있고, 그 사고의 격차가 생기는 것에 맞춘 “지능”적인 알고리즘은 커녕, 영장류보다 지적으로 열등한 생명체들의 지능이 어떻게 생명반응의 로직을 설계 하고 있는지도 잘 모르는 상태다.

이전에 다른 글에서 언급했듯이, 1980년대에 편모충의 세포 그룹들을 하나하나 복제한 조직을 결합시켰더니, 편모충과 유사하게 움직였다는 생물학적 “발견”이후, 더 큰 생명체의 움직임을 “단순 복제”는 해내고 있을지언정, 정작 원리를 파악하고 “구현”을 해내는 단계는 아니다. 개발자들의 딥러닝 코드로 비교하자면, Copy & Paste로 딥러닝을 “잘한다”고 주장하지만, 정작 Deep Neural Net이 어떻게 구현되는지, 그 알고리즘에서 Overfitting은 어떻게 해결하는지, 다른 데이터, 다른 목적에는 어떻게 바꿔서 활용하는지는 전혀 알지 못한다는 뜻이다. (그래놓고 “딥러닝 엔지니어”라고 주장하는 모습을 보면 기가찬다 ㅋㅋ)

참고로, 레오나르도 다 빈치가 새들의 활강 장면을 보고 비행에 필요한 신체 조직, 공기 저항을 이겨내는 방식 등에 대한 개략적인 이해를한지 몇 백년이 더 지나서야 라이트 형제가 비행기를 만들어냈다. 인공지능도 마찬가지다. 뇌가 어떻게 움직이는지를 일단 알아내야 인간 비슷한 “지능”적인 객체라도 만들어 낼 것 아닌가. 이제 겨우 뇌파 분석기로 뇌파 데이터 수집하는 단계인 주제에, 아직 인간은 커녕 돌고래의 뇌가 어떻게 작동하는지도 모르는 판국에 무슨 인공지능이란 말인가?

나가며 – 설레발 금지

지능도 아닌, 겨우 데이터 훈련하는 주제에 “인공지능”이라고 열심히 주장들을 해대는 꼴을 보면 정말 깝깝하다. 당장 저런 통계 모델링을 못해서 글로벌 선진국 대비 몇 년이나 격차가 뒤쳐졌고, 그걸 따라잡으려면 정부가 얼마나 투자를 해야하고… 정부의 눈먼 돈 빼먹으려는 전략으로 밖에 안 보이는 말들을 매일같이 듣는다. (더 웃긴건, 블록체인은 이제 막 시작해서 충분히 따라갈 수 있단다. 수학과 통계학 모르는 사람들은 그대로 있는데, 선형대수학에서 네트워크 이론으로 필요한 수학만 바뀌었을 뿐, 상황은 뭐가 달라진게 있나???)

이걸 Computer Science하는 친구들끼리, 아니 심지어 고졸 개발자들끼리 “나 저런 수학 모르는데, 너는 아냐?” “나도 몰라” 같은 이야기를 하고 있으니 우리나라가 몇 십년 뒤쳐진 것 같은 공포가 밀려오는 것이다. 똑같은 질문을 통계학과에 가서 다시한번 해 보시라. 필자처럼 통계학이 주 전공이 아니었던 아카데믹도 다 알고 있는 내용을 통계학 박사했던 사람들이 모를리는 없을거라고 생각한다. (뭐 학위 중에 관련 주제에 관심이 없었다면 또 모르겠지만)

우리나라 별로 밀리는거 없다. 코드 Copy & Paste하는 개발자들을 이 시장에서 몰아내고, 제대로 수학 & 통계학 훈련받고, 어떤 모델을 어떤 수학으로 모델링해야하는지 알아먹는 똑똑한 인재들을 공대말고 자연대에서 훈련시켜서 데리고 오면 된다. 데이터 센터라는 인프라만 훌륭하게 만들어 놓으면 된다. (솔직히 이게 공돌이 학부출신들이 할 일 아닌가?) 나머지는 자연대에서 수학과 통계학으로 잘 훈련된, 그 데이터를 이용하는 연구인력에 대한 지원만 해주면 충분하다. 이런데 쓸 평범한(?) 수학과 통계학은 한국의 아카데믹들이 하나도 밀릴게 없기 때문이다.

요즘 데이터 사이언스 해 보고 싶다고 잔뜩 바람이 들어서 학부 전공을 Computer Science나 Computational Statistics로 정하려는 고등학생들에게 한 마디 덧붙인다. 필자의 중학 3학년 겨울에 우리나라가 IMF 구제금융을 맞았고, 이걸보고 조지 소로스보다 더 거물이 되어서 유태인 자본을 금융시장에서 몰아내겠다는 망상으로 경제학을 전공했고, 취업하고나니 그 해에 글로벌 금융위기가 왔고, 머리를 더 써보자고 박사하고 났더니 퀀트 연봉 반토막났고, Data Scientist를 Hot job이라고 부르는 시장이 되어버렸다. 지금은 Data Scientist가 좀 “Sexy”해 보일지 모르지만, 정말 Brain Code를 해석하는 시대가 오면, 신경 연구하는 분들의 몸값이 폭등할 것이고, 그 땐 수백만장의 사진을 집어넣어야 특징을 찾아내주는 짝퉁 인공지능이 아니라, 약간의 데이터로 모든 분석을 다 해주는 진짜 인공지능이 구현된 세상이 될지도 모른다.

참고로 1980년대 초반, 1990년대 중반에 각각 한 번씩 Neural network 붐이 있었다. 물론 그 땐 “인공지능”이라고 설레발도 없었고 “알파고”같은 퍼포먼스도 없었지만, 꽤나 많은 CS 박사들이 여기 뛰어들었다가 “피봤었다”. 진짜는 아직 나타나지도 않았는데 왜들 이렇게 난리를 피우는지. 설레발 그만치고, 자기가 잘 할 수 있는거 하는게 맞는거 같다.