피사의 사탑 - 피상적인 공돌이들의 공통적인 문제

피사의 사탑의 공 떨어뜨리기 실험을 생각해보자.

이미 지식이 있는 사람들은 무거운 공이나 가벼운 공이나 중력이 작동하는 방식이 똑같기 때문에 바닥에 떨어지는데까지 걸린 시간도 똑같다는 사실을 알고 있다.

고교 수준의 물리학을 이해하면 (공기저항을 무시할 때) 9.8m/s으로 중력가속도가 작동한다는 사실, 그 때 무게는 중력가속도에 영향을 미치는게 아니라, 그 물체를 지구가 끌어당기는 힘에 영향을 준다는 F = ma라는 공식을 바탕으로 추론해낼 수 있다.

반면, 중세수준 물리학 지식을 갖고 있거나, 피상적으로 해당 지식을 습득한 사람들은 왜 바닥에 떨어지는 속도가 같은지 이해를 못한다.

이런 분들은 동그란 모양의 공이 아니라 네모난 모양의 공은 더 빨리 떨어지지 않을까? 별 모양의 공은? 공이 아니라 기둥이면 어떨까? 같은 종류의 상상의 나래를 편다. 물리학을 설명해주면, 이론을 이해 못하니까 실험을 해봐야 알 수 있다고 바득바득 우기기 시작한다. 공식 용어로 Animal learning이라고 한다. 정상적인 지식인들 사이에서는 당연하겠지만 왕따로 전락한다.

(저런 수준인데 인공지능 한다고 주장하면, 인간에 가까운 Reinforcement learning을 하는게 아니라, Trial and Error하는 Animal learning을 하는 사람들이다)

(참고로, 일반에 알려진 Reinforcement learning – 강화학습 – 에 쓰이는 Stochastic Dynamic Optimal Control 계산은 2016년에 알파고와 함께 처음 만들어진게 아니라, 1833년에 만들어진 이후로 연구자들이 일상적으로 이용하는 지식이다.)

예시 사례

공장에서 특수가공생산되는 다이아몬드는 기존 다이아몬드보다 우리가 원하는 모양으로 가공하기 더 쉽다는 발견이 알려졌다고 생각해보자. 고강도의 탄소 결합물이 가공되기 쉬워졌으니 다이아몬드 톱 같은 기계 가공 분야에 상당한 영향을 줄 것이다. 그런데, 피상적으로만 아는 사람들은 그 신물질은 (예를들면) 떨어지는 속도가 느리니까 비행기에 쓸 수 있다고 어이없는 확신을 갖는다.

정작 그 다이아몬드는 보석 시장의 가격 흐름을 바꾸고, 공업용 다이아몬드 품질을 올리고 가격을 떨어뜨리는 정도의 영향 밖에 줄 수 없을 것이다. 그것만으로 충분한 혁신이긴 한데, 왜 갑자기 떨어지는 속도 이야기가 나오는거지????

그런데, 비행기에 쓸 수 있는 신물질이라는 걸 믿는 바보들이 어마어마한 숫자로 불어나고, 공장 출시된 다이아몬드가 인류의 미래를 뒤바꾸는 혁신을 갖고 온다고 온갖 종류의 (돈 받고 나가는) 신문기사가 쏟아진다.

반박은 무시되고 결과물은 없다

떨어뜨리니까 똑같은 속도라는 실험은 무시되고 언론에는 보도되지 않는다. 물리학자들이 이건 말도 안 되는 주장이라고 지적해도 무시당한다. 어느 물리학자가 공기저항이 있다면 공기저항을 받는 면적에 따라 다를 수도 있어서 낙하 속도가 달라질지도 모른다고 표현해놓은 물리학적으로 상식적인 표현을 악용해서 신물질은 낙하 속도가 다르다고 계속해서 강조한다.

그렇게 투자금, 국가 예산을 싹 끌어가고, 신물질 대학원이 설립되고, 세상이 곧 바뀌는 것처럼 말만 무성하다.

5년이 지나고, 10년이 지나도, 정작 그 신물질이라는 다이아몬드가 쓰이는 곳은 보석시장과 공업용 다이아몬드 시장 이외에 달리 쓰이는 곳이 없다. 전투기 성능이 계량되고, 비행기가 가벼워서 연료를 덜 먹을거라고 그랬는데, 심지어 우주로 쏘는 로켓 비용도 절감된다고 과장된 썰을 엄청 풀어놨는데, 되는건 하나도 없다.

지식인 누군가는 돈과 인력이 없어서 사업이 안 되는 반면, 저런 사기꾼들은 돈과 인력이 없어서라는 변명도 못한다. 국가 예산을 싹 쓸어갔었고, 신물질 대학원 덕분에 (잘 모르는 바보) 인재를 싹 쓸어갔었으니까.

인공지능?

요즘 딥러닝, Reinforcement learning, AI 등으로 알려진 지식으로 바꿔넣으면 완벽하게 맞아들어갈 이야기다.

쓰일 수 있는 곳은 알파고 같은 Stationary process의 데이터, 이미지 인식, (기초적인) 언어 처리 등에 불과한데, 무슨 인류를 바꾸는 신기술인것처럼 신문기사를 쏟아내고 정부 예산을 쓸어간다.

갑자기 Non-stationary 데이터에 쓸 수 있다며 주가 예측하는 AI라고 떠들지를 않나, 통계학이 필요없다고 주장하지 않나, 느닷없이 다이아몬드는 낙하속도가 다르다, 전통 물리학은 틀렸다고 주장하는 것과 같은 맥락으로 하나같이 지식이 전혀없는 사람들의 허무맹랑한 소리다.

물리학자의 눈에 신물질 헛소리가 바보들의 합창으로 보이는 것처럼, 통계학을 제대로 배운 사람 눈에 AI 헛소리는 사기꾼들의 합창으로 보인다.

기술적으로 불가능하다 vs. 수학적으로 불가능하다

위의 두 표현은 사실 큰 차이가 있는데, 기술적으로 불가능한건 현재 우리가 활용할 수 있는 “공학적 기술”이 부족하다는 뜻이다. 예를 들어 원자력 발전소를 짓는데, 우리가 갖고 있는 “공학적 기술”로 방사성 동위원소의 변형 속도를 제어할 수 없다면 원자력 발전소의 안전을 담보할 수 없다.

수학적으로 불가능하다는건 아예 못한다는 뜻이다. 3+3=6이 아니라 7이라고 쓰면, 우리가 알고 있는 유클리드 기하학의 영역에서는 있을 수 없는 이야기다. 이건 어떤 “공학적 기술”을 갖다 붙여도 3+3=7을 만들수가 없다.

자연과학에서 자연의 법칙을 찾아내는 학문으로 수학과 (거의) 동일한 위치에 있는 물리학을 생각해보자. 반중력 물질을 찾아내기 전까지 중력을 거스르는 건물을 세울 수 없다. 질량 보존의 법칙이 성립하는데 3+3=7이 될 수 있을까? 거꾸로 물질이 에너지로 바뀌면서 3+3=5가 되는 발견을 할 수 있는 것처럼, 7이되려면 주변의 에너지가 물질로 바뀌는 논리가 있어야 가능한 이야기다.

통계학, 특히 수리통계학의 영역도 마찬가지다. 예를 들어, 발산하는 Non-stationary data process에서 Non-stationarity를 제거하지 않으면 그 데이터에 우리가 알고 있는 통계학을 적용할 수가 없다. 이런 명백한 진실을 무시하고, RNN을 복잡하게 만드는 “기술력으로 극복할 수 있다”고 우기면 뭐라고 해야할까?

지식의 세상이 “기술적으로 불가능하다”의 영역에 있는 분들은 지식의 범위가 좁으니까 “수학적으로 불가능하다”의 영역을 이해 못할 수 있지만, 이해 못한다고 자신이 맞는 것은 아니다. (그냥 너는 안다고 우기는 바보일 뿐이다.)

(Gradient Boosting 방식으로 Tree를 개선하는 계산법의 아이디어가 Neural Network에 이미 다 들어가 있고, 심지어 1 variable 1차식 대신에 N variable 1차식 형태로 바꾼거라는걸 알고 있으면 저런 합성 계산법을 만들었다고 자랑할 수 있을까?)

(간장 넣으면 맛있어진다는걸 주워듣고, 이미 통합 양념장을 다 넣은 음식에 다시 간장을 뿌려놓고 신메뉴라고 주장하는 요리사를 요리업계에서는 뭐라고 취급해줄까?)

신기술, 트렌드, 최신 계산법 Maniac들

지난 2주간 어느 공돌이가 AI를 이용해 남들보다 돈을 더 벌 수 있는 변수를 찾아내는 알고리즘을 만들었다는 괴변을 하길래, 전공자 입장에서 상식이라고 생각되는 반박을 해 줬다. (글1, 글2)

이왕 하는 반박인데 제대로 해야겠다는 생각에 이런저런 자료를 좀 찾아봤는데, 피상적인 공돌이들 하는 행동이 이 분야에서도 그대로 나타나고 있더라.

“새로운 계산법” 이라는 단어 진짜 엄청 좋아하더라.

뭔가 새로운 계산법이 나왔다고, 그 계산법의 Github 페이지를 조금이라도 먼저 알고 공유하면서 자기가 마치 지식인이라도 된 양 거들먹 거린다. 정작 그 계산법이 별 쓸모도 없는 계산법인 경우가 태반이고 (위의 예시), 설령 쓸만한 구석이 있더라도 특화된 용도가 있다는 사실을 전혀 이해하질 못하는듯.

마치 그 새로운 계산법을 쓰면 “기술적으로 불가능”한 부분을 모든 영역에 걸쳐 극복할 수 있는 것처럼 착각하고, 심지어는 “수학적으로 불가능”한 부분도 다 극복할 수 있는 것처럼 생각한다.

가끔 메일도 받는다. “새로운 계산법을 설명하는 어느 글을 봤는데, 이건 좋은 건가요?” (위 Gradient Boosted Decision Tree Neural Network 참고 – 링크)

정작 내용을 보면 2개 이상의 계산법을 합성해놨는데, 합성해야할 이유가 없는 계산들을 합성해놨고, 제대로 쓸 수 있는 데이터 셋을 제시하지도 못한다. 원래부터 무의미한 합성 계산법이니까.

기초지식이 없는 상태로 “공학적”으로 결합만 하면 뭔가 되겠지라는 잘못된 믿음을 가진 분들의 작업 수준이 대부분 이렇다.

구글의 검색 로그를 보면 “트렌드 계산법”, “신기술”, “신기술 AI”, “3세대 인공지능” 이런 단어 검색량이 어마어마하다. 그런 검색어에 뜨는 글들의 퀄리티는 딱 위의 신물질 사기꾼들이 떠드는 것과 하나도 다를바가 없더라.

야채주스가 완전한 건강을 보장해주는 것처럼 홍보하는 글에 속는 바보들과, 저런 피상적인 지식인의 차이는 뭘까?

(침팬지, 오랑우탄, 원숭이의 차이는 뭘까?)

피상적인 공돌이들의 공통적인 문제

기술적으로 불가능한 부분만 알고, 수학적으로 불가능한 부분을 모르는 지식의 한계
지식의 영역이 좁으니까, 그런 사람들끼리 모여서 자기확신만 쌓이는 한계
코드가 지식이고 코드라는 결과물을 만들어내는 수학/통계학은 지식이 아니라고 생각하는 편협한 지식 습득의 한계

위의 세 개 문제가 요즘 한국에서 AI라는 지식의 전문가인체 하는 공돌이들, (Generally) 피상적인 공돌이들이 갖고 있는 문제다.

이 분들은 피사의 사탑에서 공을 떨어뜨려줘도 믿지 않는다. 다른 신물질이 있을 것이라고 맹목적인 확신을 갖고 있기 때문이다. 깃털이 공기저항을 받아서 느리게 떨어지는 걸 보고는 신물질은 깃털과 같은 성분이라고 주장하실 분들이다. 성분만 같아야되는게 아니라 공기저항을 받으려면 피사체의 모양이 현격하게 달라져야한다는 과학적 지식이 없는채로 단지 실험해보니까 늦게 떨어지더라는 자기확신에만 차 있는 것이다.

깃털 성분을 엄청나게 비싼 가격을 주고 구매한 다음에, 이렇게 만들면 늦게 떨어질까, 저렇게 만들면 늦게 떨어질까, 수백만, 수천만 가지의 실험만 하실 분들이다. 성분이 아니라 깃털 모양이 공기 저항을 만들어내는거라고 백번 설명해줘도 안 듣는다. 모양을 조금 바꿨더니 약간 더 늦게 떨어졌다고, 신기술이 나왔다고 Github에 공유하고 거기 모여서 같이 신기술, 신물질, 트렌드 물질 같은 어이없는 노래만 부르고 있다.

다른 전공 출신자 입장에서 지나치게 공학도들을 모욕하는 것 같아 조심스럽기는 한데, 필자가 거쳤던 전공들, 이웃 전공들에서도 어이없는 자기확신을 가진 사람들은 많았다. (ex. 프로그램으로 주가 예측을 해서 돈 벌 수 있다고 우기던 사람들) 단지 차이가 있다면 그런 헛소리를 떠들면 학계에서 퇴출되고, 산업계에서 같은 소리를 떠들어도 전문가들이 나서서 바보 취급을 확산시켜줬었다.

공대는 지금의 AI붐으로 이득을 보는게 많아서 일시적으로 외면하는건지 모르겠지만, 어이없는 자기확신을 가진 사람들을 제대로 솎아내는 자정작용을 못하는 것 같다. 계속 못하면 90년대 사회학처럼 주변 다른 전공에게 유사학문이라고 무시당한다. 미안하지만, 필자는 귀국 1년도 지나지 않아 본격적으로 공대 무시를 시작했다. 공대가 Data Scientist한다고 그러면 일단 색안경을 끼고 보게된 것도 사실이다.

서울 시내 어느 명문대 공학 교수가 졸업반 학생들의 연구 과제 평가를 하는데, 어느 학생이 AWS에서 받은 이미지 인식 알고리즘으로 프로젝트를 하나 제출했더니,

지금 AWS 라이브러리 베껴온거 말고 한게 뭐가 있냐?

고 엄청나게 꾸중했다더라.

이미지 인식 전공자인 교수 입장에서 이미지 데이터 처리에 들어가는 각종 수학 알고리즘 지식 없이, 주워넣은 라이브러리 하나로 이미지 인식을 할 수 있다고 주장하는 꼴이 얼마나 역겨웠을까? 몇몇 사기꾼들 때문에 자기 학문 출신을 타 전공자들이 이력서부터 거른다는 사실을 깨달으면 얼마나 어이가 없으실까? 내공이 심후한 공학도들 입장에서 저런 피상적인 공돌이들이 자기 학문을 망치고 있는걸보면 어떤 생각이 들까?