S대 공학 박사가 본 수학 & 통계학이 필요한 이유 – 후기

9
pabii research

한국 사회 최고 명문대인 S대에서 공학 박사까지 한 인재가 MBA 학생들 대상으로 한 기초 수학 & 통계학 강의를 못하겠다고 나가떨어지는 걸 보고 적잖은 충격을 받았다.

사실 그 전에 대전 K대의 기술경영 박사를 하신 분이 MBA 수준 컨텐츠로 강의 경력을 갖고 있으시고, 수학 & 통계학 강의를 못하겠다고 발을 빼셨던 적이 있기 때문에, 어느 정도 예상은 했었다.

그래도 충격은 충격이더라.

오해하지 말자. 이 분들이 지식이 없어서 못 가르치는 건 절대로 아니다.

아마 그 정도 수준의 시험 문제를 내고 풀라고 그러면 무시한다고 화를 낼 것이다.

그런데, 국내 교육 스타일로 단순히 문제만 푸는게 아니라, 어린시절 머리 맡에서 엄마가 읽어주는 전래동화처럼 풀어내는 스토리로 강의를 해야된다는 압박에 모두 두 손을 들었을 것이라고 짐작된다.

나도 한국에서 학부까지 교육을 받은 “토종”인데, 도대체 무슨 차이가 있길래 이렇게 국내 명문대 공학계열 박사를 하신 분들이랑 수학 & 통계학 같은 기초 학문을 바라보는 시선에 큰 격차가 있을까?

 

대한민국 교육의 최대 문제 – 논리학의 부재

수학과 해석개론 듣던 철학과

학부시절, 수학과 3학년들이 듣는 해석개론이라는 수업을 들은 적이 있다.

우리과에서는 저 수업 학점으로 교수님들이 유학 추천서를 써주시는지가 결정이 된다. 미리 많은 준비를 하고 가서 수업을 듣는다.

그 수업에서 철학과 출신을 한 명 봤는데, 어째 준비는 하나도 안 하고 오는 거 같은데 항상 교수님이랑 논쟁(?)을 하면서 수업을 이해하더라.

처음에는 철학과라는 편견이 더해져 무슨 정신 이상자인가는 생각에 민폐 캐릭이라고 생각했었다.

근데, 위상수학 개념으로 두 값이 (Asymptotic하게) 같아진다는 증명을 하는, 내 눈에는 엄청나게 어려워보이는 증명에 포인트를 팍팍 찍어가면서 교수님과 대화를 하는걸 보고, 나 뿐만 아니라 수강생들 여럿이 충격을 먹었었다.

우리 눈에 민폐 캐릭이었던 그 철학도는 교수님께는 뭔가 애제자(?) 같은 느낌이더라. 자기네들끼리 뭐라고 그러는데 아무말도 못 알아듣고 수업이 끝나고 그랬으니까.

수학이랑 철학이랑 전공이 공유된다고?

나중에 우연히 알게 된 사실인데, 해석개론이라는 수업이 우리과에만 전공 인정되는게 아니라, 철학과에도 전공인정되는 수업이더라.

아니, 철학과, 종교학과, 미학과 3개 전공이 서로 대부분 전공을 인정해주고, 수학, 통계학, 물리학 같은 기초 학문들이랑도 엄청나게 전공수업들을 공유하는걸 보고 심하게 충격을 먹었다.

내 눈엔 엄청나게 수학적으로 어려운, 그래서 감히 범접할 수 없는 학문들인데, 그걸 수학 훈련을 꾸준히 받는 경제학 전공도 버거울 판국에 인문대 학생이 들을 수 있다고???

걔네들 완전 초특급 문송 아님???

문리대라는 단과대학이 있던 시절에 인문, 사회, 자연계열이 하나의 묶음으로 뽑혀서, 학생들이 원하는 전공을 선택하게 했다고 하던데, 저렇게 다 엮여있는 지식이니까 예전의 선각자들이 지금처럼 인문, 사회, 자연으로 나눠놓은게 아니라 하나로 합쳐놓은 것이리라.

철학 = 논리학 = 수학

아마 미국 사회에서는 로스쿨을 가는데 제일 좋은 학부 전공 중 하나가 철학과라는 이야기를 들은 적이 있을 것이다.

철학을 소크라테스, 플라톤 같은 그리스 철학자의 사상을 암기하는 방식으로가 아니라 (국내형 암기식), 논리적 사고가 그렇게 구축되었으니까 (서구형 논리식), 법학은 궁극적으로 끝판왕 논리학이니까, 그런데 수학도 논리학이니까, 다들 하나의 학문을 다른 눈으로 보는 거라는걸 알게됐었다.

민폐 캐릭인 줄 알았던 그 철학과 분이랑 그 때 좀 친하게 지내놓을 걸 그랬다 ㅋㅋ

이런 이야기를 프린스턴 대학 경제학 박사를 하고 지금 서울시내 어느 대학에서 교수로 계신 대선배님께 했더니

깨어있는 친구구만

이라며, 본인 경험담을 하나 이야기 해 주셨다.

역사학과 출신이 수학을 더 잘한다고?

영국 옥스포드 대학에서 역사학을 공부하고 온 박사 동기가 있었는데, 1학년 때 경제수학 수업 TA를 하면서 채점을 해보니 엉망진창이었단다. 그런데, 2학년을 올라가고, 연구하는 레벨로 올라가니, 갑자기 엄청난 수학지식들을 언제 배웠는지 다 배워서 논문을 막 쓰더란다.

결국 동기들 사이에서 가장 좋은 논문으로 가장 좋은 학교에 교수 자리를 찾아갔는데, 시간이 지나서보니, 자기는 지식만 배웠고, 그 친구는 논리를 배웠기 때문에, 결국엔 논리가 부족했던 본인보다 훨씬 더 크게 성장했던 것 같단다.

문송이라고 온갖 욕을 다 먹고 있을법한 역사학과 출신, 철학과 출신이 이과에서 가장 탈락자가 많은 최고난이도 학문인 수학을 이렇게 잘한다는게 이해가 되려나?

결국 다 논리학이라는걸 이해하고나면 생각이 달라질텐데.

공학 박사가 기초 강의를 못하는 이유

즉, 기계건 기술경영이건 공학 박사 학위가 있는데 수학 & 통계학 강의를 못한다고 나가 떨어지는건, 논리학이 부족하기 때문이다.

논.리.학.

수학을 논리학으로 배우지 않고 단순 문제 풀이형으로만 배웠기 때문이겠지.

단순 문제 풀이는 컴퓨터가 더 잘하지 않나? 요즘 AI, AI거리는게 컴퓨터 신(神)님이 자기들보다 (단순한) 문제 더 잘 풀어서 그러는걸까?

복잡한 문제, 논리적으로 탄탄하게 쌓아올려야되는 문제는 풀어본 적도 없고, 본 적도 없고, 만들어 본 적은 더더욱 없으니까, AI, AI라고 그러는 컴퓨터 신(神)님한테 맡길 생각조차 못하는거겠지?

교수들이 돈 벌려고 따온 기업 프로젝트나 열심히 해주고 받은 학위가 그게 학위냐?

그게 서울의 S대, 대전의 K대 같은 한국사회 최고 명문대도 예외없이, 우리나라 공학 교육이 가진 가장 큰 문제점이기도 하고.

 

논리학 능력은 어떻게 기르는데?

개인 경험담

학부시절, Lagrangian multiplier가 왜 크면 클수록 조건식이 목적함수를 강하게 제어하는거라고 하는지 도무지 이해하질 못했다. 경제수학에서 처음 그 개념을 배우고 난 이래, 수학과를 찾아가 선형대수학 때 같은 개념을 배울 때도, 우리과 고학년 수업에서 게임이론 문제를 풀 때 Kuhn-Tucker를 이용할 때도, 분명히 Lagrangian multiplier 값이 기형적으로 큰 경우가 나오는데, 왜 크게 나오는지 제대로 이해를 안 or 못하고 넘어갔었다.

좀 변명하자면, 아무도 그걸 안 가르쳐 주더라.

그러다 런던으로 유학가서 직장에서 포맷된 머리를 석사 Boot Camp로 살리던 와중에 Corner solution vs. Interior solution 사례를 보고서야 비로소 깨달음을 얻었던 기억이 난다. Corner solution일 때 Lagrangian multiplier는 사실상 보이지 않는 조건식 하나가 더 있는 경우 (ex. X>=0)이기 때문에 Lagrangian 식이 변형되고, 조건식마다 각각 다른 Lagrangian multiplier를 갖게 되고, 그 값들이 “조건식이 목적함수를 제어하는 강도를 다르게 표현”하고 있었기 때문이다.

그런 깨달음을 얻고 오랜 시간이 지나, MIT를 찾아가 머신러닝이라는 수업을 들으면서 Regularization을 한다는데 2차 Moment들 앞에 Regularization parameter를 곱해준다고 그러는게 꼭 Lagrangian으로 문제를 풀어내는 형식이더라. 당연히 해석 방식도 Lagrangian multiplier랑 똑같겠네라고 생각했는데, Regularization parameter가 크면 클수록 타겟 변수의 활용도가 줄어든다는 평범한 1차미분 계산을 보면서, 학부 1학년 때 경제수학 들으면서 일부러 Lagrangian parameter를 크게/작게 바꿔봤었으면 더 빨리 이해했었을텐데, 내가 멍청해서 이걸 직장 그만두고 찾아간 대학원에서, 아니 심지어 박사 공부하러 와서, 그것도 남의 학교 석사 수업을 찾아가서야 겨우 깨달았구나는 쪽팔림에 많이 괴로웠다.

학부 1학년 때 Problem Set이 좀 더 좋았더라면, 아니 내가 좀 더 수업 중에 교수님을 괴롭혀봤었다면, 빨리 숙제내고 놀러가야지 생각 안 하고 한번만 더 고민해봤었더라면, 그럼 생각이 더 빨리 열렸을텐데, 이전 글의 S대 공학 박사가 결과물을 빨리 찍어내는거에만 초점을 맞추고 수학을 무시했던 것처럼, 나 역시도 그저 빨리 숙제 다하고 놀러갈 생각 밖에 안 했던 비용을 늦게서야 지불한 것이다.

굳이 변명하자면, 그런 비용을 지불할 수 있는 교육 풍토가 아니었다.

영국 Cambridge 학부 출신 석사 동기

그 비용을 지불 안 했으면 or 못 했으면, 영원히 Lagrangian과 Regularization이 같은 계산이라는걸 이해 못 했을 것이고, SVM이 Lagrangian에서 Duality 계산을 활용했다는 것도 이해를 못 했을 것이다.

이걸 일찍 깨달은 석사시절 동기가 박사하던 중 “Regression이나 SVM이나, 심지어 Bellman도 어차피 Lagrangian class 모델인데, 조건식을 어떻게 붙여주냐는 게임이지 뭐”라고 Facebxxx 어느 글에 댓글을 달아놨던데, 시야가 그 수준에 다다르면 머신러닝 교과서를 뒤져 Q-learning계산법을 굳이 배우질 않더라도 Lagrangian을 simulation + incremental approximation으로 풀어내는 아이디어를 스스로 가지게 된다. 다 거기서 거기니까.

괴상망측한 비선형함수를 보고, 이 함수가 어떻게 생겼을지 감 잡으려고 보자마자 학부 1학년 때 배웠을 Taylor’s expansion을 해보던, 그런 기초수학 훈련도를 바탕으로, “이거 다 Lagrangian이네?”라며 어려움없이 대학원 지식을 습득하던 그 Cambridge 학부 출신 천재의 반만이라도 실력이 있었으면 머신러닝이라는 응용 학문 지식 정도는 책을 안 펴보고도 다 알았을텐데…

한국인의 얍샵 치사한 작태

그런 훈련을 어릴 때부터 받았으면, 무슨 새로운 계산법인 것처럼 열광하고

Neural Net을 배우고 싶습니다, 딥러닝을 배우고 싶습니다, Q-learning을 배우고 싶습니다. (그렇지만 코딩만 배우고 수학은 끝까지 외면하겠습니다)

같은 정신나간 소리하는 일은 없겠지.

마치 물건은 사고 싶은데 돈은 내기 싫다는, 그렇다고 훔쳐서 범죄자가 되고 싶지는 않으니까, 그냥 공짜로 적선해라고 하는 얍샵 치사한 악성 소비자를 보는 것 같다.

저런 소비자들은 대체로 저 물건을 만드는데 얼마나 많은 공이 들어갔는지 모르니까, 설명서 제대로 한번 안 읽어보고, 그 물건을 제대로 쓰지도 못하면서, 그냥 자기 집에 전시해놓고 or 인스타X램에 사진 한 장 올려놓고 자랑질만 하는 겉멋충일 확률이 매우 높더라.

결국 제대로 모르니까 코드 복붙해서 안 돌아간다고 이상한 라이브러리라고 욕만하는게 우리나라 개발자 출신 가짜 Data Scientist들의 현실 아닌가? (ex. Experience Replay 사례)

이걸 박사 끝나고나서 깨닫는게 아니라, 학부 1학년 수업 때 깨닫도록 수업을 구성해주는게 교수들의 의무가 아닐까? (라고 변명해보지만, 교수님들 탓 할게 아니라, 게으르고 놀기 바빴던 내 탓이다ㅠㅠ)

 

딥러닝? 그거 마술 아니라 그냥 비선형 통계 계산이야

There has been a great deal of hype surrounding neural networks, making them seem magical and mysterious. As we make clear in this section, they are just non-linear statistical models

이전 글의 수학&통계학 기초 수업 듣고 복습을 4달이나 했던 S대 공학 박사 분이 공유해주신 ESL (Elements of “Statistical” Learning)의 어느 한 구절이다. 참고로 ESL은 스탠포드 통계학과 교수들이 대학원 용으로 만든 교재로, 속칭 인공지능(AI), 실제로는 계산과학이라고 불리는 업계에서 거의 Bible 급의 대접을 받는 책이다. (근데 책 이름은 AI가 아니라 “Statistical”이다.)

저 영어 문구를 한 줄 요약하면,

AI라고 불리는 지식이 4차원의 지식이 아니라, 제대로 훈련을 받은 사람에게는 평범한 통계학 지식에 불과하다.

왜? 단순한 비선형 통계 계산 방법 중 하나거든.

배우고 싶으면 4차원이라고, 블랙박스라고 사기치는 사람을 찾아갈게 아니라, 학부시절 교과서로 돌아가보시라. 이미 오래전에 배웠는데, 그때 당신이 놓쳤을 뿐이다.

S대 공대 학, 석, 박 출신이신 그 분이 딱 그렇게 기초로 돌아가 있더라.

박사 졸업하고서야 정신을 차린 것이다.

앞으로 혼자서 몇 년간 좌충우돌을 하시게 될 것이다.

본인 입으로 MSc AI는 못 갈 것 같고, 우선 예비과정에 해당하는 MSc DS부터 시작해야 될 것 같다고 했을 정도니까.

냉정하게 봤을 때, MSc DS와서 수리통계, 베이지안 학부 고학년 레벨 수업 들으면서 (개)고생하며 새로 훈련을 받아야 할 것이다. 학부 저학년 수학 & 통계학에 복습을 1주일도 아니고 4달이나 해야했던 분이니까.

그나마 깨달은 극소수니까 4달이었지, 못 깨닫고 우기기만 하는 다른 공돌이들은 몇 년이 걸려도 안 될 것이다.

다 공부했다고 우기기만 하겠지. 질문 받으면 하나도 제대로 대답 못 하면서.

깨달은 극소수라고 판단했으니까 나도 강의를 부탁드렸던거 아니겠나? 자기가 먼저 찾아왔다가 차갑게 거절당한 국내의 명문대 교수들 많다. 보통은 이런거 부탁 잘 안 한다. 나도 우리 학생들한테 최고의 교육을 제공해주고 싶거든. 이름값만 높은 학교 나온 허접을 왜 강단에 세우나?

(한 명의 Outlier를 놓고 공대 폄하하지 말라고 하던데, 저 분은 너네 중에 최상위 0.1%야. 너네는 몰라서 안 보이는거고, 저 분은 눈을 떴으니까 이걸 어떻게 가르쳐야하는지 앞이 깜깜하신거지.)

학위 수준에 관계없이 이런 S대 후배들이 많았던 걸 보면, 특히 전기, 기계, 화공 (&컴공) 등 공대에 압도적으로 많았던 걸 보면, 본인 탓이 아니라 학교 교육, 특히 한국의 학교 교육 탓인 것 같다.

미국에선 나랑 같이 Mathematica 여름 캠프 왔던 공대 박사 애들이 나보다 수학 못하는 애들이 별로 없었거든.

이래서 한국 공대 출신들은 석,박을 했어도 MSc AI 입학 사정에 인정해주지 않기로 결정한거다. 모르긴해도 대부분은 MSc DS도 아니고 MBA가야되는 수학 실력을 갖고 있을 것이다.

예전에 경영학과 학부생 하나가 배우는거 없는 전공이라는걸 솔직히 인정하고, 닉네임을 “바보학과“라고 썼었다.

요즘보면 우리나라 공대가, 특히 국내 CS 전공자들이 그 닉네임을 써야 될 것 같다.

아니, 자기네가 AI 전문가라고 사기치고 있으니까 “사기학과“라고 써야될려나?

 

저 바보학과 분은 학부 4학년에 정신차린 다음, 죽을 고생을 해서 통계학 석사하고 바보 타이틀을 벗으셨다. 우리나라 공돌이들이 앞으로 어떻게 진화할지, 아니 영원히 진화를 못할지, 앞으로 몇 년간 재밌게 지켜보게 될 것 같다.

 

2021년 8월 30일 개강 대학원 과정

  • MSc in Artificial Intelligence (상세설명) – 공식 석사 과정 – 향후 MSc AI로 표기
  • MSc in Data Science (상세설명) – 예비 석사 과정 – 향후 MSc DS로 표기
  • MBA in AI BigData (상세설명) – 비전공자 석사 과정 – 향후 MBA로 표기
  • DBA in AI BigData (상세설명) – 비전공자 박사 과정 – 향후 DBA로 표기

Similar Posts