Johns Hopkins 데이터 과학 석사 프로그램 소개

2
pabii research

구글링을 하던 중에, 괜찮은 데이터 사이언스 석사 프로그램을 발견해서 소개한다.

Johns Hopkins University라고, 의대로 매우 유명한 대학인데, MSDS 프로그램을 굉장히 잘 짜놨더라.

우선, 몇 가지 국내 학생들이 잘 몰라서 이상하게 생각할만한 부분부터 지적하며 소개 글을 시작한다.

(Source: Johns Hopkins University)

 

1. 전공 이름은 Department of Applied Mathematics and Statistics

Data Science 석사 프로그램이 있는 단과대학 이름이 “응용 수학 & 통계학과”다.

한국인들 대다수는 공대 컴퓨터 공학과 산하에 Data Science가 있어야 한다고 생각할텐데,

현재 국내 컴공의 교육 수준을 생각해 봤을 때, 심지어 해외 대학을 간다고 해도 그런 주장에 동의하기 좀… 그렇다.

무엇보다, 이게 컴공 특화된 연구 주제가 아니다.

 

이 단과대학의 연구 주제를 보면,

  • Computational and Applied Mathematics
  • Discrete Mathematics
  • Financial Mathematics
  • Operations Research and Optimization
  • Probability and Stochastic Processes
  • Statistics and Machine Learning

이 눈에 들어올텐데, 역시 잘 모르는 분들은 Statistics and Machine Learning이 다른 주제들과 완전히 독립적이라고 생각하실 것이다.

우리 눈엔 이용하는 수학, 통계학 도구 학문 기준으로 겹치는 부분이 많아보이는 연구 주제들이다.

즉, 같은 방법론을 쓰면서 결과물이 나오는 주제만 조금씩 다르다고 생각하면 된다.

그리고, Data Science 라는게, 이런 연구 주제들 다루는 사람들에게는 석사 레벨(이하)에서 볼 만한 일종의 기초적인 지식이다.

 

참고로, 나의 대학원 시절 주력 연구 주제는 저 위 리스트의 3번째 토픽인 Financial Mathematics였는데,

난 Discrete time, Continuous time 모델링 지식을 첫 1년간 배웠고, 각각의 경우에 Optimization 계산방법을 (당연히) 공부했었고,

Continuous time을 이해하기 위해 Stochastic calculus를 배우는 와중에 Probability and Stochastic Processes를 공부하고,

심지어 그 과목 석사 수업 TA도 박사 과정 중 총 4번했고, 그걸로 Best TA of the Year 상을 받기도 했다.

Computational method를 이해하고 쓰기 위해 Computational Stat과 시뮬레이션을 배우던 중에

Computer-based 계산법 리스트에서 Machine Learning이라는 주제도 공부했었다.

Machine Learning 수업 중에 Optimization을 Discrete과 Continuous 경우로 나눠서 다 풀어봤고,

Non-linear 함수로 Computational 방법론을 써야될 때, 특히 Deep Learning의 Back-propagation이라는게 쓰이는 걸 보기도 했다.

쉽게 말하면, 당신들에게 뜬금없겠지만, Financial Math라는, “인공지능”과 아무런 관련없어 보이는 공부하면서

자의반 타의반으로 위의 6개 Bullet point들을 다 최소한 조금씩은 공부했었다.

당신들이 “인공지능”이라고 열광하는 Deep Learning이라는게 우리가 배우는 여러 수학 도구 중 일부에 불과했다는 말이다.

도구에 대한 선택과 집중은 내가 잡고 있던 세부 연구 주제 (Systemic risk, 은행 시스템 동시 붕괴)를 위해 어떤 수학을 어떻게 쓰느냐에 달려 있을 뿐이었다.

 

컴공은 위의 방법론들 중 일부를 이용해서 이미지 인식, 자연어 처리 같은 주제를 다루는 세부 전공을 갖고 있는 것으로 안다.

즉, 다른 세부 전공하는 컴공 전공자들은 우리 같은 사람들 눈에 “Data Science”라는 주제와 별로 관련이 없는 분들이다.

예를 들어 “Data Engineering”에 해당하는 Database 설계, 제작, 운영 정도에 해당하는 업무는 우리랑 수학적으로 별 상관이 없다.

그 분들이 자기네가 Data Engineer라고 인정하고, 잘 모르는 Data Science에 대해 별 말을 안 하고 살았으면 나도 별 관심이 없었겠지.

수학, 통계학 방법론 교육이 거의 안 된 수많은 컴공 전공자들이 자기네가 Data Science의 주류인 것처럼 주장하기 때문에 그간 목소리를 높여왔을 뿐이다.

말을 바꾸면, 세부전공별로 다양한 수학, 통계학 도구들 필요도가 다른데, 초점을 “대학의 분류 전공”에 맞출게 아니라,

연구에 쓰는 “수학, 통계학 도구”라는 관점으로 바꿔보면, 컴공의 대부분은, 최소한 개발자라는 사람들은 비전공자들이라는 결론이 나온다.

개발자들 대부분은 수알못들이고, 아니라도 해도 내가 말하는 수학, 통계학 방법론을 배운 분들은 거의 없기 때문이다.

좀 더 포괄적인 표현을 쓰면, 대학원에서 저 위의 수학 주제들을 안 배운 사람들은 모조리 비전공자라고 봐야 한다.

 

2. 단과대학 소속은 공학

그간 내가 한국 공대는 Machine Learning 교육을 제대로 못한다고 굉장히 강하게 비난했기 때문에

공대가 아예 ML, DL로 불리는 지식을 모른다고 주장해왔다고 오해할 수도 있겠으나,

한국의 컴공, 한국의 공대가 제대로 된 수학, 통계학 교육을 안(못!!!) 하고 있다는 것을 주장해 왔을 뿐,

위의 연구 주제들이 대학의 국적에 관계없이 공대가 철저하게 배격되어야 한다는 주장이 아니었다.

계속 이야기하지만, 초점을 한국식 전공 이름이 아니라, 영미/유럽식으로 수학, 통계학 방법론에서 봐야한다.

 

Pure Math, Pure Stat이 아닌 모든 전공을 자연대학 밖으로 독립시키는 대학들을 가면,

위의 전공들이 공학 대학 산하나, 혹은 경제학 대학원이나 심지어 경영학과에 있는 경우도 종종 있다.

위에 쓴대로, 이런 방법론을 쓰는 전공이 굉장히 많다. 국내식으로 정한 어느 한 전공만 배우는 수학,  통계학 방법론이 아니다.

(물론 Pure가 아니더라도 끌어안고 가면서 자연대에 배정해놓는 경우도 많다.)

 

Johns Hopkins도 위에서 보듯이 역시 공과대학 산하에 응용 수학 및 통계학과가 있고, 거기서 Data Science를 가르친다.

 

그리고, Data Science 석사 과정 설명에

  • Applied Mathematics
  • Statistics
  • Computer Science

를 기본 바탕으로 가르친다고 되어 있다.

 

왜냐면, 이쪽 전공에서 배우는 수학, 통계학이, Pure Math, Pure Stat에서는 잘 쓰지 않는 수학, 통계학이기 때문이다.

위에서 Computer Science를 왜 넣었는지 모르겠는데, 내 관점에서는 “코딩이 필요”해서 넣은게 아니라,

이미지 인식, 자연어 처리를, 어쩌면 데이터 베이스 관련 지식 일부를 가르치려고 넣은 것처럼 보인다.

왜냐면 우리에게 코딩은, 개발 코딩이 아니라 Computational Science를 위한 코딩은, 영어 실력 같은 기초 상식이니까.

공부하는데 영어가 필요하다는 이유로 저기에 English라고 써 놓진 않았잖아.

 

대학원을 Quantitative 전공으로 가면,

물리학, 공학, 경제학 가릴 것 없이, 연구주제에 따라 위의 “응용” 수학, 통계학 방법론을 배운다는 측면에서 비슷비슷하다.

내가 정규 분포 간 Correlation 커질 때 분포함수 모양이 이상하게 바뀌는걸 보여주기 위한 만든 Copula를

퀀트 마케팅 하던 연구실 방돌이나, 방돌이 남친 공돌이가 보고 코드 받아가고 그랬던 적도 있었다.

다들 Joint distribution 기반으로 Generative model 만드는 작업에 시뮬레이션 돌리는건 비슷비슷한 상황이었거든.

반대로 걔네가 만든 시뮬레이션으로 내가 풀던 Stochastic calculus 문제를 좀 쉽게 풀었던 기억도 있다.

 

Johns Hopkins는 AMS (Applied Math & Stat)에서 좀 특이하게 Stochastic calculus를 쓰는 분들이 좀 더 모여있는데,

덕분에 Financial Math, Stochastic Process 같은 주제가 저 단과대학 연구 주제에 포함되어 있는 것으로 보인다.

 

한국인 입장에서는 경영학과 산하에 있는 어느 전공을 다른 학교에 가니 공대 산하에 넣어놨다는게 이해하기 어려울 수도 있겠으나,

수학, 통계학이라는 방법론의 관점에서 보면, 너도나도 쓰고 있는 도구들이기 때문에,

배정된 단과대가 중요한게 아니라, 같은 도구들을 쓰는 사람들의 모임이라는 관점에서 전공을 바라봐야 한다.

(Source: Johns Hopkins University)

 

3. 한국 대학 교육과 다른 점

상세하게 어떻게 가르칠지는 잘 모르겠지만, JHU의 Data Science MSE 교육을 맡으신 교수님들 면면을 보면,

대부분이 공학 전공인데 위의 Computational Science쪽 훈련도를 갖추신 분들이다.

 

우리나라의 Data Science 교육 과정 상당수가

  • 공학인데 Computational 주제를 거의 공부 안 하신 분, 심지어 기초 통계학 훈련도 안 되신 교수님들
  • 경영학인데 Computational 주제를 거의 공부 안 하신 분, 약간의 통계학 훈련도를 갖추신 교수님들

위주로 교육을 구성한다.

위의 Bullet point 교수님들 대다수의 기초 통계학 훈련도가 매우 낮다는 사실, 그래서 Data Science를 가르칠 준비가 안 되어 있다는 사실을 이미 여러차례 지적한 바 있다.

위의 지적에 화나는 공학/경영 교수님들 있으면 우리 SIAI의 학부 2학년 기출문제 풀어서 70점 (A-) 이상 받는걸 보여주시면 된다.

장담컨데 경영에서 (Applied) Econ 공부하신 교수님들, 공학에서 영미식으로 이론 모델링 공부하신 극소수를 제외하면, 우리나라 교수진 중에 50점 넘기는 분이 거의 없을 것이다.

 

이게 코드 열심히 돌리고, 실험 열심히 하고, 프로젝트 열심히 돌리는 (그러면서 정부 지원금에 목숨을 거는) 대학원을 운영하는 대학들과,

수학, 통계학 도구를 제대로 쓰지 못하면 진입자체를 차단해버리고, 세부전공 하나하나에 쓸 인재 풀이 많은 시장에 있는 대학간의 차이다.

 

해외 정상교육을 하는 곳에서는 Computational method를 다양한 세부 전공에서 자기들 목적에 맞춰 쓰는 일들이 일상이기 때문에,

특별히 어느 전공을 찾아가야 특정한 계산법을 배우는게 아닌 방식인데,

국내는 Computational method를 제대로 이해하고 있는 교수진을 공학 쪽에서 찾기가 쉽지 않다.

그러다보니 국책 연구원에서 일하는 (국내파) 공학 박사가 Dynamic optimization을 몰라서 Bellman equation 공식 나온 화면에 뜻도 모르는 주제에,

인공지능이 곧 통계학 공부할 필요성을 없앤다고 당당하게 주장하는 발표를 할 수 있는 것이다.

그 발표를 위해 아까운 국민 세금이 몇 억이나 쓰였다는 가슴 아픈 사실을, 그렇게 낭비되는 국민 세금이 연간 수천억에 이른다는 사실을 굳이 상기시키고 싶진 않다.

 

국내는 일종의 “나와바리” 싸움으로, 공학에서 Computational 방법론을 쓰겠지~, 그게 인공지능이겠지~ 라고 무능한 공무원들이 믿고 가는 방식인 반면,

미국을 비롯한 해외 시장은 Computational 방법론을 쓰는 다양한 세부 전공 출신이 적합한 인재지, 공학도라고해서 무조건 적합한 인재가 아니라는 사실을 깨닫고 있다.

일종의, “쟤는 종로 출신 아니니까 종로파 주먹패 자격 없어~” 라는 생각과, “종로 출신이건 영등포 출신이건 주먹질만 잘하면 된다”는,

나와바리 중심 사고방식과 실력주의 사고방식의 차이라고 생각하면 된다.

 

나와바리 vs 실력주의

국내 귀국 후, 수 많은 곳에서 나와바리 중심의 사고 방식을 봤다.

특정 전공 교수 그룹은 자기네 학교에 내가 Data Science 단과대학을 설립해주고 서로 수익 배분을 하자는 대화를 하는 자리에

“근본 없는 새X가 와서 물을 흐리고 있다”는 격한 표현을 쓰기도 했고, (정작 그러면서 Bellman equation 하나 제대로 못 풀더라.)

Y모 대학은 통계학과 교수진과 컴퓨터 공학과 교수진들이 총장실에서 서로 멱살을 쥐고 싸우며 “빅데이터”라는 단어를 어느 과에서 갖고가야하는지 논쟁했다더라.

그 두 그룹 모두 Bellman equation, Hamiltonian을 위시한 Dynamic optimization을 제대로 안 하시는 전공들 아닌가?ㅋ

오히려 기계항공, 도시공학, 산업공학, 물리학, 경제학 같은 분들 중에 관련 주제를 잡았던 분들이 훨씬 더 이런 지식이 많으실 것 같다.

 

나와바리 방식이 아니라, 실력을 제대로 이해하는 분들이 프로그램을 짜서 “총장님 승인”과 “교육부 승인”을 받을 수 있는 세상이었으면,

아마도 JHU처럼 기계, 도시, 시스템, 산업 같은 공학 전공과 물리학, 경제학 전공에서 Computational 방법론을 매우 열심히 공부하신 교수님들이

Data Science 프로그램을 가르치는, 국가의 미래를 짊어지는 막중한 책임을 맡으셨을 것이다.

반대로, Bellman equation 하나 제대로 셋팅 못 하는 국내대학들의 AI대학원 교수들은 청소부… 최소한 여기에 감히 발을 들이밀지 못했겠지.

 

어느 쪽이건 좋은 프로그램을 만들고, 그걸 “시장”에서 판단해서 합리적인 교육을 받을 수 있는 곳에 학생이 몰리는 “경쟁”구도 대신,

정부 지원금을 어느 전공에서 받느냐, 그 돈으로 어느 전공이 등 따뜻하고 배 부르게 살 수 있느냐라는,

정부 주도의 관치 시스템 아래에서 왜곡된 시장 정의를 겪고 있는 한국의 자화상일 것이다.

 

반값 등록금이라는 반시장주의 제도, 교수진들이 충분히 다른 곳에서 금전적인 보상을 볼 수 없는 사회적 시장구조 아래,

학생 숫자를 바탕으로 받을 수 있는 정부 지원금에 목을 매달고 살 수 밖에 없는 나라에서 정상적으로 고급 교육을 만나기는 어려울 것이다.

이 모든 상황을 파악하고 나니, 제대로 된 교육을 받고 싶으면, 특히 Data Science 관련해서 제대로 된 교육을 받고 싶으면,

무조건 한국 대학을 피해라고 충고하는게 맞는 시장이 되어 있는 것 같다.

 

사실, 이렇게 정부 개입과 대학 카르텔 연합으로 엉망 교육 프로그램 뿌려서 세금 버리고 있으면,

학생들이 적극적으로 보이콧을 해야 관계자들이 정신을 번쩍 차리고 개선한다.

집단으로 모여 데모를 하던가, 아님 아예 아무도 지원을 안 하던가. 근데 그게 안 되는게 현실이잖아.

결국 목 마른 사람이 우물을 파는 수 밖에.

 

목 마르면 해외로 나갈 수 밖에

그런 측면에서, 위에 설명한 JHU의 MSDS 프로그램은 굉장히 좋은 프로그램이다.

관련 전공들 상당수가 모여있기 때문에, 제대로 관점을 잡고 딱 Computational method 쓰는 사람들만 모아놓은 전공이기 때문이다.

저렇게 Research 주제들이 뽑혀 있는데서 나처럼 배경지식이 비슷한 사람들은 JHU의 MSDS에 무한 신뢰를 보내게 된다.

 

교육 설계만 확인하고 더 뒤져보질 않아서 솔직히 프로그램의 랭킹이나 취업률, 학비 등등의 상세 정보에 대해서는 아는 것은 없다.

물론 교육 설계와는 달리, 실제로 강의하는 교수의 실력이 엉망이면 원하는 수준의 교육이 안 나오기는 하겠지만,

JHU 정도 되는 명문대라면 인재 풀이 그렇게 없지는 않을 것이라고 생각한다.

조금만 실력없어도 사정없이 쳐내고 다른 곳에서 실력파 교수를 당겨올 수 있는 대형시장에 있는 학교니까.

최소한 한국처럼 교육부 관계자들이 시키는대로 정해서, 나와바리 싸움을 해가며 전공을 운영하지는 않아도 되는 곳이니까.

 

MSDS가 아니더라도, Data Science 학,석,박 전반으로, 아니 어떤 전공이건 관계없이, “실력주의” 기반으로 운영되는 학교를 가면,

좋은 교육을 받을 수 있는 확률이 엄청나게 올라간다. 학교의 랭킹은 둘째, 셋째 문제다.

 

누구나 다 Harvard, MIT, Stanford 같은 초특급 명문대를 다니고 싶겠지만, 자리는 한정되어 있다.

좀 덜 명성있는 학교에 가게된다면, 위의 “실력주의” 위주로 대학을 운영하고 있는 학교를 찾아가시기 바란다.

과 이름만 만들어놓고, 교내 정치 (나와바리) 싸움에서 이긴 전공 교수들이 우르르 들어와

자기가 타 전공에서 가르치던 노트를 그대로 쓰면서, 출판사에게 받은 책과 강의노트를 그대로 읽기만 하는 수업을 하면서,

정부 지원금 받는 것에 목숨을 걸고 있는 학교를 가면, 당신의 아까운 시간은 낭비될 뿐이다.

Similar Posts