데이터 사이언스에 관심이 많은 비전공자(디자이너)입니다

Policy Korea

안녕하세요, 처음 뵙겠습니다.
저는 데이터 사이언스에 관심이 많은 디자이너입니다.

홈페이지에 여러 칼럼들을 보고 데이터 사이언스에 관련하여 매우
전문적이다라는 생각, 다른 곳과 다르다는 느낌을 받았습니다.
칼럼들을 보며 저도 제대로 배우고 싶다는 생각을 가지게 되었는데요.
저는 비전공자라서 학원이나 국비 수강 생각도 했었습니다.
칼럼 보고 SIAI에 가고 싶다 이런 생각을 했는데 비전공자가
갈 수 있는지 가능성을 알고 싶습니다.

제가 데이터 사이언스에 관심을 가지게 된 건 2년 정도 되었는데요.
처음 알게 되었을 때 수학 이론을 활용한다고 하여 수학 기초부터
배우기 시작해서 현재 고등수학1~2 계속 공부하고 있습니다.
현재 30대 중반이라서 배우는 속도는 더디지만 차근차근 하고 있는데요

당장에 입학은 무리일 것 같고 제가 어떤 걸 준비해야 입학이
가능할까요? 겉핥기로 배우고 싶은 게 아니라 긴 여정을 생각하며
제대로 공부하고 싶습니다. 데이터를 제대로 분석하고 활용할 수 있는
분석가가 되고 싶은데…입학 시험 문제를 보니 배웠던 수학이 나오기는
하는데 어떻게 풀어야 할지는 잘 모르겠습니다.

현실적인 가능성과 가능하다면 무엇을 준비해야할지
알려주시면 정말 감사하겠습니다!


먼저, 저희 SIAI의 MSc AI/DS 과정 입학 시험 문제는 한국 최상위 0.01%를 걸러내기 위한 시험인 관계로,
대부분의 한국인이 문제의 의도조차 파악 못하는 것이 정상이라고 생각됩니다.

실제로 최상위 0.01%를 제외한 모든 학생이 관련 전공이라는게 무의미 할 정도로 제대로 교육이 되어 있지 않기 때문에,
MSc AI/DS보다 수학, 통계학 훈련 단계가 크게 낮은 MBA AI/BigData 프로그램이 일반적인 한국인을 대상으로 만들어진 프로그램입니다.
MBA AI/BigData 프로그램 입학생들을 봐도 예체능 출신, 어문계열 출신, 경영학과 출신들이 통계학이나 공학 출신보다 훨씬 더 성적이 좋은 경우도 많습니다.
현실적으로, 문의주신 분도 MBA AI/BigData에서 1년 정도 학부 1-2학년 수준의 수학, 통계학 지식을 활용한 데이터 과학을 배우는 편이 가장 합리적으로 보입니다.

30대 중반 분이면 한국에서 7차 교육 과정을 겪으셨을텐데, 고교 문과 수학에서 다루지 않았던 미적분 개념을 이해하고,
국내 대학 1-2학년 이과 학생들이 배우는 미적분학, 미분방정식, 선형대수학 개념을 어느 정도 숙지하면,
MBA AI/BigData를 따라오는데, 최소한 수학적으로는, 큰 무리가 없으리라 판단됩니다.
위의 사항은 이미 SIAI를 공동설립한 주식회사 파비에서 운영 중인 파비블로그에 장기간의 포스팅으로 여러 차례 정리가 된 내용이기도 합니다.

그러나, 국내 대학 1-2학년 이과 교육을 평범한 30대 직장인이 받는 것 자체가 굉장히 어려운 일이고,
명문대 이과 출신이어도 30대 중반의 직장인이 되면 대학 시절 배운 수학을 깡그리 잊어버리는 것이 일반적으로 만나는 현실입니다.
저희 SIAI의 MBA AI/BigData 학생들의 경험담을 봐도, 국내 대학 수업을 다시 찾아듣기보다
SIAI 입학 후에 수업을 들으며 모르는 개념을 거꾸로 찾아가는 편이 더 빠르고 효율적인 학습이 이뤄지는 것으로 보입니다.
설명회 영상 중에 MBA AI/BigData 재학생들이 외부에서 여러 강좌 찾겠다고 시간 끄는 것보다 빨리 들어와서 부딪히는 편이 더 낫다는 답변을 하는 걸 볼 수 있을 겁니다.

정리하면, 6차 교육 과정 기준으로, 혹은 7차 교육과정 + 미적분 정도의 고교 문과 수학을 무사히 따라올 수 있으면
MBA AI/BigData에 도전해 볼 수 있을 것이라고 결론을 내릴 수 있습니다.

파비블로그가 운영된지 5년차에 접어드는만큼, 많은 질문에 대한 답변이 블로그 여러 곳에 흩어져 있으니,
여러 차례 읽어보면 개념적인 이해에 어느 정도 도움이 되리라 생각됩니다.


 

보통 이런 질문을 보내는 분들 99.999%가 파비블로그를 제대로 꼼꼼하게 안 읽었기 때문이라 무시하고 넘어가는데,

한번 예외를 뒀다.

 

왜?

MBA AI/BigData가 (적어도 내 기준에는) 정말 저런 분들을 대상으로 만든 학위 과정이기 때문이다.

누가 비슷한 질문을 하더라도 그냥 이 글 보라고 할려고.

 

입학하면 처음 몇 달간 정말 내가 이걸 할 수 있는게 맞나, 잘못 온 게 아닐까는 생각을 엄청하게 되긴 하겠지만,

이런 종류의 “수학적”, “추상적”, “개념적” 지식을 처음 만나는 모든 사람이 똑같은 경험을 한다. (아주 슈퍼 천재가 아니라면.)

누가 영어로 떠드는데 영어를 한 마디도 못 알아듣다가, 생존 영어로 조금씩 몇 마디 늘어나는 것과 아주 비슷한 경험이다.

책으로 영어 공부를 10년해봐야 외국인 만나면 입도 뻥긋 못하는데, 정작 외국인들 사이에서 부대낀 애들은 그래도 몇 마디 하는거…

 

어려울 것이라고 겁 먹는게 당연하고, 실제로 그렇게 처음 몇 달간 두들겨보고 도저히 안 되겠으면 어쩌랴, 짐 싸야지.

근데 우리 Attrition rate이 10% 남짓 밖에 안 된다.

대부분은 시험 대비 문제 풀어줄 때까지 무슨 말인지 하나도 모르는채로 영혼이 이탈한 상태로 있다가, (이건 당연한거다)

시험 대비 문제 몇 개로 전체 그림을 그려주면 왜 이런 교육을 받았는지 팍팍팍 이해하더라.

1st term 시험은 좀 깝깝했는데, 2nd term 채점 해 보면서 이제 실력이 훅~ 뛰어 올랐다는걸 새삼 느끼게 됐다.

 

이걸 딱 4달 해 보고 (1st, 2nd term에 그렇게 기초 수업들을 배정해놨다),

못 넘어가겠거든 포기해라.

근데, 예체능, 어문, 경영 같은, 이쪽 리그로 봤을 때는 고교 수준 밖에 안 되는 학생들도

처음에 엄청 괴로워하더니 지금은 쑥쑥 자라나 있다.

오히려 공돌이들이 못하는 경우가 더 많다. (아니 이게 당연한건데, 자세한건 밑에 써 놨다.)

수업 예시

인공지능 마니악들이 RNN으로 비정상 패턴을 찾아낼 수 있다고 주장하는데, 결국 Non-linear 방정식 찾는 게임이고, 분포함수를 알고 있으면 MLE가 제일 좋은 계산이다, 그래서 멤버쉽 해지율, 파산 확률 같은건 베타 분포, 포아송 분포 같은 분포함수 쓰는 리그에서는 인공지능이라고 불리는 Neural Net 따위는 거들떠 보지도 않고 살았고, 패턴이 있어야 RNN이건 뭐건 Non-linear 방정식을 세울 수 있을텐데, 패턴이 없는 데이터에 무조건 Neural Net을 쓰면 마법처럼 다 계산이 된다는건 말도 안 되는 헛소리죠

차라리 비정상 패턴 데이터 숫자가 너무 적으니까 Disproportional sub-sampling을 한답시고 Stratified sampling을 하는게 없는 패턴 찾겠다고 컴퓨터 학대하는거보다 더 낫지 않겠어요? 최소한 Computational efficiency는 더 낫게 나올거 같은데? 이것도 분포함수를 알면 Importance sampling을 활용해서 Change of measure 관점으로 수학적으로 엄밀한 계산을 할 수 있겠지만, 비정상 패턴이라는게 분포함수가 어딨겠습니까, 아쉽지만 타협을 해야죠.

라고 5달 남짓 훈련 받은 MBA AI/BigData 학생들에게 AI in Digital Marketing라는 강의의 3강 Anomaly Detection 수업에서 이야기 했는데,

다들 알아 들었다. (물론 더 구체적인 내용을 다 알기엔 아직 내공이 부족하겠지만.)

그 앞의 5개월 남짓 동안 배운 기초 개념들이 탄탄하게 쌓여있기 때문이겠지.

기초 개념을 계속 끌어쓰는 응용 수업들을 몇 개 듣고나면 내공이 더 탄탄해질 것이라고 생각한다.

올 가을에 졸업 논문들 발표할 때쯤되면, 좀 더 내공이 다져진 결과물들을 보면, 내 말이 진짜라는걸 눈으로 확인할 수 있을 것이다.

우리가 아예 공식 등록된 학회를 만들고, 세미나를 공개로 할 꺼거든.

 

아마 위의 코멘트를 우리나라에서 알아들을 수 있는 “자칭 Data Scientist” 숫자가 100명이 넘으면 기적일 것이다.

국내 대학 AI, DS 전공자들 중에 학위 교육과정만으로 단 한 명이라도 위의 코멘트를 다 알아들으면, 그래서 연관 질문을 대답할 수 있으면, 강남대로에서 큰 절을 하겠다.

국내의 대학 교육 수준이, 특히 공대가 하는 AI/DS 교육이 “대학 교육” 수준이 아니라 “학원 교육” 수준이기 때문이다. (=이론 훈련없는 직업 교육)

국내 “학원”이라는 곳의 최대치가 외국 대학 공개 동영상 강의 틀어놓고 TA 수업해주는 수준인데,

대학 교수라는 사람들이 그 동영상들보다 깊이가 없는 경우가 대부분이거든. 근데 직업 교육 수준도 형편없고.

그러니 꼭 학위 딸 필요없다고 생각하는 애들이 학원 찾아가는거겠지.

아님 독학하면 된다고 생각하고. 돈 아깝거든. 진심 돈 아깝다.

 

“학원” 아니고 “대학”

우리 SIAI는 “학원”이 아니라 글로벌 탑레벨 수준의 교육을 재생산해내는 “대학”이다.

저 위의 수업 중 설명 예시를 보면 알겠지만,

수학, 통계학으로 이론적인 훈련이 탄탄하게 갖춰져야 논리를 따라올 수 있는 설명이다.

저 정도 레벨은 국내 대학, 특히 국내 공대처럼 출판사가 써 준 교과서 따라 읽기하는 교수들이나,

외국 대학 강의 동영상 틀어주고 TA 수업 스타일로 코드나 붙여주는 학원 강사들에게서는

절대로 들을 수 없는 내용이라는 것에 손가락 10개 다 걸 수 있다.

 

애당초 저정도 지식 수준을 갖춘 한국인이, 해외엔 좀 있을지 몰라도, 최소한 한국 땅에 몇 명 없다.

한국에서 “관련 분야 인재”라고 하는 사람들이 다들 코드 복붙”충”에 불과하거나, 수학, 통계학 훈련 수준이 “계산기” 수준에 불과하기 때문이다.

코딩과 AI를 대입에 반영해야“한다고 주장하는 어느 학회 주관 토론회의 참석자 면면을 보면,

정말 단 한 명도 코딩이 왜 중요한지, 코딩을 잘 하기 위해서 수학적 지식이 왜 필요한지, AI라는게 전부 다 수학이라는게 무슨 말인지

이해하는 사람이 단 한 명도 없다.

 

저 기사에 언급된 어느 교수라는 인간은 모 연구소 원장으로 초빙되었다가 실력이 뽀록이라는게 들통나서 하루만에 짤린 적도 있을 정도다.

짜르고 난 다음에 나한테 잘 짜른거 맞냐고 확인 연락왔길래, 얼마나 바보인지 장문의 확인사살 답장을 보내준 적도 있다.

(출강나간 타 대학 석사생들 연구 주제가 상상 속에서만 가능한, 기초 수학으로도 말이 안 되는 상황인걸 지적조차 못 해주는 인간이었다.)

저 교수와 더불어 그 연구소 원장으로 하마평이 올랐던, AI전문가, 빅데이터 전문가라고 떠들고 다니는 교수 몇 명이 얼마나 바보인지 그 연구소 직원들이 다 알고 놀림감으로 삼고 있더라.

학제간 연구해보려고 AI대학원의 공대 교수들 만나봤던 학부, 석사 동기 출신 (제대로 훈련받은) “경제학”, “경영학”과 교수들이 공통적으로 하는 이야기도 마찬가지다.

AI공대 걔네들 좀…(주변 눈치 살짝보고) 심하게 모르더라. 통계학 훈련이 하나도 안 되어 있던데, ML, DL, RL 그거 전부 통계 응용한 계산인데, 어떻게 쓸 줄 안다고 그렇게 우기는거래?

국내 AI대학원? 거기 대학 아니라까. 공고, 인터넷고등학교 라니까.

대학, 대학원은 우리 SIAI지.

 

“박사님”들만 하는 어려운거 아닌가요?

이론적 기초 레벨의 지식을 이해하고 있어야 무조건 “딥러닝 따라하기”류의 “ResNet이 깊이가 깊어서 좋은 모델이라던데요?” 같은 류의,

어디서 주워들은걸 아는체 하는 수준, “이제 딥러닝 공부 좀 했어요, 코드로 돌려봤거든요” 같은 수준이 아니라,

언제, 어디에, 어떻게, 어떤 변형을 적용해서 무슨 계산 모델을 써야하는지 제대로 이해하는 “진짜 전문가”로 성장할 수 있다.

어차피 ResNet, ConvNet 이런 축약어들은 기초 개념만 정확하게 알면 별 수고 없이 1시간 남짓 구글링만으로

그런 지식을 몇 달 동안 YouTube나 개발자 커뮤니티, 블로그 같은델 찾아다니며 공부(Read 자료 스크랩)한 애들보다 훨씬 더 깊이있게 알 수 있게 된다.

단순 지식 습득 수준이 아니라 응용으로 확장되면 이건 뭐 비교 자체가 실례인 수준이 되는거고.

 

보통은 그런 수준은 “박사 졸업하고, 엄청나게 공부 많이 한 사람만 하는거 아닌가요?”라고 할텐데,

예체능, 어문, 경영 같은 학부 전공자도 우리 SIAI의 MBA AI/BigData 5달 교육으로 위의 설명을 다 알아듣는다니깐?

5달 훈련으로 저걸 알아들으면 1년 훈련 후에 어떤 능력치를 가지게 될지 상상이라도 되심?

 

공대가 특히 AI공대가 정말 심각하게 수학, 통계학 훈련도가 낮기 때문에,

거긴 “박사님”이어도 저런 기초 훈련이 안 된 수준이라 모르는거고, (모르는게 당연한거고)

다른 “정상적인” “Quantitative 전공”들 (수학, 통계학, 물리학 등등의 모든 이학 + 경제학, 파이낸스 같은 일부 사회과학들 + 글로벌 수준으로 제대로 가르친 “공학”들)

교육을 글로벌 수준으로 받고나면, 학부 고학년만 되어도 충분히 할 수 있는 이야기다.

(이러니까 국내에 우리 SIAI 교수로 뽑을 인재가 가뭄에 콩 나는 수준도 안 되는거)

 

전공자? 걔네도 제로 베이스인건 똑같애

즉, 당신들이 어차피 “전공자” 출신이어도, 심지어 “박사”출신이어도 저런 교육을 받았을리가 만무하기 때문에,

(정상적인) 대학 교육을 받았을 것이라고 기대를 안 갖고 있다.

우리나라에 전공자 따윈 없다고 봐도 무방하다. 위에 길게 쓴대로 우리나라 대학 교육은 엉망이거든.

결국 기업 현장엔 코드 복붙하는걸로 전문가인체 하는 짜가들만 있을 뿐.

 

교육 과정을, 특히 MBA 교육 과정을 만들면서 이런 사정을 감안해서, 대학 수학을 그냥 좀 심하게 말해 포기했다.

그냥 고등학교 수학만 잘 배워놨으면 된다. 어지간한건 다 고교 수학을 끌어와서 설명하고,

도저히 안 되겠다 싶으면 유비 추리 이용한다. (ex. 함수를 밥솥이라고 생각해봅시다, data pre-processing? 이건 쌀 씻기 같은거죠.)

대신 대학 수학 하나도 없이 설명하는게 불가능하니까, 이것저것 필요한걸 끌어와서 쓸텐데,

그건 학부 때 안 한 대가를 지불한다고 생각하고 나올 때 마다 공부하면 된다.

블로그, YouTube, 커뮤니티 같은 껍데기 수준보다 더 깊이 있게 공부하려면 이 정도의 노력은 더 해야되겠지?

이런 노력도 없이 거저 먹을 수 있으면 세상에 다들 천재만 있을라고ㅋ

 

저 교육을 “비전공자”에게 할려고 나도 커리큘럼 만들며 머리를 수천번도 더 쥐어짰는데,

어쨌건 지난 몇 달간의 성과를 보면서 나도 이젠 확신을 갖고 말한다.

어지간히 꽉 막힌 머리에 “추상화”라는 걸 아예 못 따라오는 저능아만 아니면 우리 교육으로 시야가 완전히 달라질 것이다.

반 년만, 늦어도 MBA 졸업하는 1년만에 주변의 “AI전문가”들을 지식 수준, 사고 체계, 논문 읽기의 깊이 등등 모든 면에서 다 따라잡을 것이라는 것에 확신을 갖고 말할 수 있다.

그만큼 국내 AI교육이 쓰레기다. 아니 우리 MBA 교육에 그만큼 자신을 갖게 됐다.

Similar Posts