통계 문맹 + DNN 마니악이 되는 이유

1
pabii research

우리학교 조교(TA)를 맡고 있는 어느 학생이 학생들에게 쓴 글의 일부다.

 

Part I. 선형대수 무새(?)


요새 제가 Machine Learning TA 시간에 선형대수 무새(?)가 됐는데, 데이터 분석을 하는 사람들이라면

수리통계를 모르더라도(알면 좋습니다), 심지어 미적도 고등 이과 + 테일러 급수 수준으로만 알아도 좋으나,

선형대수는 무조건 넘어야 할 산이라 생각합니다.

Linear Regression부터 수많은 통계 / 머신러닝 모델들이 선형대수를 모르면 개념 연결이 되지 않습니다.

그냥 자격증 따듯이 암기만 할 뿐이에요


 

우리가 내년부터 BSc Data Science 학부 과정을 개설하려는 중인데, (가을에 MBA 신입 / BSc 편입 받고 확정할 수 있을 듯)

어차피 수학이 전부가 아니니까, 선형대수, 미분방정식, 이산수학 정도만 학부 1학년 때 해 주자고 마음의 결론을 내린 상태에서,

계속 선형대수가 눈에 밟히더라.

 

이걸 1과목으로 끝낼게 아니라,

  • 수학과 방식의 증명 수업
  • 공대 방식의 계산 수업
  • 코딩 위주의 시각화(를 통한 이해) 수업

이렇게 3개를 만들어야하지 않을까는 생각을 지금도 계속 하는 중이다.

 

양자 컴퓨터, 분산처리 같은 CS쪽의 도전적인 주제들을 봐도, 결국 바닥에는 선형대수던데,

저걸 얼마나 제대로 이해하고 올라가느냐에 따라 크게는 학생들의 인생이 완전히 뒤바뀔 수 있다는 생각에

커리큘럼을 어떻게 만들어야할지 고민이 많다.

 

그런데, 우리 TA의 저 문구를 보니, 더더욱 선형대수 교육에 초점을 맞춰야겠구나 싶더라.

나도 선대는 전문 영역이 아닌데, 외부에 잘 가르치시는 분을 어떻게 섭외해야될까 고민이 많다.

 

Part II. 잘못된 접근


회사 신입 중, 당장 실력은 많이 부족해도 열심히 해보려는 것 같아서, 키워보려고 정규직 합격 의견드리고, 이것저것 조언을 했습니다.

그 중 하나가 상반기까지 선형대수를 학부 1학년 수준으로 떼고 오라는 것이었습니다.

중간에 잘 하고 있는지 물어봤더니, 이상한 데이터 사이언스 강의 하나 보고 있더라고요.

물어보니 이미 결제한 강의고, 여기서도 선형대수를 가르쳐 줘서 이걸로 공부할 거고, 제가 알려준 책들은 부교재로 볼 거라고 했습니다.

이상한 거 보지 말고 제대로 공부하라고 하니까 본인은 비전공생이라 이게 맞다고,

안 한다는 것도 아닌데 본인 커리큘럼을 방해하지 말라고 합니다.


 

잘못 뽑았다는 생각이 바로 들었다. 우리 TA도 후회 막심인가보더라.

2가지가 잘못됐는데

  • 선형대수를 모르는데 “많이 부족해도 열심히 해보려는”??????
  • 비전공생이라~ 이상한 데이터 사이언스 강의~ 여기서도 선형대수를 가르쳐줘서…????

 

우선 첫번째 포인트에서, 선형대수 같은 과목은 회사 다니면서, 허접한 강의로 공부하는건 거의 불가능하다고 본다.

우리 MBA AI/BigData 학생들한테도 선형대수 잘 하는거 기대 안 하니까, 개념 이해를 “이야기로 풀어내는”데만 집중해라고 하거든.

(그럼에도 불구하고 선대를 활용하는 주제로 공부량이 상당하고, TA가 Machine Learning이라고 붙은 3번째 학기 과목에서 다시 “무새”가 될 만큼 강조해야될만큼 선대를 많이 다룰 수 밖에 없는 학위 과정이다.)

 

그럼 두번째 포인트에서 제대로 된 강의를 들어야 되는데, 우리 TA가 고심해서 골라 준 책은 부교재로 전락하고,

이상해 보이는 강의 하나만 주워듣고 있는 상태니까, “이야기로 풀어내는” 것 조차도 못하는 직원이 되겠지.

 

Part III. 후회 막심


상식적으로 비전공생인데 데이터 분석을 하고 싶다면, 남들보다 2배 3배는 더 노력해서 따라가는 게 정상 아닌가요?

여러분들만 봐도 피 터지게 노력하시잖아요.

그리고 학부 1학년 과목을 비전공생이라는 말로 변명하다뇨?

이건 비전공생들에 대한 모욕이고, 고등학교 수준으로도 수학을 못 한다는 거나 다름 없습니다.


 

우리 TA가 나 때문에 너무 심하게 흑화된거 아닌가 싶어서 미안하다 ㅠㅠㅠㅠ

거기서 꼰대 소리 듣고 있는건 아니겠지? ㅎㅎ

 

수업 시간에 선대를 포함해서 필요한 수학들을 탁탁 짚어주고 가면서 느끼는 거지만,

기초 훈련이 탄탄하게 된 학생과, 아닌 학생 사이에는 근본적인 격차가 있을 수 밖에 없다.

물론 우리 MBA AI/BigData 같은 학위를 거치면 모든 기초를 완벽하게 알지 못해도 “이야기꾼”이 될 수는 있겠지만,

고교부터 수학 실력을 탄탄하게 쌓아온 실력자를 1년 학위로 단번에 따라잡는건 반칙이잖아?

(물론 거의 대부분의 학부 전공자들이 포맷된 상태로 대학원에 가는건 안 비밀이다.)

 

S대 영어영문학과 출신과 수능 영어 3-4등급 출신을 영어권에 떨궈놓으면,

입도 뻥긋 못하다가, 삶에 적응하면서 Speaking 실력이 점점 늘어나는 순간이 올 것이고,

Speaking이라는 생존의 문제가 해결되고나면,

(정상적인) S대 영어영문학과 출신이라면 어느 시점부터는 고급 영어를 Speaking에 구사할 수 있게 되겠지.

밑바닥에서부터 쌓아올린 격차, “잠재력”이라는게 그렇게 드러날 것이라고 생각한다.

 

저 신입 직원은 선형대수 공부를 내려놨으면 (회사 일하는데 당장 필요없어 보이니까?)

하다못해 제대로 된 강의라도 들었어야 되는데,

우리 TA 눈에 비적격 수업이라면 (어지간한 ML 수업 중에 적격인 강의가 몇 개나 있을라고…. 심지어 비전공자가 주워듣는 강의라면…),

결국 시간만 버리며 “그냥 자격증 따듯이 암기만 할 뿐”인 인재로 성장할 것이다.

 

왜 통계 문맹 + DNN 마니악이 될까?

통계 문맹 + DNN마니악” 이라는 제목으로 쓴 글이 하나 있는데,

그 분들이 왜 문맹인데 종교적인 수준의 DNN에 대한 광적인 믿음을 가지게 됐을까는 궁금증이 정말 오랫동안 있었다.

 

우리 TA의 분노 가득한 표현을 보면서, 이젠 답을 좀 찾은 것 같다.

쉽게 이야기해서, 수학이라는, 선형대수라는 “언어”를 한국인이 영어 배우듯이만 배웠고 (즉 무쓸모…)

제대로 쓸 줄 모르니까, 심한 경우에는 그 언어를 배울 생각조차도 없으니까,

결국엔 자기가 아는 언어 (코딩…)로 적힌 내용만 찾아다니는 것이다.

마치 R로 ML/DL의 개념 잡아주기 강의하면 자기는 Python으로 일 하니까 개념 따윈 필요없고 Python 코드 주는 강의 들어야 된다는 것처럼.

결국 코드로 적힌 걸 복붙하는, 영어 문장 만들 줄 몰라서 남이 쓴 문장을 가져다 베낄 줄만 알고,

자기 스스로 문장을 만들어내는, 수학이라는 “언어”를 이용해서 다양한 문장을 쓸 수 있는 능력은 영원히 못 기르는 3류로 살아가게 된다.

 

Proof is useless unless it’s proof of something people already want to believe.

적혀 있는 말을 이해 못하니 결국엔 남들이 증명이라고 하는건 쳐다보지도 않고, 자기가 아는 지식만 찾아다니는 사람들한텐,

증명이라는거, 논리라는거 그런게 무의미하다.

 

좀 더 쉽게 이야기하면, DNN 마니악이 되는 사람들은 그냥 수학이라는 언어를 쓸 줄 모르는 사람들이라는 결론이 나온다.

영어라고 치면, 체계적으로 탄탄한 훈련을 통해서 쓰는, 영미권의 최상위권 초중고에서 매주 몇 십장의 Essay를 써가며 훈련한 레벨은 아니어도,

최소한 제2외국어지만 생존에는 문제없는 레벨로라도 그들과 대화하고,

자기 나라 언어로는 깊은 생각을 할 수 있는 능력치를 활용해서 부족한 영어 실력을 메워넣을 수 있어야 하는데,

그 부분에서 처참하게 실패한 것이다.

 

아마 ‘수학=계산’, ‘수학=문제 풀이’ 정도로 생각하고 있고, ‘영어 공부=TOEIC시험 공부’, ‘영어 공부=단어 암기 공부’ 같은 굴레에서 벗어나질 못해

‘수학 = 언어’, ‘영어 = 언어’, ‘언어 공부 = 말하기 공부 / 쓰기 공부’ 라는걸 이해 못하고 있는 것과 같은 맥락이겠지.

 

서구 세계와 비슷한 논리적 훈련이 된 인류 사회가 이슬람의 종교광적인 자살폭탄테러를 이해할 수 없는 것과 다를 바가 있을까?

 

이 블로그가 대표적으로 수학을 언어로 “말하기”와 “쓰기”를 하는 컨텐츠를 모은 곳이다.

단지 SIAI 강의 교재처럼 영어로 쓰지 않고, 한국어라는 전달 매체로 써 놨을 뿐.

 

돈을 아무리 부어도 영어 실력이 안 늘고 시간만 쓰고 있는 수 많은 한국인들의 문제와 같은 맥락으로,

심지어 수학은 아예 “가성비 안 나온다”며 무시하고, 그냥 코드 복붙만 하고 있으니,

그렇게 “통계 문맹 + DNN 마니악“이, 아니 자살폭탄테러범이 되어 버리는거다.

 

나가며 – 너무 욕심인가?

한편으로는 우리 TA가 너무 욕심 피우는건 아닌가 싶기도 하다.

어차피 학부 때부터 선대 공부를 안 한 비전공자에게 직장 생활을 하면서 선대 책을 이해해라고 하는게 말이 되나?

 

근데, 내가 저런 직원을 뽑을려고 할까, 저런 학생에게 추천서를 써 주려고 할까? 라고 생각해보면,

답 없는 이야기다.

 

최소한의 기준이 한국 사회의 현실과 너무 심하게 다른 거 아니냐는 비판을 자주 듣지만,

요즘 계량이 학부 때 전필이 아니라며? 그러니까 애들이 그렇게 통계 문맹으로 사는거 아냐?

라시던 23년 대학 선배님의 표현대로, 수십년 전의 문과도 알아야되는 내용을 이 시대의 이과 업무하는 직장인이 모르는건,

월급 받을 자격이 없다는 냉정한 현실로 돌아갈 수 밖에 없다.

같은 맥락에서, 그런 인력을 뽑고 쓰고 있는 회사에게 왜 그런 돈 낭비를 뽑았냐고 질책할 수 밖에 없다.

그러니까 내가 통계 문맹 + DNN 마니악들이 Data Scientist라고 우길 때마다 코웃음을 칠 수 밖에 없는거고.

암기식 학원 교육으로 TOEIC 900점 받았으니까 이제 영어 전문가라고 우기는거랑 뭐가 다를까?

 

내가 그렇게 싫어하는 통계 문맹 + DNN 마니악이 왜 우리나라에 이렇게 많냐고?

학부 수학 교육이 제대로 안 되었기 때문이라는 결론을 얻었다. TOEIC 900점이 별 거 아니라는걸 이해조차도 못하는거지.

(좀 더 정확하게는 그래도 상관없이 돌아가는 직장들이 너무 많은 2류 국가라서 그렇겠지만…)

최소한 잘 하진 못해도 “이야기”라도 할 수 있는 레벨도 안 되니까…

Similar Posts