문과 데이터 사이언스 학과?

1
pabii research

데이터 사이언스랑 경제학이랑 무슨 관련이 있나요?” 라는 글이 어딘가에 링크가 걸렸는지 많은 트래픽이 몰려들던 날,

어떤 키워드로 몰려들어오고 있나 싶어서 추적을 해 봤더니,

문과 데이터 사이언스 학과

라는 이름으로 검색을 해서 들어온 traffic들이더라.

(웃겨서 퍼옴ㅋㅋ)

 

문과 데이터 사이언스 학과?

아마도 “코딩없이” 할 수 있다는 투의 기대치가 숨어있지 않았을까는 생각이 드는데,

이미 파비블로그를 장기간 읽은 분들은 알겠지만, 이게 문/이과로 나눠서 생각할 전공이 아니라,

Data Science라는 전공에 적합한 각종 지식 안에 수학적인 이해와 별 대단치 않은 코딩 작업이 들어가 있을 뿐이다.

 

일단 국내에서 자기네가 데이터 사이언스의 주인이라고 주장하지만 데이터 과학 베이스의 주인들일 뿐인 컴퓨터 공학과 출신들이,

데이터 “사이언스”라고 불리는 업무를 할 수 있는 역량이 전혀 갖춰져 있지 않다는 이야기를 여러차례 해 왔다.

 

그렇다고 “데이터” 어쩌고니까 통계학과가 적절한 훈련을 시켜주느냐하면,

이미 통계학 박사님들 여럿이 날 만나면서 했던 이야기를 그대로 옮기는 걸로 적절한 답변이 될 것 같다.

저희는 대표님 만드신 교육 내용처럼 안 배우거든요. 처음보는 내용도 많고… 따지고 들어가면 이해는 되는데, 이걸 뭐 이렇게 쓰나 싶은거 투성이라…

 

즉, 기존의 전공들 중에 그나마 가장 방법론 측면에서 가깝게 보일만한 두 전공들이 코끼리 다리와 코만 잡는 상황이라는 것이다.

말을 바꾸면, 이건 독립 전공이니까 독립 전공에 맞춘 독립 커리큘럼이 나와야 한다.

 

그 독립 전공이 문과에 속하냐, 이과에 속하냐는 질문도 종종 받는데,

아마 영역 구분이 목적이 아니라, 수학 공부를 해야되느냐, 안 해도 되느냐는 질문이었을듯?

 

고교 시절부터 수학 II, 물리/화학/생물/지구과학 II 과목들을 다 풀어보던 문과 출신이어서 그런지는 모르겠지만,

문/이과 구분하는데 어린 시절부터 별로 거리감을 느낀 적도 없었고,

Data Science라는 주제로 배울만한 여러 과목들이 굳이 문과/이과를 나눠야 할 필요가 있는지 모르겠다.

그냥 여러 전공 지식들이 조금씩 조금씩 다 필요한데?

결국 수학 해야 된다는 이야기로 들릴려나?ㅋ

(데이터 사이언티스트의 필수 덕목이다. 팔방미인…)

 

관련 전공? 주인없는 전공?

여기에 발을 걸치는 전공들 리스트를 뽑고 속사정을 하나씩 짚어보면,

1. 컴퓨터 공학과

우리나라 사람들이 컴공이 Data Science에 가장 적합한 전공이라고 착각하는 이유가, 여기도 저기도 코딩을 한다는, 눈에 보이는 부분이 똑같으니까 그렇게 생각할텐데, 사실 코딩은 공고 전산과에서부터 하는거 아닌가?

굳이 따지고들면 컴퓨터 공학과에서 배울만한 내용 중에 대학원에서 자연어 처리, 이미지 인식을 하는 부분 일부만 Data Science라는 주제와 직접 관련이 있을 것 같은데, 그 두 주제의 모델링 레벨의 지식은 전부 다 수학 기반이다.

근데 다루는 주제는 각각 어문계열과 디자인 전공자들이 더 전문성이 있는 주제 아닌가?

디자인에서 필터 공부하는 분들은 선형대수를 엄청나게 잘 하시던데?

그 외 컴공과의 자료구조론 같은 걸 배우긴 해야겠지만, 개발자와 대화하는 용도로 필요한거지, 직접 쓸 지식은 아니니까.

2. 통계학과

우리나라 기준으로, 국립대들 대부분은 통계학과가 자연대에 있고, 사립대들 대부분은 응용통계학과라는 이름으로 상경계열 산하에 있다. 배우는 내용들도 거의 비슷비슷하고, 결국에는 하나로 합쳐진다. 몇몇 세부 전공 주제만 다를 뿐. 심지어 경제학 박사들 중에 계량경제학 많이 하신 분들은 통계학과 교수하는 경우도 있다. 윤석열 대통령 부친도 경제학자인데 연세대 응용통계학과 교수로 재직하셨다.

문/이과 경계가 애매모호하기까지한 통계학과도 위에 통계학 박사들의 평가를 보면 알겠지만, 그렇게 Data Science라고 불리는 전공에 딱 맞는 교육을 제공하지는 않았었다. 통계학 다 가르치기도 힘드실텐데, 다른 부분까지 가르치려면 얼마나 힘들까.

당장 Dynamic optimization 기반의 Reinforcement Learning이나 Instrumental variable을 이용해 Estimation theory 하시는 분들이 여러 개의 contending scenario들을 Hausman test하는걸 본 적도 없을 것이다. 이런 지식들을 엮어 놓은게 Data Science의 Experience Replay라고 하는 모델, 그런 모델들을 좀 더 최적화하기 위한 고민이라고 하면 왜 통계학과마저도 Data Science에 1:1로 매칭되는 전공이 아니라는지 공감이 되지 않을까?

3. 계산과학 & 사회과학

그 외에 서울대 계산과학 연계전공에 속해 있는 다양한 세부전공들에서 조금씩 빌려쓰는 계산방법론들이 반드시 이과 출신에게만 열려있냐고 물으면, 경제학과를 필두로 해서, 요즘은 정치학과, 사회학과도 통계 모델을 이용하는 레벨이 엄청나게 업그레이드 되었다.

지난 몇 번의 선거가 부정선거라고 열심히 떠드시는 분들이 미국 미시간 대학의 월터 미베인 교수 (정치학과)의 표현을 갖고 오면서 갑론을박을 하는 부분에 대한 판단을 요청받은 적이 있는데, 그 정치학자 분이 만드신 모델이, 최소한 수학적으로는 절대로 어지간한 통계학자들에게 무시당할 수준이 아니었다. 나같은 사람이 수준으로 평가할 그런 모델이 아니었다.

요즘 사회대 저학년의 정치학 방법론, 사회학 방법론 같은 수업들이, 예전처럼 SPSS 한번 돌려보고 끝나는 수업이 아니라, 경제학과에서 쟤네 언제부터 계량 배우냐는 말이 나올만큼 수학 난이도(?)가 높아진 상태다.

그 외 경제학이나 Finance 같은 학문에서, 혹은 문헌정보학 같은, 한국에서 이름 때문에 오해받는 학문들에서 Data Science 방법론을 적극적으로 쓰고 있는 부분은 오래전부터 이야길 했으니 Pass한다.

4. 언어학

위의 1번 주제에서 살짝 언급했지만, 이미 어문계열에서 앞서가시는 분들은 오래 전부터 자연어처리 모델을 만들고 있으셨고, 요즘들어 연구가 엄청나게 활발해졌다. 코드 잘 짜는 실력이 좀 부족하다는 이야기는 있지만, 그건 코딩 전문가들에게만 중요한 이야기고, 포인트는 언어학 전공자들에게 맞는 논리인지 여부 아닌가? 지난 몇 년 사이에 붐이 일어나면서 코드에만 의존한 논문들이 공대 쪽에서 한동안 나왔는데, 요즘 언어학 하시는 분들이 작업하시는 내용들 보면 역시 그 쪽도 공대가 오염시키는 부분에 불만 많은 분들이 굉장히 많은 것 같더라.

5. 디자인

역시 위에서 언급한대로, 디자인 박사 전공자들 중에 필터 연구하는 분들은, 완전히 다른 종류의 선형대수학을 쓰고 있더라. 한국에서 시각디자인 이미지만 보던 분들, 디자인은 문과보다 공부량이 적은 “예체능계”라는 편견에서 못 벗어나는 분들에게는 충격이겠지만, 몇몇 디자인 세부전공자들은 수학 실력으로만 보면 위의 다른 학문 전공자들이 함부로 대할 수 없는 실력자들이라는걸 이미 여러 차례 본 적이 있다. (아쉽게도 한국에서는 아직 한번도 못 봤다.)

 

저 위에 언급하지 않은 수 많은 전공들이 이미 오래전부터 요즘 들어서 Data Science라고 불리는 학문을 자기네 전공에서 써 왔었다.

제대로 된 학교가면 대학원이 엄청나게 어렵고 힘들다는 표현들을 많이 들었을텐데,

알려져 있는 Data Science라는 지식이, 쉽게 말해서 각 전공별로 대학원에서 배워쓰는 고급 통계학이라는 뜻이라고 보면 적절할듯하다.

 

즉, 단독 전공으로 주인이 따로 있는 전공이 아니다.

그러니 컴공 출신들이 코드 몇 줄로 자기네 소유라고 영역 표시하는게 불만인 타 전공 교수들이랑 총장실에서 치고받고 싸운다는 이야기가 나오는거겠지.

자기 물건을 뺏기고 기분 좋을 사람이 어딨나?

다양한 분야 전문가들과 공대 출신들이 협업한다는 관점으로 일이 커졌으면

어이가 없어서 시작한 이 블로그를 비롯해서, 여타 전공들 교수님들이 이렇게까지 불만을 표현하진 않았을텐데,

아니 공대가 타 전공들의 방법론을 완전히 압도할 수 있는 방법론적 우위라도 점하고 있었으면 이렇게까지 다툼이 생기진 않았을텐데…

 

물론, 융합전공 형태로 잘 묶여있는 경우도 있으니 (예시 링크) 너무 일방적으로 매도할 필요는 없을 듯.

문/이과 둘 다 잘 해야 되는거 같은데?

이미 학부 시절부터 공대 출신 선배들이 경제학과 무시할 때마다 “너네가 그럴 수준이 안 되는데…”라는 생각을 할 수 있는 경험들이 너무 많았던 탓에,

(ex. 우리과 게임이론에서 C학점 받아갔던 공대 선배들 3명….)

자연대 건물에서 이런저런 수업들을 찾아 듣는게 일상인 학부 시절을 보냈던 탓에,

아니 그 전에 고교 시절부터 문/이과 구분을 하면서 공부를 했던 적이 별로 없던 탓에,

굳이 위의 각 학문별로 내가 겪어본 속사정(?)의 일부를 언급하지 않더라도,

문/이과를 나눠서 데이터 사이언스라는 학문을 바라 볼 필요가 있는지 모르겠다.

 

굳이 따지자면, 학부 수준 or 석사 수준의 “Quantitative 전공”에서 배울만한 수학 지식 중 일부를,

문/이과 관계없이 각 학문별 특이한 스타일로 쓸 수 있도록 해 주는 학문이

Data Science라고 생각된다.

그런 방법론의 영역은 지금 한국인들이 인식하고 있는 이과 – 문과 – 예체능 계열 같은 구분과 별 관계가 없는 것 같다.

오히려, 어느 전공 출신이건 깊이에 대한 도전을 할 때, 데이터 활용법이라는 측면에서 누구나 배워야하는 학문이라고 보는 게 맞다고 생각한다.

 

이렇게 정리하고 보면, 문과 출신 입장에서는 수학 공부해야되니까 부담스러운 학문이 되고,

이과 출신 입장에서는 문과 무시했는데 뭔가 처음보는 생뚱맞은 방식으로 접근하는게 황당하겠지.

그 와중에 자동화의 신(神)에 대한 맹신을 갖고 있는 공돌이들은 어떻게든 문과 지식 없이도 다 해결할 수 있다고 굳게 믿고 있을 것이고.

그런 착각에 휩쓸려 몇 십조원의 국민 세금을 길바닥에 버린 건 뭐…

 

결론 – 결합전공 or 대학원에서 배워야하는 전공

개인적인 결론은, 대학원에서, 자기 학문 공부가 어느 정도 된 시점에, 도구 습득이라는 관점에서 배워야하는 전공이 Data Science다.

우리 MBA AI/BigData가 그리는 그림이다.

 

그러나, 시장 수요를 봤을 때, 대학원에서만 소화하면 인력이 너무 부족할 것 같다.

우리나라 교육 수준을 봤을 때, 학부 고학년 내용을 제대로 이해하고 졸업하는 학부생들도 거의 없는 판국이니까.

결국, 학부 레벨에서 이 전공이 하나쯤 나와야 한다.

 

같은 관점에서 아마도 서울대의 계산과학 연계전공이 나왔지 않을까 싶다.

대학원이 처음 시작하고, 필요성을 느끼면서 학부로도 내려왔겠지.

 

다만, 학부에 독립전공으로 존재할 가치가 있는가에 대해서는, 솔직히 아직도 잘 모르겠다.

각 학문별 지식이 없이, 단순히 데이터 모델링만으로 해결된다는건 내가 그간 강하게 비판했던 자동화 마니악 공돌이들의 생각이니까.

예를 들면, 경제학 훈련도 0인 공돌이가 이자율 상승시 부동산 가격 폭을 “인공지능”으로 정확하게 예측할 수 있다고 그러면,

기계에서 나오는 데이터만 보던 공돌이에게는 “최신 모델”처럼 보이겠지만, 노이즈 잔뜩 있는 데이터로 모델 만들던 사람들에겐 “사기꾼”으로 보이거든.

 

결국, 지금 우리 SIAI에서 운영하는 것처럼, 학부 고학년 & 석사 정도 수준의 커리큘럼이 딱 적절한 프로그램이 아닐까 싶다.

굳이 학부 저학년을 더 붙인다면 기초 수학, 통계학, 그 외 다양한 학문의 기초 수업들을 넣는 수 밖에 없고,

그러다보면 정말 “잡학”이 될 가능성이 높다. 그것보단 자기 전공 지식이 있는 상태에서 못 배운 방법론을 배운다는 관점으로 가야지.

박사 과정을 넣는다면 굉장히 다양한 연구 주제들을 커버하는 교수님들이 모인 연계전공이 나와야 하는데,

그런 우수 연구인력들 월급과 연구비 다 맞춰 줄려면 연간 운영비가 얼마나 될까 ㄷㄷㄷ

 

몇 년이 더 지나면서 경험치가 쌓이고나면 생각이 바뀔지는 모르겠지만,

지금까지의 경험이나 여러 현실적인 사정을 봤을 때, 현재 우리 SIAI의 운영 방식이 가장 적절한 형태의 Data Science 교육인 것 같다.

순수 학문적으로만 볼 때 더 적절한 형태는 독립 전공이 아닌 형태로, 여러 전공의 전문가들이 모여서 각자 영역에서 쓰는 지식을 공유하는,

서울대의 계산과학 연계전공 방식인 것 같긴한데, 그렇게 다양한 전공에서 탈한국 급 실력파 교수님들을

서울대 아닌 다른 기관에서 모을 수 있는 곳이 그렇게 많진 않을 것 같다.

국내 대기업 연구소 가보면 정말 예의를 차리기 힘들만큼 자만+무능 결합된 사람들이 연구원들이라고 목에 힘주고 있던데…

 

우리 회사가 계속 커지다보면, 지금 만든 학교가 언젠가 저런 조직이 될 것 같긴하다.

회사 운영 때문에 온라인 광고 시장 파고, 금융시장 파고, 여론조사 파고, 한국어 기반 자연어 파고… 그러다보면 여러전공으로 확장되겠지.

서울대 계산과학 연계전공이랑 다른 점은 “문과” 라고 불리는 전공들 위주로 관련 연구가 더 확장되는거긴 하겠지만…

학교라는게 이렇게 커지는거였구나…

Similar Posts